リモート実行のためのリモート キャッシュ ヒットのデバッグ

問題を報告する ソースを表示 Nightly · 8.0 . 7.4 . 7.3 · 7.2 · 7.1 · 7.0 · 6.5

このページでは、キャッシュヒット率を確認する方法と、リモート実行のコンテキストでキャッシュミスを調査する方法について説明します。

このページでは、リモート実行を正常に利用しているビルドまたはテストがあり、リモート キャッシュを効果的に利用していることを確認することを前提としています。

キャッシュ ヒット率を確認する

Bazel 実行の標準出力で、プロセスを一覧表示する INFO 行を探します。これは、おおまかに Bazel アクションに対応しています。この行には、アクションが実行された場所の詳細が示されます。リモートで実行されたアクションを示す remote ラベル、ローカル サンドボックスで実行されたアクションを示す linux-sandbox、その他の実行戦略を示すその他の値を探します。リモート キャッシュからの結果が返されたアクションは、remote cache hit と表示されます。

次に例を示します。

INFO: 11 processes: 6 remote cache hit, 3 internal, 2 remote.

この例では、リモート キャッシュ ヒットは 6 回あり、2 つのアクションはキャッシュ ヒットがなく、リモートで実行されました。3 つの内部部分は無視できます。通常は、シンボリック リンクの作成などの小さな内部アクションです。この概要にはローカル キャッシュ ヒットは含まれません。プロセスが 0 個(または想定よりも少ない数)の場合は、bazel clean の後にビルド/テスト コマンドを実行します。

キャッシュヒットのトラブルシューティング

想定どおりのキャッシュ ヒット率が得られない場合は、次の操作を行います。

同じビルド/テスト コマンドを再実行してもキャッシュ ヒットが発生することを確認する

  1. キャッシュに入力する予定のビルドやテストを実行します。特定のスタックで新しいビルドが初めて実行される場合、リモート キャッシュ ヒットは発生しません。リモート実行の一環として、アクションの結果はキャッシュに保存され、以降の実行で取得されます。

  2. bazel clean を実行します。このコマンドを実行すると、ローカル キャッシュが消去されます。これにより、ローカル キャッシュ ヒットによって結果がマスクされることなく、リモート キャッシュ ヒットを調査できます。

  3. 調査しているビルドとテストを(同じマシンで)再度実行します。

  4. INFO 行でキャッシュ ヒット率を確認します。remote cache hitinternal 以外のプロセスが表示されない場合、キャッシュは正しく入力され、アクセスされています。その場合は、次のセクションに進みます。

  5. 不一致の原因として考えられるのは、ビルド内の非気密性により、2 回の実行でアクションが異なるアクションキーを受け取ることです。これらのアクションを確認する手順は次のとおりです。

    a. 問題のビルドまたはテストを再度実行して、実行ログを取得します。

      bazel clean
      bazel --optional-flags build //your:target --execution_log_binary_file=/tmp/exec1.log

    b. 2 つの実行の実行ログを比較します。2 つのログファイルでアクションが同じであることを確認します。差異は、実行間で発生した変更に関する手がかりとなります。これらの不一致を解消するようにビルドを更新します。

    キャッシュの問題を解決し、繰り返し実行ですべてのキャッシュヒットが発生する場合は、次のセクションに進みます。

    アクション ID が同じなのにキャッシュ ヒットがない場合は、構成のどこかでキャッシュ保存が妨げられています。このセクションに進んで、一般的な問題を確認します。

    実行ログの差分を比較する必要がない場合は、代わりに人間が判読できる --execution_log_json_file フラグを使用できます。実行時間が含まれ、順序が保証されないため、安定した差分比較には使用できません。

  6. 実行ログ内のすべてのアクションで cacheable が true に設定されていることを確認します。特定のアクションの実行ログに cacheable が表示されない場合は、対応するルールの BUILD ファイルの定義に no-cache タグが含まれている可能性があります。実行ログの人間可読の progress_message フィールドを確認して、アクションの発生元を特定します。

  7. アクションが同じで cacheable なのにキャッシュヒットがない場合は、ビルドのキャッシュ検索を無効にする --noremote_accept_cached がコマンドラインに含まれている可能性があります。

    実際のコマンドラインを把握するのが難しい場合は、Build Event Protocol の正規のコマンドラインを使用します。

    a. ログのテキスト バージョンを取得するには、--build_event_text_file=/tmp/bep.txtを Bazel コマンドに追加します。

    b. ログのテキスト バージョンを開き、command_line_label: "canonical" を含む structured_command_line メッセージを検索します。展開すると、すべてのオプションが一覧表示されます。

    c. remote_accept_cached を検索して、false に設定されているかどうかを確認します。

    d. remote_accept_cachedfalse の場合は、コマンドラインまたは bazelrc ファイルのどちらで false に設定されているかを確認します。

マシン間でのキャッシュを確実に行う

同じマシンでキャッシュ ヒットが想定どおりに発生したら、別のマシンで同じビルドまたはテストを実行します。マシン間でキャッシュに保存されていないと思われる場合は、次の操作を行います。

  1. 既存のキャッシュにヒットしないように、ビルドに小さな変更を加えます。

  2. 最初のマシンでビルドを実行します。

     bazel clean
     bazel ... build ... --execution_log_binary_file=/tmp/exec1.log
  3. 2 番目のマシンでビルドを実行し、手順 1 の変更が含まれていることを確認します。

     bazel clean
     bazel ... build ... --execution_log_binary_file=/tmp/exec2.log
  4. 2 つの実行の実行ログを比較します。ログが同じでない場合は、ビルド構成に不一致がないか、ホスト環境のプロパティがどちらかのビルドに漏れていないかを確認します。

実行ログの比較

実行ログには、ビルド中に実行されたすべてのアクションの記録が含まれます。各アクションには、アクションキーのすべての情報が含まれる SpawnExec 要素があります。したがって、ログが同じであれば、アクション キャッシュキーも同じです。

期待どおりにキャッシュヒットを共有していない 2 つのビルドのログを比較するには、次の操作を行います。

  1. 各ビルドから実行ログを取得し、/tmp/exec1.log/tmp/exec2.log として保存します。

  2. 次のコマンドを使用して Bazel ソースコードをダウンロードし、Bazel フォルダに移動します。execlog パーサーで実行ログを解析するにはソースコードが必要です。

    git clone https://github.com/bazelbuild/bazel.git
    cd bazel
    
  3. 実行ログ パーサーを使用して、ログをテキストに変換します。次の呼び出しでは、比較を容易にするために、2 番目のログ内のアクションを 1 番目のログ内のアクション順序と一致するように並べ替えます。

    bazel build src/tools/execlog:parser
    bazel-bin/src/tools/execlog/parser \
      --log_path=/tmp/exec1.log \
      --log_path=/tmp/exec2.log \
      --output_path=/tmp/exec1.log.txt \
      --output_path=/tmp/exec2.log.txt
    
  4. 任意のテキストを使用して、/tmp/exec1.log.txt/tmp/exec2.log.txt を比較します。