對遠端執行作業進行遠端快取命中偵錯

回報問題 查看原始碼 Nightly · 7.4 . 7.3 · 7.2 · 7.1 · 7.0 · 6.5

本頁說明如何檢查快取命中率,以及如何在遠端執行的情況下調查快取遺漏情形。

本頁面假設您有成功使用遠端執行功能的建構作業和/或測試,且您想確保有效使用遠端快取。

檢查快取命中率

在 Bazel 執行作業的標準輸出結果中,查看用於列出程序的 INFO 列,這些大致對應於 Bazel 動作。執行動作的那一行詳細資料。請找出 remote 標籤,表示遠端執行的動作;linux-sandbox 表示在本機沙箱中執行的動作;其他值則表示其他執行策略。結果來自遠端快取的動作會顯示為 remote cache hit

例如:

INFO: 11 processes: 6 remote cache hit, 3 internal, 2 remote.

在這個範例中,有 6 個遠端快取命中,且 2 個動作沒有快取命中,因此是遠端執行。可以忽略 3 個內部部分。通常是小型的內部動作 (例如建立符號連結)。本機快取命中不會納入這份摘要中。如果您收到 0 個程序 (或數字低於預期),請執行 bazel clean,接著執行建構/測試指令。

排解快取命中問題

如果快取未達到預期的快取命中率,請按照下列指示操作:

確認重新執行相同的建構/測試指令會產生快取命中

  1. 執行您要填入快取的建構作業和/或測試。第一次在特定堆疊上執行新建構作業時,您可以預期不會有任何遠端快取命中。做為遠端執行作業的一部分,動作結果會儲存在快取中,後續執行作業應會擷取這些結果。

  2. 執行 bazel clean。 此指令會清除本機快取,讓您在沒有本機快取資料的情況下,調查遠端快取命中結果。

  3. 再次執行您正在調查的建構和測試 (在同一部電腦上)。

  4. 查看 INFO 列的快取命中率。如果您只看到 remote cache hitinternal 以外的程序,表示快取已正確填入及存取。在這種情況下,請跳至下一節。

  5. 差異的可能來源是版本中非密封的部分,導致動作在兩次執行期間收到不同的動作金鑰。如要找出這些動作,請按照下列步驟操作:

    a. 重新執行有問題的建構或測試,取得執行記錄:

      bazel clean
      bazel --optional-flags build //your:target --execution_log_binary_file=/tmp/exec1.log

    b. 比較兩次執行作業的執行記錄。請確認兩個記錄檔中的動作相同。差異可提供執行期間發生變更的線索。請更新建構項目,以消除這些差異。

    如果您能夠解決快取問題,且現在重複執行作業會產生所有快取命中,請跳至下一節。

    如果動作 ID 相同,但沒有快取命中,則表示設定中的某些內容會阻止快取。請繼續閱讀本節,檢查常見問題。

    如果您不需要比較執行記錄,可以改用人類可讀的 --execution_log_json_file 旗標。由於這項方法包含執行時間,且不保證順序,因此無法用於穩定差異比較。

  6. 確認執行記錄中的所有動作都將 cacheable 設為 true。如果 cacheable 未出現在特定動作的執行記錄中,表示對應的規則在 BUILD 檔案的定義中可能有 no-cache 標記。在執行記錄中查看使用者可理解的 progress_message 欄位,協助判斷動作來源。

  7. 如果動作相同且 cacheable,但沒有快取命中,則指令列可能包含 --noremote_accept_cached,這會停用建構的快取查詢。

    如果無法判斷實際指令列,請使用 Build Event Protocol 中的標準指令列,如下所示:

    a. 將 --build_event_text_file=/tmp/bep.txt 加入 Bazel 指令,取得文字版本的記錄檔。

    b. 開啟文字版本的記錄檔,搜尋含有 command_line_label: "canonical"structured_command_line 訊息。展開後,系統會列出所有選項。

    c. 搜尋 remote_accept_cached,並檢查是否已設為 false

    d. 如果 remote_accept_cachedfalse,請判斷它設為 false 的位置:在指令列或 bazelrc 檔案中。

確保跨機器快取

在同一部機器上正常觸發快取後,請在其他機器上執行相同的建構作業/測試。如果您懷疑系統未在多台機器上進行快取,請採取下列做法:

  1. 對建構項目進行小幅修改,避免命中現有的快取。

  2. 在第一台電腦上執行建構作業:

     bazel clean
     bazel ... build ... --execution_log_binary_file=/tmp/exec1.log
  3. 在第二部機器上執行建構作業,確保包含步驟 1 中的修改內容:

     bazel clean
     bazel ... build ... --execution_log_binary_file=/tmp/exec2.log
  4. 為這兩項執行作業比較執行記錄。如果記錄不相同,請調查您的建構設定是否有差異,以及主機環境的屬性是否會流入任一建構。

比較執行記錄

執行記錄包含建構期間執行的所有動作記錄。每個動作都會有一個 SpawnExec 元素,當中包含動作金鑰的所有資訊,因此如果記錄相同,那麼動作快取金鑰就會是這樣。

如要比較兩個未如預期共用快取命中的版本的記錄,請執行下列操作:

  1. 從每個版本取得執行記錄,並儲存為 /tmp/exec1.log/tmp/exec2.log

  2. 下載 Bazel 原始碼,並使用以下指令前往 Bazel 資料夾。需要原始碼,才能使用 execlog 剖析器剖析執行記錄。

    git clone https://github.com/bazelbuild/bazel.git
    cd bazel
    
  3. 使用執行記錄剖析器將記錄檔轉換為文字。下列叫用作業也會將第二個記錄中的動作排序,以便與第一個記錄中的動作順序相符,方便進行比較。

    bazel build src/tools/execlog:parser
    bazel-bin/src/tools/execlog/parser \
      --log_path=/tmp/exec1.log \
      --log_path=/tmp/exec2.log \
      --output_path=/tmp/exec1.log.txt \
      --output_path=/tmp/exec2.log.txt
    
  4. 使用您最喜歡的文字與 /tmp/exec1.log.txt/tmp/exec2.log.txt 差異比較。