Trích xuất các chỉ số hiệu suất bản dựng

Báo cáo vấn đề Xem nguồn Nightly · 8.0 7.4 . 7.3 · 7.2 · 7.1 · 7.0 · 6.5

Có lẽ mọi người dùng Bazel đều đã trải nghiệm các bản dựng chậm hoặc chậm hơn dự kiến. Việc cải thiện hiệu suất của từng bản dựng có giá trị đặc biệt đối với các mục tiêu có tác động đáng kể, chẳng hạn như:

  1. Các mục tiêu cốt lõi của nhà phát triển thường xuyên được lặp lại và (tái) tạo.

  2. Các thư viện phổ biến được các mục tiêu khác phụ thuộc rộng rãi.

  3. Một mục tiêu đại diện từ một lớp mục tiêu (ví dụ: quy tắc tuỳ chỉnh), chẩn đoán và khắc phục vấn đề trong một bản dựng có thể giúp giải quyết vấn đề ở quy mô lớn hơn.

Một bước quan trọng để cải thiện hiệu suất của bản dựng là hiểu rõ nơi sử dụng tài nguyên. Trang này liệt kê các chỉ số mà bạn có thể thu thập. Bài viết Phân tích hiệu suất bản dựng cho thấy cách bạn có thể sử dụng các chỉ số này để phát hiện và khắc phục các vấn đề về hiệu suất bản dựng.

Có một số cách chính để trích xuất chỉ số từ các bản dựng Bazel, cụ thể là:

Giao thức sự kiện bản dựng (BEP)

Bazel xuất ra nhiều vùng đệm giao thức build_event_stream.proto thông qua Giao thức sự kiện bản dựng (BEP). Các vùng đệm này có thể được tổng hợp bằng một phần phụ trợ do bạn chỉ định. Tuỳ thuộc vào trường hợp sử dụng, bạn có thể quyết định tổng hợp các chỉ số theo nhiều cách, nhưng ở đây chúng ta sẽ xem xét một số khái niệm và trường proto hữu ích nói chung.

Các lệnh truy vấn / cquery / aquery của Bazel

Bazel cung cấp 3 chế độ truy vấn khác nhau (truy vấn, cqueryaquery) cho phép người dùng truy vấn biểu đồ mục tiêu, biểu đồ mục tiêu đã định cấu hình và biểu đồ hành động tương ứng. Ngôn ngữ truy vấn cung cấp một bộ hàm có thể sử dụng trên nhiều chế độ truy vấn, cho phép bạn tuỳ chỉnh truy vấn theo nhu cầu của mình.

Hồ sơ theo dõi JSON

Đối với mỗi lệnh gọi Bazel giống như bản dựng, Bazel sẽ ghi một hồ sơ theo dõi ở định dạng JSON. Hồ sơ theo dõi JSON có thể rất hữu ích để nhanh chóng hiểu được những gì Bazel đã dành thời gian trong quá trình gọi.

Nhật ký thực thi

Nhật ký thực thi có thể giúp bạn khắc phục sự cố và khắc phục tình trạng thiếu lượt truy cập vào bộ nhớ đệm từ xa do sự khác biệt về máy và môi trường hoặc các hành động không xác định. Nếu bạn truyền cờ --experimental_execution_log_spawn_metrics (có trong Bazel 5.2), cờ này cũng sẽ chứa các chỉ số chi tiết về việc tạo, cả đối với các hành động được thực thi cục bộ và từ xa. Bạn có thể sử dụng các chỉ số này để so sánh hiệu suất của máy cục bộ và từ xa, hoặc để tìm hiểu phần nào của quá trình thực thi tạo bản sao luôn chậm hơn dự kiến (ví dụ: do xếp hàng).

Nhật ký biểu đồ thực thi

Mặc dù hồ sơ theo dõi JSON chứa thông tin về đường dẫn quan trọng, nhưng đôi khi bạn cần thêm thông tin về biểu đồ phần phụ thuộc của các hành động đã thực thi. Kể từ Bazel 6.0, bạn có thể truyền cờ --experimental_execution_graph_log--experimental_execution_graph_log_dep_type=all để ghi nhật ký về các hành động đã thực thi và các phần phụ thuộc lẫn nhau của các hành động đó.

Bạn có thể dùng thông tin này để hiểu được lực kéo do một nút trên đường dẫn quan trọng thêm vào. Thời gian kéo là khoảng thời gian có thể tiết kiệm được bằng cách xoá một nút cụ thể khỏi biểu đồ thực thi.

Dữ liệu này giúp bạn dự đoán tác động của các thay đổi đối với bản dựng và biểu đồ hành động trước khi thực sự thực hiện các thay đổi đó.

Đo điểm chuẩn bằng bazel-bench

Bazel bench là một công cụ đo điểm chuẩn cho các dự án Git để đo điểm chuẩn hiệu suất bản dựng trong các trường hợp sau:

  • Điểm chuẩn dự án: Đo điểm chuẩn hai thay đổi git với nhau ở một phiên bản Bazel. Dùng để phát hiện các lỗi hồi quy trong bản dựng (thường thông qua việc thêm các phần phụ thuộc).

  • Điểm chuẩn Bazel: Đo điểm chuẩn hai phiên bản Bazel với nhau trong một lần xác nhận git. Dùng để phát hiện các trường hợp hồi quy trong chính Bazel (nếu bạn tình cờ duy trì / phát triển nhánh Bazel).

Điểm chuẩn theo dõi thời gian thực, thời gian CPU và thời gian hệ thống cũng như kích thước vùng nhớ khối xếp được giữ lại của Bazel.

Bạn cũng nên chạy Bazel bench trên các máy thực tế, chuyên dụng không chạy các quy trình khác để giảm nguồn biến thiên.