分散ビルド

<ph type="x-smartling-placeholder"></ph> 問題を報告するソースを表示夜間 · 7.3 · 7.2 · 7.1 · 7.0 · 6.5

コードベースが大きい場合、依存関係のチェーンが非常に深くなる可能性があります。単純なバイナリでさえ、数万ものビルドターゲットに依存することが少なくありません。ちなみに妥当な量で構築を完了することは不可能です。時間のかかるプロセスです。ビルドシステムは、基盤となるインフラストラクチャをマシンのハードウェアに課せられる物理法則です。そのための唯一の方法は分散ビルドをサポートするビルドシステムを使用すると、システムが実行している作業を、任意のスケーラブルなあります。システムの処理をある程度の小さなサイズに分割したと仮定すると、これにより、任意のビルドを完了できます（詳細は後ほど説明します）。お支払い可能な範囲で迅速に行えますこのスケーラビリティは開発に取り組んできたのが、アーティファクトベースのビルドシステムです。

リモートキャッシュ

最もシンプルな分散ビルドは、リモートビルドのみを使用するキャッシュ を使用します。

図 1. リモートキャッシュを示す分散ビルド

ビルドを実行するすべてのシステム（デベロッパーワークステーションと継続的インテグレーションシステムにより、共通のリモートキャッシュへの参照を共有あります。このサービスは、高速かつローカルな短期ストレージシステムになります。 Google Cloud Storage などのクラウドサービスで、ユーザーが必要に応じて直接または依存関係としてアーティファクトをビルドする場合、リモートキャッシュに移動して、そのアーティファクトがすでに存在するかどうかを確認します。もしそうならば、それはアーティファクトをビルドせずにダウンロードできます。そうでない場合、システムは結果をキャッシュにアップロードします。つまり頻繁に変更されない低レベルの依存関係は、一度ビルドして共有できます。ユーザーごとに構築でき、ユーザーごとに再構築する必要がありません。Google では、ゼロから構築するのではなく、キャッシュから提供されるため、ビルドシステムの実行にかかる費用を削減できます

リモートキャッシュシステムが機能するには、ビルドシステムが、完全に再現可能です。つまり、どのビルドターゲットでも、そのターゲットへの入力のセットを決定し、同じ入力セットがどのマシンでもまったく同じ出力が生成されますこれが唯一のアーティファクトのダウンロードの結果が結果と同じであることを確認する考えてみましょうキャッシュ内の各アーティファクトは、ターゲットとその入力のハッシュの両方をキーとしているので、エンジニアが同じターゲットに対して異なる変更を同時に加えることができたリモートキャッシュにすべてのアーティファクトが保存され、適切に構成する必要があります。

もちろんリモートキャッシュを活用するにはアーティファクトの構築よりも高速である必要があります。そうとは限りませんキャッシュサーバーとビルドを実行するマシンが離れている場合は特にそうですGoogle のビルドをすばやく共有できるように、ネットワークとビルドシステムは表示されます。

リモート実行

リモートキャッシュは真の分散ビルドではありません。キャッシュが失われた場合やすべての再構築が必要な低レベルの変更を行う場合も、ビルド全体をローカルのマシン上で実行できます。本当の目的はリモート実行では、ビルドを行う実際の作業が分散され、スケーリングできます図 2 は、リモート実行システムを示しています。

図 2. リモート実行システム

各ユーザーのマシンで実行されるビルドツール（ユーザーは人間かエンジニアや自動ビルドシステムなど）は、リクエストを中央のビルドマスターに送信します。ビルドマスターはリクエストをコンポーネントアクションとスケジュールに分割するスケーラブルなワーカープールでこれらのアクションを実行できます各ワーカーユーザーが指定した入力で要求されるアクションを実行し、結果のアーティファクトを書き出します。これらのアーティファクトは、必要とするアクションをマシンで実行し、それを最終出力がユーザーに送信されます

このようなシステムの実装で最も厄介なのは、通信の管理とワーカー、マスター、ユーザーのローカルマシン間の接続トラフィックを保護しますワーカーは他のワーカーによって生成された中間アーティファクトと、ユーザーのローカルマシンに送り返す必要があります。これを行うには、Google Cloud の前述の分散キャッシュの一番上にワーカーがその依存関係をキャッシュから読み取りますマスターブロック依存するすべてのタスクが完了するまでキャッシュから入力を読み取ることができます。最終的な成果物は、キャッシュに保存し、ローカルマシンにダウンロードできるようにします。なお、ユーザーのソースツリーのローカルの変更をエクスポートし、ワーカーはビルド前に変更を適用できます

そのためには、ここで説明したアーティファクトベースのビルドシステムのすべての部分が、統合する必要がありますビルド環境は完全に自己記述型であるため、人間の介入なしにワーカーをスピンアップできます。ビルド完全に自己完結型でなければなりません。これは、各ステップが別のマシンで実行することもできます出力は完全に確定的である必要があるため、各ワーカーは他のワーカーから受け取った結果を信頼できますそのようなタスクベースのシステムでは、このような保証を提供することは信頼できるリモート実行システムをほぼ不可能に 1 です。

Google での分散ビルド

2008 年以来、Google は分散ビルドシステムを使用して、リモートキャッシュとリモート実行を示しています（図 3 を参照）。

図 3. Google の分散ビルドシステム

Google のリモートキャッシュは ObjFS と呼ばれます。コンテナは、アプリケーション、本番環境のフリート全体で分散された Bigtable で出力を構築する objfsd という名前のフロントエンド FUSE デーモンと、各デベロッパーのあります。FUSE デーモンを使用すると、エンジニアはビルド出力をまるでワークステーション上に保存された通常のファイルでしたが、ファイルの内容はそのままでした。ネットワークから直接リクエストされた少数のファイルについてのみ、できます。ファイルのコンテンツをオンデマンドで提供することで、ネットワークとディスクの両方を大幅に削減また、データを保存したときよりも 2 倍の速さでシステムを構築できます。デベロッパーのローカルディスクにあるすべてのビルド出力。

Google のリモート実行システムは Forge と呼ばれています。Blaze の Forge クライアント（Bazel の内部で同等のもの）が呼び出されディストリビューターは、各アクションのリクエストをデータセンターとほぼ同じです。スケジューラはアクションのキャッシュを維持これにより、アクションがすでに完了している場合はすぐにレスポンスが返されます。システムの他のユーザーが作成したファイルです。そうでない場合は、アクションを作成します。エグゼキュータジョブの大規模なプールが、このキューから継続的にアクションを読み取ります。 ObjFS Bigtable に直接保存できますこれらのエグゼキュータで結果をダウンロードし、今後のアクションに利用できるエンドユーザーが objfsd を通じて提供します。

最終的に、あらゆるビルドを効率的にサポートするようにスケーリングできるシステムが完成します。実践した例ですGoogle のビルドの規模は実に巨大です。Google 何百万ものビルドを実行して数百万のテストケースを実行し 1 日あたり数十億行のソースコードからビルド出力が取得されています。Google は、このようなシステムにより、エンジニアは複雑なコードベースを迅速に構築できます。また、膨大な数の自動ツールやシステムを実装するために構築できます。

分散ビルド

リモート キャッシュ

リモート実行

Google での分散ビルド

リモートキャッシュ