依存関係

問題を報告 ソースを表示

ビルド時または実行時に AB を必要とする場合、ターゲット A はターゲット B に依存します。この関係は、ターゲットに対して有向非巡回グラフ(DAG)を誘導する関係であり、依存関係グラフと呼ばれます。

ターゲットの直接依存関係とは、依存関係グラフの長さ 1 のパスで到達可能な他のターゲットです。ターゲットの推移的依存関係とは、グラフ内の任意の長さのパスを介して依存するターゲットです。

実際、ビルドのコンテキストでは、実際の依存関係のグラフと宣言された依存関係のグラフの 2 つの依存関係グラフがあります。ほとんどの場合、2 つのグラフは類似しているため、この区別を行う必要はありませんが、以下の説明では有用です。

実際の依存関係と宣言された依存関係

X を正しくビルドするために Y が存在し、ビルドされ、最新である必要がある場合、ターゲット X は実際にはターゲット Y に依存しています。ビルドとは、生成、処理、コンパイル、リンク、アーカイブ、圧縮、実行など、ビルド中に定期的に発生するタスクを指します。

X のパッケージに X から Y への依存関係エッジがある場合、ターゲット X はターゲット Y に対する依存関係が宣言されています。

正しいビルドでは、実際の依存関係 A のグラフが、宣言された依存関係 D のグラフのサブグラフになっている必要があります。つまり、A で直接接続されるノード x --> y のペアはすべて、D で直接接続される必要があります。DA過近似と言えます。

BUILD ファイル ライターは、ビルドシステムに対する各ルールの実際の直接的な依存関係をすべて明示的に宣言する必要があります。

この原則に従わないと、未定義の動作が発生します。ビルドは失敗する可能性がありますが、さらに悪いことに、ビルドが以前のオペレーションや、ターゲットに存在する推移的に宣言された依存関係に依存する可能性があります。Bazel は、欠落している依存関係をチェックし、エラーを報告しますが、このチェックをすべて完了できるとは限りません。

実行時に A で必要であっても、間接的にインポートされたすべてを一覧表示しようとしないでください。また、そうしないでください。

ターゲット X のビルド中に、ビルドツールは X の依存関係の推移的クロージャ全体を検査し、それらのターゲットの変更が最終結果に反映されていることを確認します。また、必要に応じて中間を再ビルドします。

依存関係の推移的な性質は、よくある間違いにつながります。あるファイル内のコードでは、間接的な依存関係によって提供されるコードが使用される場合があります。間接的な依存関係(宣言された依存関係グラフにおける推移的でありながら直接的なエッジではありません)間接的な依存関係は BUILD ファイルに表示されません。ルールはプロバイダに直接依存していないため、次のタイムライン例に示すように、変更を追跡する方法はありません。

1. 宣言された依存関係が実際の依存関係と一致する

最初はすべてうまくいきますパッケージ a 内のコードは、パッケージ b 内のコードを使用しています。パッケージ b 内のコードはパッケージ c 内のコードを使用するため、ac に推移的に依存します。

a/BUILD b/BUILD
rule(
    name = "a",
    srcs = "a.in",
    deps = "//b:b",
)
      
rule(
    name = "b",
    srcs = "b.in",
    deps = "//c:c",
)
      
a / a.in b / b.in
import b;
b.foo();
    
import c;
function foo() {
  c.bar();
}
      
a、b、c を矢印で結んだ宣言された依存関係グラフ
宣言された依存関係グラフ
a、b、c を結ぶ矢印が付いた、宣言された依存関係グラフと一致する実際の依存関係グラフ
実際の依存関係グラフ

宣言された依存関係が実際の依存関係を過大評価している。順調です。

2. 宣言されていない依存関係の追加

c への直接的な依存関係を作成するコードが a に追加され、ビルドファイル a/BUILD で宣言を忘れると、潜在的な危険が発生します。

a / a.in  
        import b;
        import c;
        b.foo();
        c.garply();
      
 
a、b、c を矢印で結んだ宣言された依存関係グラフ
宣言された依存関係グラフ
a、b、c を矢印で結んだ実際の依存関係グラフ。今度は矢印が A と C を接続しています。これは、宣言された依存関係グラフと一致しません
実際の依存関係グラフ

宣言された依存関係が、実際の依存関係を過大近似することがなくなりました。2 つのグラフの推移的クロージャは等しいため、問題を回避できます。しかし、a には c に対する実際の依存関係があり、宣言されていない依存関係があります。

3. 宣言された依存関係グラフと実際の依存関係グラフの相違

この危険性は、誰かが b をリファクタリングして c に依存しなくなり、誤って自身の過失で a が壊れたときに明らかになります。

  b/BUILD
 
rule(
    name = "b",
    srcs = "b.in",
    deps = "//d:d",
)
      
  b / b.in
 
      import d;
      function foo() {
        d.baz();
      }
      
a と b を矢印でつないで宣言された依存関係グラフ
                  b は c に接続されなくなり、a と c の接続が切断されます。
宣言された依存関係グラフ
b と c に接続しているが、b は c に接続していない実際の依存関係グラフ
実際の依存関係グラフ

宣言された依存関係グラフは、推移的に閉じた場合でも実際の依存関係の過小近似になります。ビルドが失敗する可能性があります。

この問題は、手順 2 で導入された a から c への実際の依存関係が BUILD ファイルで適切に宣言されていることを確認することで回避できました。

依存関係のタイプ

ほとんどのビルドルールには、さまざまな種類の汎用依存関係を指定するための 3 つの属性(srcsdepsdata)があります。これらについて説明します。詳細については、すべてのルールに共通する属性をご覧ください。

多くのルールには、compilerresources など、ルール固有の依存関係を表す追加の属性もあります。これらの詳細については、Build Encyclopedia をご覧ください。

srcs の依存関係

ソースファイルを出力するルールまたはルールによって直接使用されるファイル。

deps の依存関係

ヘッダー ファイル、シンボル、ライブラリ、データなどを提供する、個別にコンパイルされたモジュールを指すルール。

data の依存関係

ビルド ターゲットを正常に実行するには、いくつかのデータファイルが必要になる場合があります。これらのデータファイルはソースコードではありません。ターゲットのビルド方法には影響しません。たとえば、単体テストで関数の出力とファイルの内容を比較する場合があります。単体テストをビルドするときにはこのファイルは必要ありませんが、テストの実行時に必要です。実行中に起動するツールについても同様です。

ビルドシステムは、data としてリストされているファイルのみを使用できる隔離されたディレクトリでテストを実行します。したがって、バイナリ、ライブラリ、テストを実行するためにファイルが必要な場合は、data でそれらのファイル(またはそれらを含むビルドルール)を指定します。次に例を示します。

# I need a config file from a directory named env:
java_binary(
    name = "setenv",
    ...
    data = [":env/default_env.txt"],
)

# I need test data from another directory
sh_test(
    name = "regtest",
    srcs = ["regtest.sh"],
    data = [
        "//data:file1.txt",
        "//data:file2.txt",
        ...
    ],
)

これらのファイルは、相対パス path/to/data/file で参照できます。テストでは、テストのソース ディレクトリのパスとワークスペースの相対パスを結合して、これらのファイルを参照できます(例: ${TEST_SRCDIR}/workspace/path/to/data/file)。

ラベルを使用したディレクトリの参照

BUILD ファイルを見ると、一部の data ラベルがディレクトリを参照していることがわかります。これらのラベルは、次の例のように /. または / で終わるため、使用できません。

非推奨 - data = ["//data/regression:unittest/."]

非推奨 - data = ["testdata/."]

非推奨 - data = ["testdata/"]

これは、テストでディレクトリ内のすべてのデータファイルを使用できるため、特にテストの場合に便利です。

しかし、これはやめておきましょう。変更後に適切な増分再ビルド(およびテストの再実行)を確実に行うには、ビルドシステムが、ビルド(またはテスト)への入力であるファイルの完全なセットを認識している必要があります。ディレクトリを指定すると、ファイルの追加や削除によりディレクトリ自体が変更された場合にのみ再ビルドが実行されますが、個々のファイルに対する編集は、それを含むディレクトリには影響しないため、個々のファイルの編集は検出できません。ビルドシステムへの入力としてディレクトリを指定するのではなく、明示的に、または glob() 関数を使用して、ディレクトリ内に含まれるファイルのセットを列挙する必要があります。(** を使用して glob() を再帰的に強制します)。

推奨 - data = glob(["testdata/**"])

残念ながら、シナリオによってはディレクトリ ラベルを使用しなければなりません。たとえば、testdata ディレクトリ内に、名前がラベル構文に準拠していないファイルが含まれている場合、ファイルを明示的に列挙するか、glob() 関数を使用すると、無効なラベルエラーが発生します。この場合はディレクトリ ラベルを使用する必要がありますが、前述の誤った再ビルドに伴うリスクに注意してください。

ディレクトリ ラベルを使用する必要がある場合は、相対 ../ パスで親パッケージを参照できないことに注意してください。代わりに、//data/regression:unittest/. などの絶対パスを使用します。

複数のファイルを使用する必要があるテストなどの外部ルールは、それらすべてへの依存関係を明示的に宣言する必要があります。filegroup() を使用すると、BUILD ファイル内の複数のファイルをグループ化できます。

filegroup(
        name = 'my_data',
        srcs = glob(['my_unittest_data/*'])
)

これにより、テストでデータの依存関係としてラベル my_data を参照できます。

BUILD ファイル 公開設定