Çerçeve

Bazel'in paralel değerlendirme ve artım modeli.

Veri modeli

Veri modeli aşağıdaki öğelerden oluşur:

  • SkyValue. Düğümler olarak da adlandırılır. SkyValues, derleme sırasında oluşturulan tüm verileri ve derlemenin girişlerini içeren değişmez nesnelerdir. Örnekler: giriş dosyaları, çıkış dosyaları, hedefler ve yapılandırılmış hedefler.
  • SkyKey. Bir SkyValue öğesine referans vermek için kullanılan kısa ve değiştirilemez bir ad (ör. FILECONTENTS:/tmp/foo veya PACKAGE://foo).
  • SkyFunction. Anahtarlarına ve bağımlı düğümlere göre düğümler oluşturur.
  • Düğüm grafiği. Düğümler arasındaki bağımlılık ilişkisini içeren bir veri yapısı.
  • Skyframe. Bazel'in temel aldığı artımlı değerlendirme çerçevesinin kod adı.

Değerlendirme

Derleme, derleme isteğini temsil eden düğümün değerlendirilmesinden oluşur (bu, ulaşmaya çalıştığımız durumdur ancak bu süreçte çok fazla eski kod vardır). Önce SkyFunction bulunur ve üst düzey SkyKey anahtarıyla çağrılır. Ardından işlev, üst düzey düğümü değerlendirmek için değerlendirmesi gereken düğümlerin değerlendirilmesini ister. Bu da sırayla diğer işlev çağrılarına yol açar ve bu işlem, yaprak düğümlere (genellikle dosya sistemindeki giriş dosyalarını temsil eden düğümler) ulaşılana kadar devam eder. Son olarak, üst düzey SkyValue değeri, bazı yan etkiler (ör. dosya sistemindeki çıktı dosyaları) ve derlemeye dahil olan düğümler arasındaki bağımlılıkların yönlendirilmiş döngüsüz grafiği elde edilir.

Bir SkyFunction, görevini yerine getirmek için ihtiyaç duyduğu tüm düğümleri önceden belirleyemiyorsa birden fazla geçişte SkyKeys isteğinde bulunabilir. Basit bir örnek, sembolik bağlantı olduğu anlaşılan bir giriş dosyası düğümünü değerlendirmektir: İşlev dosyayı okumaya çalışır, sembolik bağlantı olduğunu fark eder ve böylece sembolik bağlantının hedefini temsil eden dosya sistemi düğümünü getirir. Ancak bu da bir sembolik bağlantı olabilir. Bu durumda orijinal işlevin de hedefini getirmesi gerekir.

İşlevler, kodda SkyFunction arayüzü ve SkyFunction.Environment adlı bir arayüz tarafından sağlanan hizmetlerle temsil edilir. İşlevlerin yapabileceği işlemler:

  • env.getValue numaralı telefonu arayarak başka bir düğümün değerlendirilmesini isteyin. Düğüm varsa değeri döndürülür, aksi takdirde null döndürülür ve işlevin kendisinin null döndürmesi beklenir. İkinci durumda, bağımlı düğüm değerlendirilir ve ardından orijinal düğüm oluşturucu tekrar çağrılır ancak bu kez aynı env.getValue çağrısı null olmayan bir değer döndürür.
  • env.getValues() işlevini çağırarak birden fazla başka düğümün değerlendirilmesini isteyin. Bu işlev, bağımlı düğümler paralel olarak değerlendirildiği için temelde aynı işlemi yapar.
  • Çağrıldığında hesaplama yapma
  • Dosya sistemine dosya yazma gibi yan etkileri olabilir. İki farklı işlevin birbirini engellememesine dikkat edilmelidir. Genel olarak, yazma yan etkileri (verilerin Bazel'den dışarıya aktığı yerler) sorunsuz çalışır. Okuma yan etkileri (verilerin kayıtlı bir bağımlılık olmadan Bazel'e aktığı yerler) ise kayıtlı olmayan bir bağımlılık oldukları ve bu nedenle yanlış artımlı derlemelere neden olabilecekleri için sorunlu çalışır.

SkyFunction uygulamaları, bağımlılıkları istemek dışında (ör. dosya sistemini doğrudan okuyarak) başka bir şekilde verilere erişmemelidir. Aksi takdirde Bazel, okunan dosyadaki veri bağımlılığını kaydetmez ve bu da yanlış artımlı derlemelere yol açar.

Bir işlev, görevini yerine getirmek için yeterli veriye sahip olduğunda tamamlandığını belirten bir null dışı değer döndürmelidir.

Bu değerlendirme stratejisinin çeşitli avantajları vardır:

  • Hermetiklik. İşlevler yalnızca diğer düğümlere bağlı olarak giriş verilerini isterse Bazel, giriş durumu aynı olduğunda aynı verilerin döndürülmesini garanti edebilir. Tüm gökyüzü işlevleri deterministikse bu, tüm derlemenin de deterministik olacağı anlamına gelir.
  • Artımlılığı düzeltin ve mükemmelleştirin. Tüm işlevlerin tüm giriş verileri kaydedilirse Bazel, giriş verileri değiştiğinde yalnızca geçersiz kılınması gereken tam düğüm kümesini geçersiz kılabilir.
  • Paralellik İşlevler yalnızca bağımlılık isteğinde bulunarak birbirleriyle etkileşime girebildiğinden, birbirine bağlı olmayan işlevler paralel olarak çalıştırılabilir ve Bazel, sonuçların sıralı olarak çalıştırılmış gibi olacağını garanti edebilir.

Artımlılık

İşlevler yalnızca diğer düğümlere bağlı olarak giriş verilerine erişebildiğinden Bazel, giriş dosyalarından çıkış dosyalarına kadar eksiksiz bir veri akışı grafiği oluşturabilir ve bu bilgileri yalnızca gerçekten yeniden oluşturulması gereken düğümleri (değiştirilen giriş dosyaları kümesinin ters geçişli kapanımı) yeniden oluşturmak için kullanabilir.

Özellikle iki olası artış stratejisi vardır: alttan yukarıya ve yukarıdan aşağıya. Hangisinin en iyi olduğu, bağımlılık grafiğinin görünümüne bağlıdır.

  • Aşağıdan yukarıya geçersiz kılma sırasında, bir grafik oluşturulduktan ve değiştirilen girişler kümesi bilindikten sonra, değiştirilen dosyalara geçişli olarak bağlı olan tüm düğümler geçersiz kılınır. Aynı üst düzey düğümün tekrar oluşturulacağını biliyorsak bu yöntem idealdir. Aşağıdan yukarıya geçersiz kılma işleminin, önceki derlemenin tüm giriş dosyalarında stat() komutunun çalıştırılmasını gerektirdiğini ve bu dosyaların değiştirilip değiştirilmediğini belirlediğini unutmayın. Bu durum, değiştirilen dosyalar hakkında bilgi edinmek için inotify veya benzer bir mekanizma kullanılarak iyileştirilebilir.

  • Yukarıdan aşağıya geçersiz kılma sırasında, üst düzey düğümün geçişli kapanımı kontrol edilir ve yalnızca geçişli kapanımı temiz olan düğümler tutulur. Mevcut düğüm grafiğinin büyük olduğunu ancak bir sonraki derlemede yalnızca küçük bir alt kümeye ihtiyacımız olduğunu biliyorsak bu daha iyidir: Aşağıdan yukarıya geçersiz kılma, yalnızca ikinci derlemenin küçük grafiğinde ilerleyen yukarıdan aşağıya geçersiz kılmanın aksine, ilk derlemenin daha büyük grafiğini geçersiz kılar.

Şu anda yalnızca aşağıdan yukarıya geçersiz kılma işlemi yapıyoruz.

Daha fazla artış elde etmek için değişiklik budama özelliğini kullanırız: Bir düğüm geçersiz kılınır ancak yeniden oluşturulduğunda yeni değerinin eski değeriyle aynı olduğu anlaşılırsa bu düğümdeki değişiklik nedeniyle geçersiz kılınan düğümler "yeniden oluşturulur".

Örneğin, bir C++ dosyasındaki yorum değiştirilirse bu kullanışlı olur. Bu durumda, yorumdan oluşturulan .o dosyası aynı olur ve bağlayıcıyı tekrar çağırmamız gerekmez.

Artımlı Bağlama / Derleme

Bu modelin temel sınırlaması, bir düğümün geçersiz kılınmasının her şeyi kapsayan bir işlem olmasıdır. Bir bağımlılık değiştiğinde, düğümün eski değerini değişikliklere göre değiştirecek daha iyi bir algoritma olsa bile bağımlı düğüm her zaman sıfırdan yeniden oluşturulur. Bu özelliğin faydalı olabileceği birkaç örnek:

  • Artımlı bağlama
  • .jar içinde tek bir .class dosyası değiştiğinde, .jar dosyasını sıfırdan oluşturmak yerine teorik olarak değiştirebiliriz.

Bazel'in şu anda bunları ilkeli bir şekilde desteklememesinin (artımlı bağlama için bir miktar desteğimiz var ancak bu, Skyframe'de uygulanmıyor) iki nedeni var: Yalnızca sınırlı performans artışları elde ettik ve mutasyonun sonucunun temiz bir yeniden derlemenin sonucuyla aynı olacağını garanti etmek zordu. Ayrıca Google, bit bit tekrarlanabilir derlemelere değer veriyor.

Şimdiye kadar, pahalı bir derleme adımını basitçe ayrıştırarak ve bu şekilde kısmi yeniden değerlendirme yaparak her zaman yeterince iyi bir performans elde edebiliyorduk: Bu adım, bir uygulamadaki tüm sınıfları birden fazla gruba ayırıyor ve bunları ayrı ayrı dexing işlemine tabi tutuyordu. Bu sayede, bir gruptaki sınıflar değişmezse dexing işleminin yeniden yapılması gerekmez.

Bazel kavramlarıyla eşleme

Aşağıda, Bazel'in derleme gerçekleştirmek için kullandığı SkyFunction uygulamalarından bazıları hakkında genel bir bakış sunulmaktadır:

  • FileStateValue. lstat() sonucu. Mevcut dosyalar için, dosyada yapılan değişiklikleri tespit etmek amacıyla ek bilgiler de hesaplarız. Bu, Skyframe grafiğindeki en düşük seviyeli düğümdür ve bağımlılığı yoktur.
  • FileValue. Bir dosyanın gerçek içeriği ve/veya çözümlenmiş yoluyla ilgilenen her şey tarafından kullanılır. İlgili FileStateValue ve çözülmesi gereken tüm sembolik bağlantılara (ör. a/b için FileValue, a'ün ve a/b'nin çözülmüş yolunu gerektirir) bağlıdır. Bazı durumlarda (ör. dosya sistemi globlarını (srcs=glob(["*/*.java"]) gibi) değerlendirirken dosyanın içeriğine aslında ihtiyaç duyulmadığı için FileStateValue arasındaki ayrım önemlidir.
  • DirectoryListingValue. Temel olarak readdir() sonucudur. Dizinle ilişkilendirilmiş FileValue bağlıdır.
  • PackageValue. Bir BUILD dosyasının ayrıştırılmış sürümünü temsil eder. İlişkili BUILD dosyasının FileValue değerine ve ayrıca paketteki glob'ları (bir BUILD dosyasının içeriğini dahili olarak temsil eden veri yapısı) çözümlemek için kullanılan tüm DirectoryListingValue değerlerine bağlıdır.
  • ConfiguredTargetValue. Yapılandırılmış bir hedefi temsil eder. Bu hedef, bir hedefin analizi sırasında oluşturulan işlemler kümesinin ve bu hedefe bağlı yapılandırılmış hedeflere sağlanan bilgilerin bir demetidir. PackageValue, doğrudan bağımlılıkların ConfiguredTargetValues ve derleme yapılandırmasını temsil eden özel bir düğüme bağlıdır.
  • ArtifactValue. Derlemedeki bir dosyayı temsil eder. Kaynak veya çıkış yapıları olabilir (yapılar neredeyse dosyalara eşdeğerdir ve derleme adımlarının gerçek yürütülmesi sırasında dosyalara atıfta bulunmak için kullanılır). Kaynak dosyalar için ilişkili düğümün FileValue değerine, çıkış yapıları için ise yapıyı oluşturan işlemin ActionExecutionValue değerine bağlıdır.
  • ActionExecutionValue. Bir işlemin yürütülmesini temsil eder. Giriş dosyalarının ArtifactValues bağlıdır. Yürüttüğü işlem şu anda gökyüzü anahtarı içinde yer alıyor. Bu durum, gökyüzü anahtarlarının küçük olması gerektiği kavramına aykırıdır. Bu tutarsızlığı gidermek için çalışıyoruz (Skyframe'de yürütme aşamasını çalıştırmazsak ActionExecutionValue ve ArtifactValue kullanılmadığını unutmayın).