Bazel'in paralel değerlendirme ve artım modeli.
Veri modeli
Veri modeli aşağıdaki öğelerden oluşur:
SkyValue. Düğümler olarak da adlandırılır.SkyValues, derleme sırasında oluşturulan tüm verileri ve derlemenin girişlerini içeren değişmez nesnelerdir. Örnekler: giriş dosyaları, çıkış dosyaları, hedefler ve yapılandırılmış hedefler.SkyKey. BirSkyValueöğesine referans vermek için kullanılan kısa ve değiştirilemez bir ad (ör.FILECONTENTS:/tmp/fooveyaPACKAGE://foo).SkyFunction. Anahtarlarına ve bağımlı düğümlere göre düğümler oluşturur.- Düğüm grafiği. Düğümler arasındaki bağımlılık ilişkisini içeren bir veri yapısı.
Skyframe. Bazel'in temel aldığı artımlı değerlendirme çerçevesinin kod adı.
Değerlendirme
Derleme isteğini temsil eden düğüm değerlendirilerek derleme gerçekleştirilir.
İlk olarak Bazel, üst düzey SkyKey anahtarına karşılık gelen SkyFunction öğesini bulur. Ardından işlev, üst düzey düğümü değerlendirmek için gereken düğümlerin değerlendirilmesini ister. Bu da yaprak düğümlere ulaşılana kadar diğer SkyFunction çağrılarına neden olur. Yaprak düğümler genellikle dosya sistemindeki giriş dosyalarını temsil eden düğümlerdir. Son olarak Bazel, en üst düzeydeki SkyValue değerini, bazı yan etkileri (ör. dosya sistemindeki çıkış dosyaları) ve derlemeye dahil olan düğümler arasındaki bağımlılıkların yönlendirilmiş döngüsüz grafiğini elde eder.
Bir SkyFunction, görevini yerine getirmek için gereken tüm düğümleri önceden belirleyemiyorsa birden fazla geçişte SkyKeys isteyebilir. Basit bir örnek, sembolik bağlantı olduğu anlaşılan bir giriş dosyası düğümünü değerlendirmektir: İşlev, dosyayı okumaya çalışır, bunun bir sembolik bağlantı olduğunu fark eder ve böylece sembolik bağlantının hedefini temsil eden dosya sistemi düğümünü getirir. Ancak bu da sembolik bağlantı olabilir. Bu durumda orijinal işlevin de hedefini getirmesi gerekir.
İşlevler, kodda SkyFunction arayüzü ve SkyFunction.Environment adlı bir arayüz tarafından sağlanan hizmetlerle temsil edilir. İşlevlerin yapabileceği işlemler:
env.getValuenumaralı telefonu arayarak başka bir düğümün değerlendirilmesini isteyin. Düğüm varsa değeri döndürülür, aksi takdirdenulldöndürülür ve işlevin kendisininnulldöndürmesi beklenir. İkinci durumda, bağımlı düğüm değerlendirilir ve ardından orijinal düğüm oluşturucu tekrar çağrılır ancak bu kez aynıenv.getValueçağrısınullolmayan bir değer döndürür.env.getValues()işlevini çağırarak birden fazla başka düğümün değerlendirilmesini isteyin. Bu, bağımlı düğümlerin paralel olarak değerlendirilmesi dışında temelde aynı işlemi yapar.- Çağrıldığında hesaplama yapma
- Dosya sistemine dosya yazma gibi yan etkileri olabilir. İki farklı işlevin birbirinin alanına girmemesi için dikkatli olunmalıdır. Genel olarak, yazma yan etkileri (verilerin Bazel'den dışarı aktığı yerler) sorunsuz çalışır. Okuma yan etkileri (verilerin kayıtlı bir bağımlılık olmadan Bazel'e aktığı yerler) ise kayıtlı olmayan bir bağımlılık oldukları ve bu nedenle yanlış artımlı derlemelere neden olabilecekleri için sorunsuz çalışmaz.
İyi tasarlanmış SkyFunction uygulamaları, bağımlılıkları istemek dışında başka bir şekilde verilere erişmekten kaçınır (ör. dosya sistemini doğrudan okuyarak). Aksi takdirde Bazel, okunan dosyadaki veri bağımlılığını kaydetmez ve bu da yanlış artımlı derlemelere yol açar.
Bir işlev, görevini yerine getirmek için yeterli veriye sahip olduğunda tamamlanmayı belirten bir null
olmayan değer döndürmelidir.
Bu değerlendirme stratejisinin çeşitli avantajları vardır:
- Hermetiklik. İşlevler yalnızca diğer düğümlere bağlı olarak giriş verilerini isterse Bazel, giriş durumu aynı olduğunda aynı verilerin döndürüleceğini garanti edebilir. Tüm gökyüzü işlevleri deterministikse bu, tüm derlemenin de deterministik olacağı anlamına gelir.
- Artımlılığı düzeltin ve mükemmelleştirin. Tüm işlevlerin tüm giriş verileri kaydedilirse Bazel, giriş verileri değiştiğinde yalnızca geçersiz kılınması gereken tam düğüm kümesini geçersiz kılabilir.
- Paralellik İşlevler yalnızca bağımlılık isteğinde bulunarak birbirleriyle etkileşime girebildiğinden, birbirine bağlı olmayan işlevler paralel olarak çalıştırılabilir ve Bazel, sonuçların sırayla çalıştırılmış gibi olacağını garanti edebilir.
Artımlılık
İşlevler yalnızca diğer düğümlere bağlı olarak giriş verilerine erişebildiğinden Bazel, giriş dosyalarından çıkış dosyalarına kadar eksiksiz bir veri akışı grafiği oluşturabilir ve bu bilgileri yalnızca gerçekten yeniden oluşturulması gereken düğümleri (değiştirilen giriş dosyaları kümesinin ters geçişli kapanımı) yeniden oluşturmak için kullanabilir.
Özellikle iki olası artış stratejisi vardır: aşağıdan yukarıya ve yukarıdan aşağıya. Hangisinin en iyi olduğu, bağımlılık grafiğinin nasıl göründüğüne bağlıdır.
Aşağıdan yukarıya geçersiz kılma sırasında, bir grafik oluşturulduktan ve değiştirilen girişler kümesi bilindikten sonra, değiştirilen dosyalara geçişli olarak bağlı olan tüm düğümler geçersiz kılınır. Aynı üst düzey düğüm tekrar oluşturulacaksa bu yöntem idealdir. Alttan yukarıya geçersiz kılma işleminin, önceki derlemenin tüm giriş dosyalarında
stat()komutunun çalıştırılmasını gerektirdiğini ve bu dosyaların değiştirilip değiştirilmediğinin belirlendiğini unutmayın. Bu durum, değişen dosyalar hakkında bilgi edinmek içininotifyveya benzer bir mekanizma kullanılarak iyileştirilebilir.Yukarıdan aşağıya geçersiz kılma sırasında, üst düzey düğümün geçişli kapanımı kontrol edilir ve yalnızca geçişli kapanımı temiz olan düğümler tutulur. Bu, düğüm grafiği büyükse ancak sonraki derleme için yalnızca küçük bir alt kümesi gerekiyorsa daha iyidir: Alttan yukarıya geçersiz kılma, ikinci derlemenin yalnızca küçük grafiğinde ilerleyen üstten aşağıya geçersiz kılmanın aksine, ilk derlemenin daha büyük grafiğini geçersiz kılar.
Bazel yalnızca aşağıdan yukarıya geçersiz kılma işlemi yapar.
Bazel, daha fazla artış elde etmek için değişiklik budama özelliğini kullanır: Bir düğüm geçersiz kılınır ancak yeniden oluşturulduğunda yeni değerinin eski değeriyle aynı olduğu anlaşılırsa bu düğümdeki bir değişiklik nedeniyle geçersiz kılınan düğümler "yeniden oluşturulur".
Örneğin, bir C++ dosyasındaki yorum değiştirilirse bu dosya kullanılarak oluşturulan .o dosyası aynı olur. Bu nedenle, bağlayıcıyı tekrar çağırmak gereksizdir.
Artımlı Bağlama / Derleme
Bu modelin temel sınırlaması, bir düğümün geçersiz kılınmasının her şeyi kapsayan bir işlem olmasıdır: Bir bağımlılık değiştiğinde, daha iyi bir algoritma olsa bile bağımlı düğüm her zaman sıfırdan yeniden oluşturulur. Bu algoritma, düğümün eski değerini değişikliklere göre değiştirebilir. Bu özelliğin yararlı olacağı birkaç örnek:
- Artımlı bağlama
- Bir JAR dosyasında tek bir sınıf dosyası değiştiğinde, JAR dosyasını sıfırdan tekrar oluşturmak yerine yerinde değiştirebilirsiniz.
Bazel'in bu özellikleri prensipli bir şekilde desteklememesinin iki nedeni vardır:
- Performansta sınırlı artışlar oldu.
- Mutasyonun sonucunun temiz bir yeniden oluşturma ile aynı olduğunu doğrulamanın zor olması ve Google'ın bit bit tekrarlanabilir derlemelere değer vermesi.
Şimdiye kadar, pahalı bir derleme adımını parçalayarak ve bu şekilde kısmi yeniden değerlendirme yaparak yeterince iyi bir performans elde etmek mümkündü. Örneğin, bir Android uygulamasında tüm sınıfları birden fazla gruba ayırabilir ve bunları ayrı ayrı dex'leyebilirsiniz. Bu sayede, bir gruptaki sınıflar değişmediyse dexing işleminin yeniden yapılması gerekmez.
Bazel kavramlarıyla eşleme
Aşağıda, Bazel'in derleme gerçekleştirmek için kullandığı temel SkyFunction ve SkyValue uygulamalarının üst düzey bir özeti verilmiştir:
- FileStateValue.
lstat()sonucu. Mevcut dosyalar için işlev, dosyada yapılan değişiklikleri tespit etmek amacıyla ek bilgiler de hesaplar. Bu, Skyframe grafiğindeki en düşük seviyeli düğümdür ve bağımlılığı yoktur. - FileValue. Bir dosyanın gerçek içeriği veya çözümlenmiş yoluyla ilgilenen her şey tarafından kullanılır. İlgili
FileStateValueve çözülmesi gereken tüm sembolik bağlantılara (ör.a/biçinFileValue,a'ün çözülmüş yolunu vea/b'nin çözülmüş yolunu gerektirir) bağlıdır.FileValueileFileStateValuearasındaki fark önemlidir. Çünkü ikincisi, dosyanın içeriğinin aslında gerekli olmadığı durumlarda kullanılabilir. Örneğin, dosya sistemi globları (srcs=glob(["*/*.java"])gibi) değerlendirilirken dosya içerikleri alakasızdır. - DirectoryListingStateValue.
readdir()işleminin sonucu.FileStateValuegibi bu da en düşük düzeydeki düğümdür ve bağımlılığı yoktur. - DirectoryListingValue. Bir dizinin girişleriyle ilgilenen her şey tarafından kullanılır. İlgili
DirectoryListingStateValueve dizinin ilişkiliFileValuedeğerine bağlıdır. - PackageValue. Bir BUILD dosyasının ayrıştırılmış sürümünü temsil eder. İlişkili
BUILDdosyasınınFileValuedeğerine ve ayrıca paketteki glob'ları çözmek için kullanılan tümDirectoryListingValuedeğerlerine (BUILDdosyasının içeriğini dahili olarak temsil eden veri yapısı) bağlıdır. - ConfiguredTargetValue. Yapılandırılmış bir hedefi temsil eder. Bu, bir hedef analiz edilirken oluşturulan işlemler kümesinin ve bağımlı yapılandırılmış hedeflere sağlanan bilgilerin bir demetidir.
PackageValue, doğrudan bağımlılıklarınConfiguredTargetValuesve derleme yapılandırmasını temsil eden özel bir düğüme bağlıdır. - ArtifactValue. Derlemedeki bir dosyayı (kaynak veya çıkış yapısı) temsil eder. Yapılar, dosyalarla neredeyse eşdeğerdir ve derleme adımlarının gerçek yürütülmesi sırasında dosyalara başvurmak için kullanılır. Kaynak dosyalar, ilişkili düğümün
FileValuedeğerine bağlıdır. Çıkış yapıları ise yapıyı oluşturan işleminActionExecutionValuedeğerine bağlıdır. - ActionExecutionValue. Bir işlemin yürütülmesini temsil eder. Giriş dosyalarının
ArtifactValuesbağlıdır. Yürüttüğü işlem, SkyKey'inde yer alır. Bu durum, SkyKey'lerin küçük olması gerektiği kavramına aykırıdır. Yürütme aşaması çalışmıyorsaActionExecutionValueveArtifactValueparametrelerinin kullanılmadığını unutmayın.
Bu şema, görsel bir yardımcı olarak Bazel'in kendisinin derlenmesinden sonra SkyFunction uygulamaları arasındaki ilişkileri gösterir:
