Bu sayfada göreve dayalı derleme sistemleri, nasıl çalıştıkları ve göreve dayalı sistemlerde ortaya çıkabilecek bazı sorunlar ele alınmaktadır. Kabuk komut dosyalarından sonra, görev tabanlı derleme sistemleri derlemenin mantıksal olarak bir sonraki evrimidir.
Görev tabanlı derleme sistemlerini anlama
Görev tabanlı bir derleme sisteminde, temel çalışma birimi görevdir. Her görev, her türlü mantığı yürütebilen bir komut dosyasıdır ve görevler, diğer görevleri kendilerinden önce çalıştırılması gereken bağımlılık olarak belirtir. Günümüzde kullanılan Ant, Maven, Gradle, Grunt ve Rake gibi büyük derleme sistemlerinin çoğu göreve dayalıdır. Çoğu modern derleme sistemi, kabuk komut dosyaları yerine mühendislerin derlemenin nasıl yapılacağını açıklayan derleme dosyaları oluşturmasını gerektirir.
Ant kılavuzundaki şu örneği ele alalım:
<project name="MyProject" default="dist" basedir=".">
<description>
simple example build file
</description>
<!-- set global properties for this build -->
<property name="src" location="src"/>
<property name="build" location="build"/>
<property name="dist" location="dist"/>
<target name="init">
<!-- Create the time stamp -->
<tstamp/>
<!-- Create the build directory structure used by compile -->
<mkdir dir="${build}"/>
</target>
<target name="compile" depends="init"
description="compile the source">
<!-- Compile the Java code from ${src} into ${build} -->
<javac srcdir="${src}" destdir="${build}"/>
</target>
<target name="dist" depends="compile"
description="generate the distribution">
<!-- Create the distribution directory -->
<mkdir dir="${dist}/lib"/>
<!-- Put everything in ${build} into the MyProject-${DSTAMP}.jar file -->
<jar jarfile="${dist}/lib/MyProject-${DSTAMP}.jar" basedir="${build}"/>
</target>
<target name="clean"
description="clean up">
<!-- Delete the ${build} and ${dist} directory trees -->
<delete dir="${build}"/>
<delete dir="${dist}"/>
</target>
</project>
Derleme dosyası XML biçiminde yazılmıştır ve görevlerin listesinin (XML'deki <target>
etiketleri) yanı sıra derlemeyle ilgili bazı basit meta verileri tanımlar. (Karınca bir görevi temsil etmek için hedef kelimesini, komutları ifade etmek için de görev kelimesini kullanmaktadır.) Her görev, Ant tarafından tanımlanan olası komutların bir listesini yürütür. Bu komutlar arasında dizin oluşturma ve silme, javac
çalıştırma ve JAR dosyası oluşturma yer alır. Bu komut grubu, kullanıcı tarafından sağlanan eklentilerle her türlü mantığı kapsayacak şekilde genişletilebilir. Her görev, depends özelliği aracılığıyla bağlı olduğu görevleri de tanımlayabilir. Bu bağımlılıklar Şekil 1'de görüldüğü gibi
siklik bir grafik oluşturur.
Şekil 1. Bağımlılıkları gösteren döngüsel olmayan bir grafik
Kullanıcılar, Ant'ın komut satırı aracına görevler sağlayarak derleme yapar. Örneğin, bir kullanıcı ant dist
yazdığında Karınca aşağıdaki adımları uygular:
- Geçerli dizinde
build.xml
adlı bir dosyayı yükler ve Şekil 1'de gösterilen grafik yapısını oluşturmak için bu dosyayı ayrıştırır. - Komut satırında sağlanan
dist
adlı görevi arar vecompile
adlı göreve bağımlılığı olduğunu keşfeder. compile
adlı görevi arar veinit
adlı göreve bağımlılığı olduğunu keşfeder.init
adlı görevi arar ve bu görevin bağımlılığı olmadığını tespit eder.init
görevinde tanımlanan komutları yürütür.compile
görevinin tüm bağımlılıkları çalıştırılmışsacompile
görevinde tanımlanan komutları yürütür.- Tüm bağımlılıkları çalıştırıldığı için
dist
görevinde tanımlanan komutları yürütür.
Sonuç olarak, dist
görevi çalıştırıldığında Ant tarafından yürütülen kod aşağıdaki kabuk komut dosyasına eşdeğerdir:
./createTimestamp.sh
mkdir build/
javac src/* -d build/
mkdir -p dist/lib/
jar cf dist/lib/MyProject-$(date --iso-8601).jar build/*
Söz dizimi kaldırıldığında, derleme dosyası ve derleme komut dosyası aslında çok farklı değildir. Ama bu sayede zaten büyük kazanç elde ettik. Diğer dizinlerde yeni derleme dosyaları oluşturabilir ve bunları birbirine bağlayabiliriz. Mevcut görevlere dayalı yeni görevleri rastgele ve karmaşık yöntemlerle kolayca ekleyebiliyoruz. ant
komut satırı aracına tek bir görevin adını iletmemiz yeterlidir. Bu ad, çalıştırılması gereken her şeyi belirler.
Ant, ilk olarak 2000 yılında yayınlanan eski bir yazılımdır. Maven ve Gradle gibi diğer araçlar da aralar içinde Ant'ı iyileştirmiş ve dış bağımlılıkların otomatik yönetimi ve XML olmadan daha net bir söz dizimi gibi özellikler ekleyerek Ant'ın yerini almıştır. Ancak bu yeni sistemlerin yapısı aynıdır: Mühendislerin, derleme komut dosyalarını görevler olarak temelli ve modüler bir şekilde yazmalarına olanak tanır ve bu görevleri yürütmek ve aralarındaki bağımlılıkları yönetmek için araçlar sağlar.
Görev tabanlı derleme sistemlerinin karanlık tarafı
Bu araçlar, mühendislerin herhangi bir komut dosyasını görev olarak tanımlamasına olanak tanır. Bu nedenle son derece güçlüdür ve hayal edebileceğiniz hemen hemen her şeyi yapmanıza olanak tanır. Ancak bu güç bazı dezavantajları da beraberinde getirir ve oluşturma komut dosyaları daha karmaşık hale geldikçe göreve dayalı derleme sistemleriyle çalışmak zorlaşabilir. Bu tür sistemlerin sorunu, mühendislere çok fazla, sisteme ise yeterince güç vermesidir. Sistem, komut dosyalarının ne yaptığı hakkında hiçbir fikre sahip olmadığından derleme adımlarını planlama ve yürütme konusunda çok ihtiyatlı olması gerekir. Bu da performansı olumsuz etkiler. Ayrıca sistemin her komut dosyasının yapması gerekeni yaptığını onaylaması mümkün değildir. Bu nedenle komut dosyalarının karmaşıklığı artar ve sonunda hata ayıklama gerektiren başka bir şey haline gelir.
Derleme adımlarını paralelleştirmenin zorluğu
Modern geliştirme iş istasyonları, paralel olarak birkaç derleme adımı yürütebilen birden fazla çekirdeğe sahip olduğundan oldukça güçlüdür. Ancak görev tabanlı sistemler, yapabilecekleri halde çoğu zaman görev yürütmeyi paralelleştiremez. A görevinin B ve C görevlerine bağlı olduğunu varsayalım. B ve C görevleri birbirine bağımlı olmadığından, sistemin A görevine daha hızlı ulaşabilmesi için bu görevleri aynı anda çalıştırmak güvenli mi? Aynı kaynaklara dokunmuyorlarsa evet. Ancak belki de değil; her ikisi de durumlarını izlemek için aynı dosyayı kullanır ve bunları aynı anda çalıştırmak bir çakışmaya neden olur. Sistemin genel olarak bunu bilmesi mümkün değildir. Bu nedenle sistem, bu çakışmaları riske atar (nadir bulunan ancak hata ayıklaması çok zor derleme sorunlarına yol açar) ya da tüm derlemeyi tek bir işlemde tek bir iş parçacığında çalışacak şekilde kısıtlamalıdır. Bu, güçlü bir geliştirici makinesi için büyük bir israfa yol açabilir ve derlemenin birden fazla makineye dağıtılması olasılığını tamamen ortadan kaldırır.
Artımlı derleme yapmanın zorluğu
İyi bir derleme sistemi, mühendislerin güvenilir artımlı derlemeler yapmasına olanak tanır. Böylece küçük bir değişiklik, tüm kod tabanının sıfırdan yeniden oluşturulmasını gerektirmez. Bu, özellikle derleme sistemi yavaşsa ve yukarıda belirtilen nedenlerden dolayı derleme adımlarını paralel hale getiremiyorsa önemlidir. Ancak maalesef görev tabanlı derleme sistemleri de bu konuda zorlanıyor. Görevler her şeyi yapabileceğinden, görevlerin zaten yapılıp yapılmadığını kontrol etmenin genel bir yolu yoktur. Birçok görev, bir dizi kaynak dosya alır ve bir dizi ikili dosya oluşturmak için derleyici çalıştırır. Bu nedenle, temel kaynak dosyalar değişmediyse bu görevlerin yeniden çalıştırılması gerekmez. Ancak ek bilgi olmadan sistem bunu kesin olarak söyleyemez. Görev, değişmiş olabilecek bir dosyayı indirebilir veya her çalıştırmada farklı olabilecek bir zaman damgası yazabilir. Doğruluğu garanti etmek için sistemin genellikle her derleme sırasında her görevi yeniden çalıştırması gerekir. Bazı derleme sistemleri, mühendislerin bir görevin yeniden çalıştırılması gereken koşulları belirtmesine izin vererek artımlı derlemeleri mümkün kılmaya çalışır. Bu bazen uygulanabilir olsa da genellikle göründüğünden çok daha karmaşık bir sorundur. Örneğin, C++ gibi dosyaların diğer dosyalar tarafından doğrudan eklenmesine izin veren dillerde, giriş kaynaklarını ayrıştırmadan değişiklikler için izlenmesi gereken dosya grubunun tamamını belirlemek mümkün değildir. Mühendisler genellikle kısayollar kullanır ve bu kısayollar, bir görev sonucunun gerekmediği halde yeniden kullanıldığı nadir ve can sıkıcı sorunlara yol açabilir. Bu durum sık sık yaşandığında mühendisler yeni bir durum elde etmek için her derlemeden önce temizlik çalıştırma alışkanlığı kazanır. Bu da başlangıçta artımlı bir derlemeye sahip olma amacını tamamen ortadan kaldırır. Bir görevin ne zaman tekrar çalıştırılması gerektiğini belirlemek şaşırtıcı derecede zordur ve insanlardan çok makineler tarafından daha iyi yönetilir.
Komut dosyalarını yönetme ve hata ayıklama konusunda zorluk
Son olarak, görev tabanlı derleme sistemlerinin zorunlu kıldığı derleme komut dosyalarının kullanımı genellikle zordur. Genellikle daha az inceleme alsalar da derleme komut dosyaları, derlenen sistem gibi koddur ve hataların gizlenmesi için kolay yerlerdir. Görev tabanlı bir derleme sistemiyle çalışırken çok yaygın olarak görülen hatalara bazı örnekler:
- A görevi, çıkış olarak belirli bir dosya üretmesi için B görevine bağlıdır. B görevinin sahibi, başka görevlerin de buna bağlı olduğunun farkında değildir; bu nedenle, görevi farklı bir yerde çıktı üretmek üzere değiştirir. Bu durum, bir kişi A görevini yürütmeye çalışıp başarısız olduğunu görene kadar tespit edilemez.
- Görev A, görev B'ye bağlıdır. Görev B, görev C'ye bağlıdır. Görev C, A görevinin ihtiyaç duyduğu belirli bir dosyayı çıkış olarak üretir. B görevinin sahibi artık C görevine bağımlı olmadığına karar verir. Bu da B görevi C görevini hiç umursamasa bile A görevinin başarısız olmasına neden olur.
- Yeni bir görevin geliştiricisi, görevi çalıştıran makine hakkında bir aracın konumu veya belirli ortam değişkenlerinin değeri gibi bir varsayımda bulunabilir. Görev, geliştiricinin makinesinde çalışıyor ancak başka bir geliştirici denediğinde başarısız oluyor.
- Görevler, internetten dosya indirme veya derlemeye zaman damgası ekleme gibi deterministik olmayan bir bileşen içerir. Artık kullanıcılar derlemeyi her çalıştırdıklarında potansiyel olarak farklı sonuçlar alıyor. Diğer bir deyişle, mühendisler otomatik bir derleme sisteminde oluşan arızaları veya arızaları her zaman yeniden üretip düzeltemez.
- Birden çok bağımlılığı olan görevler yarışma koşulları oluşturabilir. A görevi hem B görevi hem de C görevine bağlıysa ve B görevi ile C görevi aynı dosyayı değiştiriyorsa, A görevi B ve C görevlerinden hangisinin önce bittiğine bağlı olarak farklı bir sonuç alır.
Burada açıklanan görev tabanlı çerçevede bu performans, doğruluk veya sürdürülebilirlik sorunlarını çözmenin genel bir yolu yoktur. Mühendisler derleme sırasında çalıştırılacak rastgele kod yazabildikleri sürece sistem, derlemeleri her zaman hızlı ve doğru şekilde çalıştırabilecek yeterli bilgiye sahip olamaz. Sorunu çözmek için mühendislerin elinden bir miktar güç alıp bunu sistemin ellerine geri vermeli ve sistemin rolünü çalıştırmak yerine işlerin üretilmesi olarak yeniden kavramamız gerekiyor.
Bu yaklaşım, Blaze ve Bazel gibi yapıya dayalı derleme sistemlerinin oluşturulmasına yol açtı.