Apache Nutch, oldukça genişletilebilir ve ölçeklendirilebilir bir açık kaynak web tarayıcı yazılımı projesidir.Nutch tamamen Java programlama dilinde kodlanmıştır, ancak veriler dilden bağımsız formatlarda yazılmıştır.Geliştiricilerin medya türü ayrıştırma, veri alma, sorgulama ve kümeleme için eklentiler oluşturmalarına izin veren son derece modüler bir mimariye sahiptir.Getirici ("robot" veya "web tarayıcısı") özellikle bu proje için sıfırdan yazılmıştır.
apache-nutch