123
DiffBot

DiffBot

* Web sayfalarından otomatik olarak veri alın: Diffbot'un bilgisayar görme API'leri web'i veritabanınıza dönüştürür.* OTOMATİK API'lar: Otomatik Olarak Çıkarın Makalelerden, ürünlerden ve diğer bilinen sayfa türlerinden yapılandırılmış içerik alın.
Neden Diffbot?Size özel olarak daha iyi web verileri elde etmeye odaklandık.Yüzlerce müşterinin her ay (yüzlerce) milyonlarca arama yapmasının nedenlerinden bazıları: #Web'nin En İyi İçerik Çıkarıcısı: Diffbot, kurallar veya eğitim olmadan otomatik olarak çalışır.Web sayfalarından veri almanın daha iyi bir yolu yoktur.Diffbot'un diğer içerik ayıklama yöntemlerine nasıl yığıldığını görün: Özellik Karşılaştırması Metin Çıkarma Kalitesi Çekimi # Sayfaları Otomatik Olarak Tanımla: Herhangi bir siteyi tararken tüm ürünleri, makaleleri, tartışmaları veya görüntüleri otomatik olarak bulmak ve ayıklamak için Analiz API'sını kullanın.Analiz API'si # Ayrıntılı ürün verileri: Ürün API'sı, tüm fiyatlandırma verileri, ürün kimlikleri, marka ve tüm teknik özellikler tabloları dahil olmak üzere otomatik olarak eksiksiz ürün bilgileri döndürür.Ürün API'si #Temiz metin ve html: Makaleler, tartışma konuları, ürün açıklamaları ve resim yazıları salt metin ve sterilize edilmiş HTML ile döndürülür.Bugün test etmeye başlayın # Yapısal Arama: Arama API'mızı kullanarak anında herhangi bir taramadan yapılandırılmış içeriği arayın ve yalnızca eşleşen sonuçları döndürün.Artı ... ¤ Tüm API'lar Javascript'i çalıştırır, böylece içerik normal bir tarayıcı gibi ayrıştırılır.¤ Görsel işleme sayesinde çoğu İngilizce olmayan sayfada çalışır.¤ Tarih normalleştirme: Tarih damgaları normalleştirilir ve RFC 1123 (HTTP / 1.1) standart biçiminde sunulur.¤ Çok sayfalı makaleler otomatik olarak tek bir API yanıtında birleştirilir.¤ Varlık çıkarma: otomatik etiketleme, makale metnindeki önemli konuları ve varlıkları tanımlar.¤ API Araç Seti ile sorunları gerçek zamanlı olarak düzeltin.¤ Toplu API yüzlerce ila yüz binlerce sayfanın çıkarılmasını sağlar.¤ Crawlbot ve Bulk iş verilerine tam JSON veya CSV formatında erişin.¤ İsteğe bağlı olarak farklı bir IP adresi dizisi kullanarak tarama yapın.

İnternet sitesi:

Özellikleri

Kategoriler

Self-Hosted için DiffBot'a alternatifler

artoo.js

artoo.js

artoo.js, size bazı kazıma yardımcı programları sağlamak için tarayıcınızın konsolunda çalıştırılması amaçlanan bir JavaScript kodu parçasıdır.