5
DiffBot
* Web sayfalarından otomatik olarak veri alın: Diffbot'un bilgisayar görme API'leri web'i veritabanınıza dönüştürür.* OTOMATİK API'lar: Otomatik Olarak Çıkarın Makalelerden, ürünlerden ve diğer bilinen sayfa türlerinden yapılandırılmış içerik alın.
- Ücretli
- Web
Neden Diffbot?Size özel olarak daha iyi web verileri elde etmeye odaklandık.Yüzlerce müşterinin her ay (yüzlerce) milyonlarca arama yapmasının nedenlerinden bazıları: #Web'nin En İyi İçerik Çıkarıcısı: Diffbot, kurallar veya eğitim olmadan otomatik olarak çalışır.Web sayfalarından veri almanın daha iyi bir yolu yoktur.Diffbot'un diğer içerik ayıklama yöntemlerine nasıl yığıldığını görün: Özellik Karşılaştırması Metin Çıkarma Kalitesi Çekimi # Sayfaları Otomatik Olarak Tanımla: Herhangi bir siteyi tararken tüm ürünleri, makaleleri, tartışmaları veya görüntüleri otomatik olarak bulmak ve ayıklamak için Analiz API'sını kullanın.Analiz API'si # Ayrıntılı ürün verileri: Ürün API'sı, tüm fiyatlandırma verileri, ürün kimlikleri, marka ve tüm teknik özellikler tabloları dahil olmak üzere otomatik olarak eksiksiz ürün bilgileri döndürür.Ürün API'si #Temiz metin ve html: Makaleler, tartışma konuları, ürün açıklamaları ve resim yazıları salt metin ve sterilize edilmiş HTML ile döndürülür.Bugün test etmeye başlayın # Yapısal Arama: Arama API'mızı kullanarak anında herhangi bir taramadan yapılandırılmış içeriği arayın ve yalnızca eşleşen sonuçları döndürün.Artı ... ¤ Tüm API'lar Javascript'i çalıştırır, böylece içerik normal bir tarayıcı gibi ayrıştırılır.¤ Görsel işleme sayesinde çoğu İngilizce olmayan sayfada çalışır.¤ Tarih normalleştirme: Tarih damgaları normalleştirilir ve RFC 1123 (HTTP / 1.1) standart biçiminde sunulur.¤ Çok sayfalı makaleler otomatik olarak tek bir API yanıtında birleştirilir.¤ Varlık çıkarma: otomatik etiketleme, makale metnindeki önemli konuları ve varlıkları tanımlar.¤ API Araç Seti ile sorunları gerçek zamanlı olarak düzeltin.¤ Toplu API yüzlerce ila yüz binlerce sayfanın çıkarılmasını sağlar.¤ Crawlbot ve Bulk iş verilerine tam JSON veya CSV formatında erişin.¤ İsteğe bağlı olarak farklı bir IP adresi dizisi kullanarak tarama yapın.
diffbot