12
ArchiveBox
Source Açık kaynaklı, kendi kendine barındırılan web arşivi.Tarayıcı geçmişini / yer imlerini / Cep / Pinboard / vb. Alır, HTML, JS, PDF, medya ve daha fazlasını kaydeder.
- Ücretsiz
Modern web siteleri karmaşık olduğu ve genellikle dinamik içeriğe bağlı olduğu için ArchiveBox, siteleri Archive.org ve Archive.is gibi genel arşivleme hizmetlerinin kaydedebileceğinin ötesinde birkaç farklı biçimde arşivler.ArchiveBox stdin, uzak url veya dosyadan bir URL listesi alır, ardından göz atılabilir bir html klonu, medya çıkarmak için youtube-dl ve PDF için başsız bir Chrome örneği oluşturmak için sayfaları wget kullanarak yerel bir arşiv klasörüne ekler,Ekran görüntüsü ve DOM dökümleri ve daha fazlası ... JS'yi yürütmek için birden fazla yöntem ve piyasaya hakim tarayıcı kullanmak, en karmaşık, titiz web sitelerini bile en az birkaç yüksek kaliteli, uzun vadeli veri biçiminde kaydedebilmemizi sağlar.### Bağlantıları içe aktarabilir: - Cep, Pinboard, Instapaper - RSS, XML, JSON veya düz metin listeleri - Tarayıcı geçmişi veya yer imleri (Chrome, Firefox, Safari, IE, Opera ve daha fazlası) - Shaarli, Delicious, RedditKayıtlı Yayınlar, Wallabag, Unmark.it ve içinde bağlantıları olan diğer metinler!### Bu şeyleri her site için kaydedebilir: - `` favicon.ico` sitenin favicon'u - `example.com / page-name.html` sitenin wget klonu, yoksa .html eklenmiş -` çıktı.pdf` Başsız krom kullanarak sitenin basılı PDF'i - `screenshot.png` Başsız krom kullanarak sitenin 1440x900 ekran görüntüsü -` output.html` DOM Başsız krom kullanarak oluşturduktan sonra HTML dökümü - `archive.org.txt`archive.org'da kaydedilmiş site - html + gzip edilmiş warc dosyası için `warc /`.gz - `medya /` youtube-dl kullanılarak kullanılan herhangi bir mp4, mp3, altyazı ve meta veri - `git /` github, bitbucket veya gitlab bağlantıları için herhangi bir havuzun klonu - `index.html` &` index.json`Meta veri ve ayrıntılar içeren HTML ve JSON dizin dosyaları Arşivleme eklentidir, bu nedenle `. / Archive '' ı düzenli olarak çalışacak ve dizine yeni bağlantılar çekecek şekilde zamanlayabilirsiniz.Kaydedilen tüm içerik statiktir ve JSON dosyalarıyla endekslenir, bu nedenle sonsuza kadar yaşar ve kolayca ayrıştırılabilir, her zaman çalışan bir arka uç gerektirmez.