Pertanyaan Scraping untuk "preview" dari halaman web - Python


Saya mengindeks daftar tautan, tautan ini cukup sering diperbarui sehingga saya mengotomatiskan thumbnail untuk situs tersebut.

Untuk sebagian besar situs itu mudah, karena saya hanya mengambil gambar terbesar di halaman berharap itu menggambarkan konten.

Tetapi di lain waktu ada video sebagai konten utama halaman.


Apakah ada yang punya kiat menangani ini? Itu bagus sekali!


Mengenai penggunaan Webkit untuk membuat screenshot I menemukan ini


5
2018-02-27 18:09


asal


Jawaban:


wkhtmltopdf menggunakan salinan tertanam dari mesin render WebKit (digunakan di Safari, Chrome dll.) untuk menyimpan halaman web ke PDF, termasuk semua gambar (tidak ada video Flash meskipun saya kira). Itu bisa menjadi titik awal untuk gambar mini yang jauh lebih akurat.


3
2018-02-27 18:18



Ada layanan (gratis dan berbayar) yang melakukan apa yang Anda butuhkan. saya menggunakan mengecilkan web:


3
2018-02-27 18:41