Pertanyaan tentang topik tersebut 'web-crawler'

Bagaimana cara membuat perayap web di ASP.NET?
Saya bertanya-tanya apakah ada cara membuat bot/crawler web untuk situs web di ASP.NET. Saya harus mengambil informasi dari salah satu penyedia pembayaran kami, namun mereka tidak memiliki API sehingga satu-satunya cara saat ini untuk mengambil...
5032 dilihat
schedule 05.11.2023

Bagaimana cara membuat perayap web Perl saya berjalan lebih cepat?
Saya telah menyelesaikan proyek kecil selama dua hari terakhir yang terdiri dari pembuatan crawler di Perl. Saya tidak punya pengalaman nyata di Perl (hanya apa yang saya pelajari dalam dua hari terakhir). Skrip saya adalah sebagai berikut:...
1751 dilihat
schedule 07.11.2023

Bagaimana cara mengeklik tombol di situs lain secara terprogram?
Saya Ingin Masuk ke situs lain dengan program saya (asp.net/C#). BAGAIMANA saya dapat merayapi situs dan menemukan kotak teks nama pengguna & kata sandi dan mengisinya dengan data yang diperlukan. lalu BAGAIMANA cara menekan/menembak tombol...
4215 dilihat
schedule 13.11.2023

Mengekstraksi data yang sama dari berbagai dokumen HTML
Katakanlah saya memiliki beberapa halaman HTML dari situs web yang tidak terkait, tetapi berisi informasi keseluruhan yang sama. Saya ingin mengekstrak informasi tersebut dengan cara yang fleksibel, yaitu saya hanya ingin menulis sejumlah kecil...
63 dilihat
schedule 20.12.2023

Cara memperbaiki Masalah Perayapan
Saya menemukan kesalahan Eksternal 408 ketika saya menguji situs saya pada alat Perayap Situs Web dan Generator Peta Situs XML pada tautan di bawah ini: http://tools.seochat.com/tools/online-crawl-google-sitemap-generator/ Nama situs saya seperti :...
152 dilihat
schedule 19.11.2023

Ekstrak dari respons JSON dinamis dengan Scrapy
Saya ingin mengekstrak nilai 'avail' dari output JSON yang terlihat seperti ini. { "result": { "code": 100, "message": "Command Successful" }, "domains": { "yolotaxpayers.com": { "avail": false,...
472 dilihat
schedule 20.12.2023

Respons passing yang buruk, kehilangan satu argumen posisi
Baru mengenal python, berasal dari php. Saya ingin mengikis beberapa situs menggunakan Scrapy dan telah melalui tutorial dan skrip sederhana dengan baik. Sekarang menulis real deal muncul kesalahan ini: Traceback (panggilan terakhir...
1814 dilihat
schedule 24.11.2023

Bagaimana cara membiarkan crawler menjalankan javascript di halaman?
Saya ingin menerapkan beberapa mekanisme anti-perayapan untuk melindungi data di situs saya. Setelah membaca banyak topik terkait di SO, saya akan fokus pada "menerapkan javascript yang berjalan". Rencana saya adalah: Terapkan fungsi khusus...
70 dilihat
schedule 23.10.2023