คำถามในหัวข้อ 'scrapy'

Scrapy พิมพ์ฟิลด์แต่ไม่ได้เติมไฟล์ XML
ฉันมีปัญหาในการพิมพ์ไฟล์ XML อย่างถูกต้อง แต่ไม่มีเนื้อหาใดๆ ในไฟล์ XML ผลลัพธ์ในเทอร์มินัลคือ: [u'Tove'] [u'Jani'] [u'Reminder'] [u"Don't forget me this weekend!"] อย่างไรก็ตาม ผลลัพธ์ site_products.xml ให้ผลลัพธ์ดังนี้ (ซึ่งผิด...
237 มุมมอง
schedule 08.01.2024

หลีกเลี่ยงการถูกแบนบนไซต์โดยใช้ scrapy
ฉันกำลังพยายามดาวน์โหลดข้อมูลจาก gsmarena โค้ดตัวอย่างในการดาวน์โหลดข้อมูลจำเพาะ HTC one me มาจากไซต์ต่อไปนี้ " http://www.gsmarena.com/htc_one_me-7275.php " ตามที่กล่าวไว้ด้านล่าง: ข้อมูลบนเว็บไซต์จัดอยู่ในรูปแบบตารางและแถวของตาราง...
5201 มุมมอง
schedule 25.10.2023

การส่งออก Scrapy FTP ไม่ทำงาน
ฉันกำลังพยายามอัปโหลด CSV ที่มีข้อมูลที่คัดลอกทั้งหมดของฉันบน FTP โดยใช้ scrapy crawl spidername --set FEED_URI=ftp://user:[email protected]/path/to/export.csv Terminal ไม่มีข้อผิดพลาดใดๆ และเริ่มทำการขูด แต่เมื่อทำงานเสร็จแล้ว...
419 มุมมอง
schedule 30.10.2023

Scrapy - ผลลัพธ์สุดท้ายเท่านั้น
ฉันเกือบจะทำให้โปรแกรมที่กระท่อนกระแท่นนี้หยุดทำงานแล้ว ยกเว้นปัญหาสุดท้ายนี้ ฉันกำลังพยายามที่จะ วนซ้ำรายการในแต่ละรายการหลายรายการบนเพจ แยกข้อมูลบางส่วนในหน้ารายการแรกนี้สำหรับแต่ละรายการ ['RStation'] ป้อน URL ของแต่ละรายการผ่านทาง href...
1061 มุมมอง
schedule 13.01.2024

แยกจากการตอบสนอง JSON แบบไดนามิกด้วย Scrapy
ฉันต้องการแยกค่า 'avail' ออกจากเอาต์พุต JSON ที่มีลักษณะเช่นนี้ { "result": { "code": 100, "message": "Command Successful" }, "domains": { "yolotaxpayers.com": { "avail": false, "tld":...
472 มุมมอง
schedule 20.12.2023

เอาต์พุตฟีด Scrapy มีเอาต์พุตที่คาดหวังหลายครั้งแทนที่จะเป็นเพียงครั้งเดียว
ฉันได้เขียนสไปเดอร์ซึ่งมีจุดประสงค์เพียงอย่างเดียวคือการดึงตัวเลขหนึ่งตัวจาก http://www.funda.nl/koop/amsterdam/ กล่าวคือ จำนวนหน้าสูงสุดจากเพจเจอร์ที่ด้านล่าง (เช่น หมายเลข 255 ในตัวอย่างด้านล่าง) ฉันจัดการเพื่อทำสิ่งนี้โดยใช้...
26 มุมมอง
schedule 22.11.2023

การตอบกลับแบบ Scrapy ขาดอาร์กิวเมนต์ตำแหน่งหนึ่งรายการ
ใหม่ถึง python มาจาก php.ini ฉันต้องการขูดบางไซต์โดยใช้ Scrapy และได้ผ่านบทช่วยสอนและสคริปต์ง่ายๆ เป็นอย่างดี ตอนนี้การเขียนเรื่องจริงเกิดข้อผิดพลาดนี้: Traceback (การโทรล่าสุดครั้งล่าสุด): ไฟล์...
1814 มุมมอง
schedule 24.11.2023

ความแตกต่างระหว่างตัวเลือก Scrapy a::text และ ::text
ฉันได้สร้างมีดโกนเพื่อดึงชื่อผลิตภัณฑ์บางส่วนจากหน้าเว็บ มันทำงานได้อย่างราบรื่น ฉันใช้ตัวเลือก CSS เพื่อทำงาน อย่างไรก็ตาม สิ่งเดียวที่ฉันไม่เข้าใจคือความแตกต่างระหว่างตัวเลือก a::text และ a ::text (อย่ามองข้ามช่องว่างระหว่าง a และ ::text...
763 มุมมอง

จะลบอักขระหรือสัญลักษณ์พิเศษออกจาก URL เริ่มต้นของ Scrapy ได้อย่างไร
ฉันได้รับ Scrapy Spider และเมื่อฉันเรียกใช้โค้ด ฉันได้รับข้อผิดพลาดนี้ ละเว้นการตอบสนอง ‹302 https://www.macys.com/ >: รหัสสถานะ HTTP ไม่ได้รับการจัดการหรือ ไม่ได้รับอนุญาต นี่แมงมุมของฉัน import scrapy import urllib.parse import...
94 มุมมอง
schedule 26.11.2023

คำถามเกี่ยวกับความปลอดภัยของเธรดสำหรับคอลเลกชัน Python ใน Scrapy Item Pipelines (ใช้ Twisted สำหรับการใช้งานพร้อมกัน)
Scrapy มีแนวคิดของ Item Pipelines ที่ ประมวลผลพร้อมกัน (ผ่าน Twisted) รายการที่ส่งคืนจาก Scrapy แมงมุม ตัวอย่างโค้ดต่อไปนี้มีไว้สำหรับ การกรองรายการที่ซ้ำกัน (คัดลอกโค้ดด้านล่าง) เป็นไปได้อย่างไรที่ set...
68 มุมมอง
schedule 15.12.2023