คำถามในหัวข้อ 'scrapy'
Scrapy พิมพ์ฟิลด์แต่ไม่ได้เติมไฟล์ XML
ฉันมีปัญหาในการพิมพ์ไฟล์ XML อย่างถูกต้อง แต่ไม่มีเนื้อหาใดๆ ในไฟล์ XML
ผลลัพธ์ในเทอร์มินัลคือ:
[u'Tove'] [u'Jani'] [u'Reminder'] [u"Don't forget me this weekend!"]
อย่างไรก็ตาม ผลลัพธ์ site_products.xml ให้ผลลัพธ์ดังนี้ (ซึ่งผิด...
237 มุมมอง
schedule
08.01.2024
หลีกเลี่ยงการถูกแบนบนไซต์โดยใช้ scrapy
ฉันกำลังพยายามดาวน์โหลดข้อมูลจาก gsmarena โค้ดตัวอย่างในการดาวน์โหลดข้อมูลจำเพาะ HTC one me มาจากไซต์ต่อไปนี้ " http://www.gsmarena.com/htc_one_me-7275.php " ตามที่กล่าวไว้ด้านล่าง:
ข้อมูลบนเว็บไซต์จัดอยู่ในรูปแบบตารางและแถวของตาราง...
5201 มุมมอง
schedule
25.10.2023
การส่งออก Scrapy FTP ไม่ทำงาน
ฉันกำลังพยายามอัปโหลด CSV ที่มีข้อมูลที่คัดลอกทั้งหมดของฉันบน FTP โดยใช้
scrapy crawl spidername --set FEED_URI=ftp://user:[email protected]/path/to/export.csv
Terminal ไม่มีข้อผิดพลาดใดๆ และเริ่มทำการขูด แต่เมื่อทำงานเสร็จแล้ว...
419 มุมมอง
schedule
30.10.2023
Scrapy - ผลลัพธ์สุดท้ายเท่านั้น
ฉันเกือบจะทำให้โปรแกรมที่กระท่อนกระแท่นนี้หยุดทำงานแล้ว ยกเว้นปัญหาสุดท้ายนี้ ฉันกำลังพยายามที่จะ
วนซ้ำรายการในแต่ละรายการหลายรายการบนเพจ
แยกข้อมูลบางส่วนในหน้ารายการแรกนี้สำหรับแต่ละรายการ ['RStation']
ป้อน URL ของแต่ละรายการผ่านทาง href...
1061 มุมมอง
schedule
13.01.2024
แยกจากการตอบสนอง JSON แบบไดนามิกด้วย Scrapy
ฉันต้องการแยกค่า 'avail' ออกจากเอาต์พุต JSON ที่มีลักษณะเช่นนี้
{
"result": {
"code": 100,
"message": "Command Successful"
},
"domains": {
"yolotaxpayers.com": {
"avail": false,
"tld":...
472 มุมมอง
schedule
20.12.2023
เอาต์พุตฟีด Scrapy มีเอาต์พุตที่คาดหวังหลายครั้งแทนที่จะเป็นเพียงครั้งเดียว
ฉันได้เขียนสไปเดอร์ซึ่งมีจุดประสงค์เพียงอย่างเดียวคือการดึงตัวเลขหนึ่งตัวจาก http://www.funda.nl/koop/amsterdam/ กล่าวคือ จำนวนหน้าสูงสุดจากเพจเจอร์ที่ด้านล่าง (เช่น หมายเลข 255 ในตัวอย่างด้านล่าง)
ฉันจัดการเพื่อทำสิ่งนี้โดยใช้...
26 มุมมอง
schedule
22.11.2023
การตอบกลับแบบ Scrapy ขาดอาร์กิวเมนต์ตำแหน่งหนึ่งรายการ
ใหม่ถึง python มาจาก php.ini ฉันต้องการขูดบางไซต์โดยใช้ Scrapy และได้ผ่านบทช่วยสอนและสคริปต์ง่ายๆ เป็นอย่างดี ตอนนี้การเขียนเรื่องจริงเกิดข้อผิดพลาดนี้:
Traceback (การโทรล่าสุดครั้งล่าสุด):
ไฟล์...
1814 มุมมอง
schedule
24.11.2023
ความแตกต่างระหว่างตัวเลือก Scrapy a::text และ ::text
ฉันได้สร้างมีดโกนเพื่อดึงชื่อผลิตภัณฑ์บางส่วนจากหน้าเว็บ มันทำงานได้อย่างราบรื่น ฉันใช้ตัวเลือก CSS เพื่อทำงาน อย่างไรก็ตาม สิ่งเดียวที่ฉันไม่เข้าใจคือความแตกต่างระหว่างตัวเลือก a::text และ a ::text (อย่ามองข้ามช่องว่างระหว่าง a และ ::text...
763 มุมมอง
schedule
02.01.2024
จะลบอักขระหรือสัญลักษณ์พิเศษออกจาก URL เริ่มต้นของ Scrapy ได้อย่างไร
ฉันได้รับ Scrapy Spider และเมื่อฉันเรียกใช้โค้ด ฉันได้รับข้อผิดพลาดนี้
ละเว้นการตอบสนอง ‹302 https://www.macys.com/ >: รหัสสถานะ HTTP ไม่ได้รับการจัดการหรือ ไม่ได้รับอนุญาต
นี่แมงมุมของฉัน
import scrapy
import urllib.parse
import...
94 มุมมอง
schedule
26.11.2023
คำถามเกี่ยวกับความปลอดภัยของเธรดสำหรับคอลเลกชัน Python ใน Scrapy Item Pipelines (ใช้ Twisted สำหรับการใช้งานพร้อมกัน)
Scrapy มีแนวคิดของ Item Pipelines ที่ ประมวลผลพร้อมกัน (ผ่าน Twisted) รายการที่ส่งคืนจาก Scrapy แมงมุม ตัวอย่างโค้ดต่อไปนี้มีไว้สำหรับ การกรองรายการที่ซ้ำกัน (คัดลอกโค้ดด้านล่าง) เป็นไปได้อย่างไรที่ set...
68 มุมมอง
schedule
15.12.2023