ฉันยังใหม่กับการขูดเว็บและอาจช่วยได้บ้าง ฉันต้องการขูดรายชื่อผู้เล่นตัวจริงของ NBA ทีม และตำแหน่งของผู้เล่นโดยใช้ Xpath ฉันแค่เริ่มต้นด้วยชื่อเพราะฉันประสบปัญหา
นี่คือรหัสของฉันจนถึงตอนนี้:
from urllib.request import urlopen
from lxml.html import fromstring
url = "https://www.lineups.com/nba/lineups"
content = str(urlopen(url).read())
comment = content.replace("-->","").replace("<!--","")
tree = fromstring(comment)
for nba, bball_row in enumerate(tree.xpath('//tr[contains(@class,"t-content")]')):
names = bball_row.xpath('.//span[@_ngcontent-c5="long-player-name"]/text()')[0]
print(names)
ดูเหมือนว่าโปรแกรมจะทำงานโดยไม่มีข้อผิดพลาดแต่ชื่อไม่พิมพ์ออกมา คำแนะนำใดๆ เกี่ยวกับวิธีการแยกวิเคราะห์โดยใช้ Xpath อย่างมีประสิทธิภาพมากขึ้นจะได้รับการชื่นชมอย่างมาก ฉันพยายามยุ่งกับ Xpath helper และ Xpath Finder อาจมีเทคนิคบางอย่างเพื่อทำให้กระบวนการง่ายขึ้น ขอขอบคุณล่วงหน้าสำหรับเวลาและความพยายามของคุณ!