Saya baru mengenal web scraping dan memerlukan bantuan. Saya ingin mengikis lineup awal NBA, tim dan posisi pemain menggunakan Xpath. Saya hanya memulai nama karena saya mengalami masalah.
Ini kode saya sejauh ini:
from urllib.request import urlopen
from lxml.html import fromstring
url = "https://www.lineups.com/nba/lineups"
content = str(urlopen(url).read())
comment = content.replace("-->","").replace("<!--","")
tree = fromstring(comment)
for nba, bball_row in enumerate(tree.xpath('//tr[contains(@class,"t-content")]')):
names = bball_row.xpath('.//span[@_ngcontent-c5="long-player-name"]/text()')[0]
print(names)
Sepertinya program berjalan tanpa kesalahan tetapi namanya tidak tercetak. Setiap tip tentang cara mengurai menggunakan Xpath dengan lebih efisien akan sangat dihargai. Saya mencoba mengotak-atik pembantu Xpath dan Xpath Finder. Mungkin ada beberapa trik agar prosesnya lebih mudah. Terima kasih sebelumnya atas waktu dan usaha Anda!