Я новичок в парсинге веб-страниц и мог бы использовать некоторую помощь. Я хотел бы очистить стартовый состав НБА, команды и позиции игроков, используя Xpath. Я только начал с имен, потому что столкнулся с проблемой.
Вот мой код:
from urllib.request import urlopen
from lxml.html import fromstring
url = "https://www.lineups.com/nba/lineups"
content = str(urlopen(url).read())
comment = content.replace("-->","").replace("<!--","")
tree = fromstring(comment)
for nba, bball_row in enumerate(tree.xpath('//tr[contains(@class,"t-content")]')):
names = bball_row.xpath('.//span[@_ngcontent-c5="long-player-name"]/text()')[0]
print(names)
Похоже, программа работает без ошибок, но имена не печатаются. Мы будем очень признательны за любые советы о том, как более эффективно анализировать использование Xpath. Я пытался возиться с помощником Xpath и Xpath Finder. Возможно, есть какие-то хитрости, облегчающие процесс. Заранее спасибо за ваше время и усилия!