Я написал скрипт на python, чтобы проанализировать некоторые tiles
и links
различных руководств с веб-страницы и, наконец, записать их в файл Excel. Я использовал openpyxl
. Мой сценарий работает нормально, если я рассчитываю получить все документы на одном листе. Тем не менее, я использовал три ссылки в своем парсере для извлечения данных. Моя цель - написать эти очищенные документы на трех разных листах в файле Excel. Как я могу этого добиться? Заранее спасибо.
Вот что я написал до сих пор:
import requests
from urllib.parse import urljoin
from lxml.html import fromstring
from openpyxl import Workbook
wb = Workbook()
wb.active
ws = wb.worksheets[0]
storage ={
'http://www.wiseowl.co.uk/videos/year/2011.htm',
'http://www.wiseowl.co.uk/videos/year/2012.htm',
'http://www.wiseowl.co.uk/videos/year/2013.htm'
}
def get_docs(link):
response = requests.get(link)
root = fromstring(response.text)
for item in root.cssselect(".woVideoListDefaultSeriesTitle"):
title = item.cssselect("a")[0].text
title_link = item.cssselect("a")[0].attrib['href']
print(title,title_link)
ws.append([title,title_link])
wb.save("tuts.xlsx")
if __name__ == '__main__':
for tut_link in storage:
get_docs(tut_link)
Еще раз, мой сценарий может очищать документы и записывать их на одном листе в файле Excel, но я хочу, чтобы документы были записаны на трех разных листах (каждый лист для каждой ссылки) в файле Excel.