Saya telah menulis skrip dengan python untuk mengurai beberapa tiles
dan links
tutorial berbeda dari halaman web dan akhirnya menulisnya dalam file excel. Saya telah menggunakan openpyxl
. Skrip saya berfungsi dengan baik jika saya mempertimbangkan untuk mendapatkan semua dokumen dalam satu lembar. Namun, saya telah menggunakan tiga tautan di scraper saya untuk mengambil data. Tujuan saya adalah menulis dokumen-dokumen bekas itu dalam tiga lembar berbeda dalam file excel. Bagaimana saya bisa mencapainya? Terima kasih sebelumnya.
Inilah yang saya tulis sejauh ini:
import requests
from urllib.parse import urljoin
from lxml.html import fromstring
from openpyxl import Workbook
wb = Workbook()
wb.active
ws = wb.worksheets[0]
storage ={
'http://www.wiseowl.co.uk/videos/year/2011.htm',
'http://www.wiseowl.co.uk/videos/year/2012.htm',
'http://www.wiseowl.co.uk/videos/year/2013.htm'
}
def get_docs(link):
response = requests.get(link)
root = fromstring(response.text)
for item in root.cssselect(".woVideoListDefaultSeriesTitle"):
title = item.cssselect("a")[0].text
title_link = item.cssselect("a")[0].attrib['href']
print(title,title_link)
ws.append([title,title_link])
wb.save("tuts.xlsx")
if __name__ == '__main__':
for tut_link in storage:
get_docs(tut_link)
Sekali lagi, skrip saya dapat mengikis dokumen dan menuliskannya dalam satu lembar dalam file excel tetapi saya ingin dokumen tersebut ditulis dalam tiga lembar berbeda (setiap lembar untuk setiap tautan) dalam file excel.