ฉันได้เขียนสคริปต์ด้วยภาษาไพธอนเพื่อแยกวิเคราะห์บทช่วยสอนต่างๆ tiles
และ links
บางส่วนจากหน้าเว็บ และสุดท้ายก็เขียนบทช่วยสอนเหล่านั้นลงในไฟล์ Excel ฉันเคยใช้ openpyxl
สคริปต์ของฉันทำงานได้ดีหากฉันต้องการรับเอกสารทั้งหมดในแผ่นงานเดียว อย่างไรก็ตาม ฉันใช้ลิงก์สามลิงก์ในมีดโกนเพื่อดึงข้อมูลออกมา เป้าหมายของฉันคือการเขียนเอกสารที่คัดลอกมาเหล่านั้นเป็นแผ่นงานที่แตกต่างกันสามแผ่นในไฟล์ Excel ฉันจะบรรลุเป้าหมายนั้นได้อย่างไร? ขอบคุณล่วงหน้า.
นี่คือสิ่งที่ฉันได้เขียนไปแล้ว:
import requests
from urllib.parse import urljoin
from lxml.html import fromstring
from openpyxl import Workbook
wb = Workbook()
wb.active
ws = wb.worksheets[0]
storage ={
'http://www.wiseowl.co.uk/videos/year/2011.htm',
'http://www.wiseowl.co.uk/videos/year/2012.htm',
'http://www.wiseowl.co.uk/videos/year/2013.htm'
}
def get_docs(link):
response = requests.get(link)
root = fromstring(response.text)
for item in root.cssselect(".woVideoListDefaultSeriesTitle"):
title = item.cssselect("a")[0].text
title_link = item.cssselect("a")[0].attrib['href']
print(title,title_link)
ws.append([title,title_link])
wb.save("tuts.xlsx")
if __name__ == '__main__':
for tut_link in storage:
get_docs(tut_link)
เป็นอีกครั้งที่สคริปต์ของฉันสามารถขูดเอกสารและเขียนเอกสารเหล่านั้นลงในแผ่นงานเดียวในไฟล์ Excel แต่ฉันต้องการให้เอกสารที่เขียนเป็นแผ่นงานที่แตกต่างกันสามแผ่น (แต่ละแผ่นสำหรับแต่ละลิงก์) ในไฟล์ Excel