ฉันต้องอ่านไฟล์และแยกออกเป็นบรรทัด และแบ่งบรรทัดเหล่านั้นออกครึ่งหนึ่งด้วยอักขระแท็บ รวมถึงกำจัดเครื่องหมายคำพูดทั้งหมด ในขณะนี้ฉันมีฟังก์ชั่นการทำงาน อย่างไรก็ตาม มันค่อนข้างช้า:
temp = []
fp = open(fName, "r")
for line in fp:
temp.append(line.replace("\"","").rstrip("\n").split("\t"))
print temp
ซึ่งจะแยกไฟล์ออกเป็นรายการ จริงๆ แล้วมันอาจจะเป็นแค่รายการเดียวก็ได้ เพราะมันค่อนข้างง่ายที่จะแบ่งมันออกเป็นคู่ๆ ในภายหลังตราบใดที่คำสั่งซื้อยังคงอยู่
จะต้องมีวิธีที่เร็วกว่าในการทำเช่นนี้ ใครช่วยพาฉันไปถูกทางได้ไหม?
ขอบคุณ!
[แก้ไข] ไฟล์ที่ฉันทำงานด้วยมีขนาดใหญ่มาก แต่ฉันจะเพิ่มบางอย่างที่คล้ายกัน (มีวิธีอัพโหลดไฟล์บน stack overflow หรือไม่)
"CARMILLA" "35"
"JONATHAN R" "AA2"
"M" "3"
"EMMA" "350"
"OLD" "AA"
ควรกลับมา:
["CARMILLA", "35", "JONATHON R", "AA2", "M", "3", "EMMA", "350", "OLD", "AA"]
แม้ว่ารหัสของฉันจะส่งคืนเป็นรายการของ 2 สตริงซึ่งก็ใช้ได้เช่นกัน
ขออภัย ฉันน่าจะสังเกตว่าคำสั่ง print อยู่ในสถานะ return คำสั่ง - เนื่องจากฉันเอาสิ่งนี้ออกจากฟังก์ชัน ฉันจึงเปลี่ยนมันให้พิมพ์ ดังนั้นมันจึงสมเหตุสมผลมากขึ้นที่นี่