ฉันกำลังพยายามลบรายการที่ซ้ำกันสำหรับคอลัมน์ D สำหรับข้อมูลไดนามิกที่ไม่มีส่วนหัวหรือคุณลักษณะการระบุ ฉันกำลังพยายามลบแถวทั้งหมดที่มีการซ้ำกันสำหรับคอลัมน์ D ฉันกำลังแปลง Excel เป็นดาต้าเฟรม ลบรายการที่ซ้ำกันออกแล้วใส่กลับเข้าไปใน Excel อย่างไรก็ตาม ฉันยังคงได้รับข้อผิดพลาดหลายประเภทหรือไม่มีการลบรายการที่ซ้ำกันออก ฉันมาจากพื้นหลัง VBA แต่เรากำลังย้ายไปยัง Python
พยายาม:
df.drop_duplicates(["C"])
df = pd.DataFrame({"C"})
df.groupby(["C"]).filter(lambda df:df.shape[0] == 1)
As well an assortment of other variations. I was able to do this in VBA with one line. Any ideas why this keeps causing this issue.
\\ import pandas as pd
df = pd.DataFrame({"C"]})
df.drop_duplicates(subset=[''C'], keep=False)
DG=df.groupby([''C'])
print pd.concat([DG.get_group(item) for item, value in DG.groups.items() if len(value)==1])
ฉันสามารถทำได้ใน VBA ด้วยบรรทัดเดียว แนวคิดใด ๆ ว่าทำไมสิ่งนี้ถึงทำให้เกิดปัญหานี้
โค้ดเอง เทมเพลต-
df = pd.read_excel("C:/wadwa.xlsx", sheetname=0)
columns_to_drop = ['d.1']
#columns_to_drop = ['d.1', 'b.1', 'e.1', 'f.1', 'g.1']
import pandas as pd
Df = df[[col for col in df.columns if col not in columns_to_drop]]
print(df)
writer = pd.ExcelWriter('C:/dadwa/dwad.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
รหัส:
import pandas as pd
df = pd.read_excel("C:/Users/Documents/Book1.xlsx", sheetname=0)
import pandas as pd
df = df.drop_duplicates(subset=[df.columns[3]], keep=False)
writer = pd.ExcelWriter('C:/Users//Documents/Book2.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
df = df.drop_duplicates(subset=['C'], keep=False)
- person jezrael   schedule 08.11.2017