Saya mencoba menghapus duplikat untuk Kolom D untuk data dinamis tanpa header atau fitur pengidentifikasi. Saya mencoba menghapus semua baris yang terdapat duplikat untuk Kolom D. Saya mengonversi excel menjadi kerangka data, menghapus duplikat, dan kemudian memasukkannya kembali ke excel. Namun saya tetap mendapatkan berbagai macam kesalahan atau tidak ada duplikat yang dihapus. Saya berasal dari latar belakang VBA tetapi kami bermigrasi ke Python
Mencoba:
df.drop_duplicates(["C"])
df = pd.DataFrame({"C"})
df.groupby(["C"]).filter(lambda df:df.shape[0] == 1)
As well an assortment of other variations. I was able to do this in VBA with one line. Any ideas why this keeps causing this issue.
\\ import pandas as pd
df = pd.DataFrame({"C"]})
df.drop_duplicates(subset=[''C'], keep=False)
DG=df.groupby([''C'])
print pd.concat([DG.get_group(item) for item, value in DG.groups.items() if len(value)==1])
Saya bisa melakukan ini di VBA dengan satu baris. Adakah alasan mengapa hal ini terus menyebabkan masalah ini.
Kode itu sendiri Templat-
df = pd.read_excel("C:/wadwa.xlsx", sheetname=0)
columns_to_drop = ['d.1']
#columns_to_drop = ['d.1', 'b.1', 'e.1', 'f.1', 'g.1']
import pandas as pd
Df = df[[col for col in df.columns if col not in columns_to_drop]]
print(df)
writer = pd.ExcelWriter('C:/dadwa/dwad.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
Kode:
import pandas as pd
df = pd.read_excel("C:/Users/Documents/Book1.xlsx", sheetname=0)
import pandas as pd
df = df.drop_duplicates(subset=[df.columns[3]], keep=False)
writer = pd.ExcelWriter('C:/Users//Documents/Book2.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
df = df.drop_duplicates(subset=['C'], keep=False)
- person jezrael   schedule 08.11.2017