Я пытаюсь удалить дубликаты для столбца D для динамических данных без заголовков или идентифицирующих функций. Я пытаюсь удалить все строки, в которых есть дубликаты для столбца D. Я конвертирую excel в фрейм данных, удаляю дубликаты, а затем возвращаю их обратно в excel. Однако я продолжаю получать множество ошибок или не удалять дубликаты. Я работаю с VBA, но мы переходим на Python
Попытка:
df.drop_duplicates(["C"])
df = pd.DataFrame({"C"})
df.groupby(["C"]).filter(lambda df:df.shape[0] == 1)
As well an assortment of other variations. I was able to do this in VBA with one line. Any ideas why this keeps causing this issue.
\\ import pandas as pd
df = pd.DataFrame({"C"]})
df.drop_duplicates(subset=[''C'], keep=False)
DG=df.groupby([''C'])
print pd.concat([DG.get_group(item) for item, value in DG.groups.items() if len(value)==1])
Я смог сделать это в VBA с помощью одной строки. Любые идеи, почему это продолжает вызывать эту проблему.
Сам код Шаблон-
df = pd.read_excel("C:/wadwa.xlsx", sheetname=0)
columns_to_drop = ['d.1']
#columns_to_drop = ['d.1', 'b.1', 'e.1', 'f.1', 'g.1']
import pandas as pd
Df = df[[col for col in df.columns if col not in columns_to_drop]]
print(df)
writer = pd.ExcelWriter('C:/dadwa/dwad.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
Код:
import pandas as pd
df = pd.read_excel("C:/Users/Documents/Book1.xlsx", sheetname=0)
import pandas as pd
df = df.drop_duplicates(subset=[df.columns[3]], keep=False)
writer = pd.ExcelWriter('C:/Users//Documents/Book2.xlsx')
df.to_excel(writer,'Sheet1')
writer.save()
print(df)
df = df.drop_duplicates(subset=['C'], keep=False)
- person jezrael   schedule 08.11.2017