Использование LabelEncoder sklearn в столбце фрейма данных

Если у меня есть фрейм данных, скажем, df, и если

df["levels"] = pd.Series(["low", "low", "med", "low", "med", "high"])

Есть ли способ изменить это на:

df["levels"] = pd.Series([0,0,1,0,1,2])

Я пробовал использовать preprocessing.LabelEncoder (), чтобы преобразовать это, но он просто сворачивается в [0,1,2]. Я знаю, что могу просто сделать это с помощью циклов for, но было бы здорово, если бы для этого уже существовал какой-нибудь инструмент. Любая помощь приветствуется!

Ammastaro 01.04.2018 источник

comment

Что значит рушится? Пожалуйста, покажите свой код - Vivek Kumar 02.04.2018

Ответы (2)

arrow_upward
1
arrow_downward

Есть два пути .. op1 category

pd.Series(["low", "low", "med", "low", "med", "high"]).astype('category').cat.codes
Out[1454]: 
0    1
1    1
2    2
3    1
4    2
5    0
dtype: int8

op2 factorize

pd.factorize(pd.Series(["low", "low", "med", "low", "med", "high"]))[0]
Out[1455]: array([0, 0, 1, 0, 1, 2], dtype=int64)

BENY 01.04.2018

arrow_upward
1
arrow_downward

Я не уверен, как вы использовали sklearn для кодирования столбца строк, поскольку это не было включено в исходный пост. Однако вы можете использовать LabelEncoder(), выполнив следующие действия.

from sklearn.preprocessing import LabelEncoder

le = LabelEncoder()
le.fit(df.levels.unique())
df.levels = le.transform(df.levels)

DJK 01.04.2018

comment

Я бы использовал: le.fit (df.levels.unique ()) или le.fit (df [levels] .unique ())? - Ammastaro; 02.04.2018

comment

@Ammastaro, вы можете использовать либо - DJK; 02.04.2018

Использование LabelEncoder sklearn в столбце фрейма данных

Ответы (2)

Вопросы по теме