Saya memiliki matriks numpy berikut:
M = [
['a', 5, 0.2, ''],
['a', 2, 1.3, 'as'],
['b', 1, 2.3, 'as'],
]
M = np.array(M)
Saya ingin menyandikan nilai kategorikal ('a', 'b', '', 'as'
). Saya mencoba menyandikannya menggunakan OneHotEncoder. Masalahnya adalah tidak berfungsi dengan variabel string dan menghasilkan kesalahan.
enc = preprocessing.OneHotEncoder()
enc.fit(M)
enc.transform(M).toarray()
Saya tahu bahwa saya harus menggunakan categorical_features
untuk menunjukkan nilai mana yang akan saya enkode dan saya pikir dengan memberikan dtype
saya akan dapat menangani nilai string, tetapi saya tidak bisa. Jadi apakah ada cara untuk menyandikan nilai kategorikal dalam matriks saya?