Как спроецировать новую точку на новую основу, используя атрибут 'components_' PCA из пакета sklearn.decomposition?

У меня есть некоторые точки данных с 3 координатами, и с помощью функции PCA я преобразовал их в точки, имеющие 2 координаты, сделав это.

import numpy as np
from sklearn.decomposition import PCA
X = np.array([[-1, -1, -3], [-2, -1, -1], [-3, -2, -2], [1, 1, 1], [2, 1, 5], [3, 2, 6]]) #data
pca = PCA(n_components=2)
pca.fit(X)
PCA(copy=True, n_components=2, whiten=False)
XT = pca.fit_transform(X)
print XT
#output obtained
#[[-4.04510516 -1.24556106]
#[-2.92607624  0.61239898]
#[-4.55000611  1.13825234]
#[ 0.81687144 -1.11632484]
#[ 4.5401931   0.56854397]
#[ 6.16412297  0.04269061]]

Я получил главные оси в пространстве признаков, представляющие направления максимальной дисперсии данных с использованием атрибута 'components_'

W = (pca.components_)
print W
# output obtained
#[[ 0.49508794  0.3217835   0.80705843]
# [-0.67701709 -0.43930775  0.59047148]]

Теперь я хотел спроецировать первую точку [-1, -1, -3] (которая является первой точкой в X) на 2D-подпространство, используя атрибут 'components_', выполнив это

projectedXT_0 = np.dot(W,X[0])
print projectedXT_0
#output obtained
#[-3.23804673 -0.65508959]

#expected output
#[-4.04510516 -1.24556106]

Я не получаю того, что ожидал, поэтому, очевидно, я делаю что-то неправильно при вычислении ProjectedPoint с использованием атрибута «components_». Пожалуйста, продемонстрируйте использование атрибута 'components_' для получения проекции точки.

ПРИМЕЧАНИЕ. Я знаю, что это делает функция «преобразования», но я хочу использовать атрибут «components_».

scikit-learn

Ashwin D V 30.12.2015 источник

Ответы (1)

arrow_upward
2
arrow_downward

Вы забыли вычесть среднее.

См. источник преобразования PCA:

if self.mean_ is not None:
    X = X - self.mean_
X_transformed = fast_dot(X, self.components_.T)
if self.whiten:
    X_transformed /= np.sqrt(self.explained_variance_)
return X_transformed

lejlot 30.12.2015

Как спроецировать новую точку на новую основу, используя атрибут 'components_' PCA из пакета sklearn.decomposition?

Ответы (1)

Вопросы по теме