PCA - действительно полезный инструмент для уменьшения размерности, но его следует использовать, когда вы точно понимаете, что он делает и что вы получаете от него. За хорошее введение click here - это достойное объяснение, которое не так уж сложно. Существует также this article, который является быстрым прохождением DIY, что может помочь вам лучше понять, что происходит.
Как только вы знаете, что получаете, PCA is easy in matlab. Просто введите pca(X)
, и вы можете выполнить его наборы данных X
.
Что вы получаете, очень сильно зависит от того, что вы получаете (например, things like normalisation are very important for input data), и вы можете использовать дополнительные параметры, которые стоит знать, чтобы настроить анализ основных компонентов. See matlab's guide here.
Что вы ищете в уменьшении размерности, чтобы наилучшим образом представлять данные с минимальным количеством компонентов. Используя вывод explained
[coeff,score,latent,tsquared,explained] = pca(X)
, вы получаете вектор, рассказывающий, какая часть данных объясняется каждым основным компонентом, что дает вам хорошее представление о том, можно ли уменьшить размерность.
Добро пожаловать в SO! Посмотрите http://stackoverflow.com/tour. Обычно вы показываете, что вы пробовали, прежде чем задавать вопрос здесь. – brodoll
Удивленный, вы не использовали Google. Первым я нашел двойную ссылку. – rayryeng