2013-08-10 3 views
1

У меня есть вопрос, связанный с анализом данных и основным компонентом (PCA).Шум данных с PCA

Положение

У меня есть матрица данных, содержащий X, Y, Z совместные данные. Я применил PCA с условием сохранения 98% дисперсии. Однако даже после сокращения данные по-прежнему остаются очень шумными.

Проблема

Я провел несколько часов чтения, и я уверен в лучший подход принять. Мне нужно выполнить PCA для уменьшения размеров, однако шум, присутствующий в наборе данных, все еще вызывает несколько проблем. Мне нужен промежуточный шаг перед применением PCA для уменьшения шума, содержащегося в наборе данных. Мне сообщили, что Gaussian Smoothing может быть лучшим способом перед применением PCA.

Может ли кто-нибудь предложить лучший подход?

Редактировать Извините, что не ясно в моем вопросе.

Original data: Вот пример исходных данных. Projected: при сохранении 98% дисперсии.

PCA performed on matrix in the first 3 dimensions

Существует еще мало шума в проекции. По крайней мере, 4 очка не являются однородными при размещении.

+0

как можно 300-х-90 по X Y Z данных? сколько у вас очков и в каком измерении? какой шум у вас есть? как вы планируете сгладить данные? вы должны предоставить дополнительную информацию ... – Shai

+0

Не уверен, что размещение ссылок на файлы для загрузки приведет к повторному открытию вашего вопроса. – APC

+0

Я пытался помочь в улучшении моего вопроса. Есть ли у вас какие-либо предложения о том, как я могу предоставить образцы данных? – Dan

ответ

1

Хороший ресурс для надежного PCA - это работа Yi Ma and colleagues, "Robust Principal Component Analysis?".
Дополнительную информацию и исходный код можно найти на странице project homepage.

+0

Спасибо за предложение и ваше терпение - я уйду и посмотрю на него подробно и отчитаюсь. – Dan

Смежные вопросы