2013-02-13 2 views
0

У меня есть набор выборок (векторов), каждый из которых имеет размерность M (10000), а размер набора также около N (10000), и я хочу найти сначала (с самыми большими eiegenvalues) 10 ПК этого набора. Из-за большого размера образцов я не могу вычислить матрицу ковариации в разумные сроки. Существуют ли какие-либо методы для выбора ПК без вычисления полной матрицы cov или методов, которые могут эффективно обрабатывать большие размеры данных или что-то вроде этого? Таким образом, эти методы требуют меньше операций, чем O (M * M * N).Принципиальный анализ компонентов с очень большим размером данных

ответ

Смежные вопросы