2013-02-15 4 views
0

Для моей диссертации мне необходимо сопоставить генетические данные с переменными окружающей среды (ENV). У меня есть матрица ENV для 18 групп населения, для которых я выполнил PCA, и обнаружил, что 99% дисперсии объясняются на первых 5 ПК.Интерпретация PCA

Теперь, когда у меня есть выходная матрица из анализа PCA, я хочу использовать эту матрицу вместо матрицы ENV (в целях уменьшения размерности и количества данных) для проверки корреляций с генетическими данными.

Вопрос в том, когда обнаружены некоторые существенные корреляции, как мы узнаем, к какой экологической переменной они относятся? Ясно, что я ничего не понимаю. Пожалуйста, совет.

+2

Кандидат на переезд на http://www.crossvalidated.com. Здесь нет вопросов программирования. –

ответ

2

Изучите матрицу $rotation, возвращенную prcomp.

Каждый ПК представляет собой линейную комбинацию ENV. Коэффициенты линейной комбинации для N-го ПК - это N-й столбец матрицы вращения.

+0

Отлично! Я вижу сейчас. Но я также заметил, что для PC1 все переменные среды вносят хотя бы что-то в компонент. Хотя вклады являются положительными и отрицательными. Что означают негативные вклады? – cryptic0

Смежные вопросы