У меня есть блок данных с 49 переменными и 4M строками. Я хочу вычислить корреляционную матрицу 49 х 49. Все столбцы имеют числовое число.Ускорение вычисления корреляционной матрицы в R
Вот пример:
df <- data.frame(replicate(49,sample(0:50,4000000,rep=TRUE)))
Я использовал стандартную cor
функцию.
cor_matrix <- cor(df, use = "pairwise.complete.obs")
Это занимает очень много времени. У меня 16 ГБ оперативной памяти и i5 одноядерный 2,60 ГГц.
Есть ли способ сделать этот расчет быстрее на моем рабочем столе?
Вы можете проверить [здесь] (http://www.r-bloggers.com/bigcor-large-correlation-matrices-in-r/) – akrun
Ваша основная проблема - 'use =" pairwise.complete.obs " '. В моей системе (протестировано 12 столбцов), которая занимает в пять раз больше, чем 'use =" все ". – Roland