2013-12-05 7 views
0

Это более общий вопрос, который мне не удалось найти. Я пытаюсь найти корреляцию между двумя наборами данных с целью сопоставления их с определенным процентом корреляции. Они не будут точными совпадениями, но в основном будут находиться в пределах 1%, хотя, вероятно, будут некоторые выбросы. Например, каждый 100-й пункт может быть отключен на 5%, возможно, больше.Статистические функции для корреляции между двумя наборами данных в R

Я также пытаюсь найти случаи, когда набор данных может соответствовать другому, но имеет разную величину. Например, если вы умножили все данные на множитель, вы получите совпадение. Очевидно, не было бы смысла прокручивать тонну возможных множителей. Я рассматриваю попытку сопоставить положительные и отрицательные наклоны как + 1/-1, так как наклон не будет работать. Хотя в некоторых случаях это не сработает, так как данные очень гранулированы и, следовательно, могут соответствовать форме данных, но если вы увеличите масштаб наклона, вы отключите его.

Есть ли встроенные функции в R? У меня нет статистического фона, и мои поиски в основном касались того, как обрабатывать один набор данных и выбросы в них.

+1

один вариант - это тест на камин, основанный на расстояниях, попробуйте 'mantel.rtest', – Ananta

ответ

1

Для основной Pearson Спирмен или Kendall корреляции, вы можете использовать функцию кора():

x <- c(1, 2, 5, 7, 10, 15) 
y <- c(2, 4, 6, 9, 12, 13) 

cor(x, y, use="pairwise.complete.obs", method="pearson") 

Вы собираетесь хотите настроить «использование» и опцию «метод», основанное на ваши данные. Поскольку вы не указали характер ваших данных, я не могу дать вам более конкретные указания.

Смежные вопросы