Я хотел бы продемонстрировать, как ширина 95% -ного доверительного интервала вокруг корреляции изменяется с увеличением размера выборки от n = 10 до n = 100 с шагом в 5 выборок за раунд. Я бы предположил, что мы можем использовать функцию бутстрапа для этого и тиражировать каждый раунд 1000 раз. Как это можно сделать в R? См: http://www.nicebread.de/at-what-sample-size-do-correlations-stabilize/Коррекция корреляции бутстрапа с увеличением размера выборки
Мы можем использовать данные алмазов:
data(diamonds)
x <- diamonds$price
y <- diamonds$carat
Очень приятно! Возможно ли это увеличить таким образом для каждого размера выборки (от 5 до 100) мы тиражируем розыгрыш 1000 раз и аналогичным образом сообщают среднее значение корреляции для каждого размера выборки плюс соответствующий верхний и нижний CI? [См. Ответ josilber ниже] – Nordenskiold
Итак, вы не ищете математически определенный доверительный интервал для корреляции с данным размером выборки, вы действительно хотите загружать 1000 наборов для каждого размера выборки и получать CI для распределения корреляций? Вы должны быть в состоянии сделать это, объединив наши ответы. Используйте его ответ, чтобы сгенерировать ваши образцы, а затем сделайте верхнюю и нижнюю границы geom_ribbon верхним и нижним значениями CI. –