2014-11-30 2 views
1

В курсе «Вероятность и статистика» в Академии Хана по созданию сюжета с ящиками и усами есть упражнение. Вот screenshot, представляющий правильное решение. Но когда я попытался проверить решение в R я получил следующее:R: summary() возвращает странный 1-й Qu

d <- c(11, 4, 1, 4, 2, 2, 6, 10, 5, 6, 0, 6, 3, 3) 
summary(d) 
    Min. 1st Qu. Median Mean 3rd Qu. Max. 
    0.00 2.25 4.00 4.50 6.00 11.00 

Вы можете увидеть 2.25 значение 1 Qu. Но правильное значение равно 2. Любые другие значения, возвращаемые с помощью summary(), являются правильными. Любые идеи, почему summary() возвращает неправильный результат?

+0

Это вдохновило меня, чтобы задать соответствующий вопрос, и ответ аккуратный способ изменить 'type' используется в 'summary' http://stackoverflow.com/questions/27221720/r-change-quantile-type-within-summary-default – tospig

ответ

5

Вкратце, существует множество разумных способов вычисления квантилей. Об этом свидетельствуют девять методов (!), Поддерживаемых функцией quantile.

summary не является неправильным, он просто использует другой метод, который вы ожидаете. Вероятно, он использует метод по умолчанию 7 (называемый «тип 7» на странице справки). Как и большинство других методов, она выполняет линейную интерполяцию между двумя соседними значениями, 2 и 3.

Вы можете попробовать поэкспериментировать с другими методами, вызвав quantile с соответствующим type аргументом:

> quantile(s, type=1) 
    0% 25% 50% 75% 100% 
    0 2 4 6 11 
3

Я это очень же проблема. Я думаю, что это связано с используемым калькулятором type.

Эта статья объясняет это лучше, чем я могу: http://datapigtechnologies.com/blog/index.php/why-excel-has-multiple-quartile-functions-and-how-to-replicate-the-quartiles-from-r-and-other-statistical-packages/

Чтобы увидеть примеры:

quantile(d, probs=0.25) 
25% 
2.25 
quantile(d, probs=0.25, type=6) 
25% 
2 
Смежные вопросы