2015-05-27 2 views
1

Я использую этотggplot stat_summary медиана и boxplot медиана разногласие

ggplot(dfmergedrearrangemelted, aes(x = Var2, y=value)) + geom_boxplot()+ 
ggtitle("Values and Medians")+xlab(xlabel)+ylab("Magnitude (log10)")+ 
stat_summary(fun.y = median, geom = "point", position = position_dodge(width = .9), 
size = 6, shape = 4, show_guide = F)+ 
theme(axis.text.x=element_text(angle=90))+ 
scale_x_discrete(labels=namePosTargetGroupV2)+ 
scale_y_log10() 

сделать серию и присуща рефлективными, вербальным я отдельно пометил medans со й через stat_summary. Проблема в том, что медиана через stat_summary и медиана, которая является центральной линией в коробке, не согласуется во всех случаях. Это имеет тенденцию происходить, когда ящик boxplot находится ниже 0,1 на шкале log10. Любая идея, в чем причина?

+0

Возможно ли, потому что stat_summary и boxplot вычисляют медианную с различной точностью? –

ответ

0

Возможно, вам нужно log10 (медиана), так как это значения, рассчитанные для оси y. При низких значениях эти различия могут быть видны, но при более высоких значениях шкала логарифма появляется асимптотической для увеличения X, что означает, что любая дельта X даст очень маленькую дельту y.

+0

Но независимо от того, что шкала не должна быть медианной для boxplot, соответствует медианному для stat_summary? –

Смежные вопросы