2015-09-14 2 views
0

Я использовал кодплотность/частота и вероятность в Hist()

hist(x, probability=TRUE) 

, который дает мне ось у от 0 до 2 с плотностью имен. Я не понимаю, что это значит. Интегрируется ли она в 1, суммирование до 1 или значение y, равное? В документации указано «freq = NULL, вероятность =! Freq», но это не имеет смысла для меня. Если я не использую вероятность = TRUE, я получаю Frequency по оси y, но форма графика такая же.

ответ

2

Вы можете сохранить свою гистограмму в переменной и взглянуть на нее.

x=rnorm(1000) 
h<-hist(x) 

enter image description here

h 

$breaks 
[1] -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 

$counts 
[1] 2 8 24 42 87 169 188 189 146 78 38 23 5 0 1 

$density 
[1] 0.004 0.016 0.048 0.084 0.174 0.338 0.376 0.378 0.292 0.156 0.076 0.046 0.010 0.000 0.002 

$mids 
[1] -3.25 -2.75 -2.25 -1.75 -1.25 -0.75 -0.25 0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75 

$xname 
[1] "x" 

$equidist 
[1] TRUE 

attr(,"class") 
[1] "histogram" 

По умолчанию участки частоты (можно получить через час $ подсчетов), который является только количество точек, которые получают в каждом интервале. Общая сумма баллов равна длине вектора, который вы можете проверить с

sum(h$counts) 
[1] 1000 

Если вы укажете probability=TRUE, он будет строить вероятность каждой точке получать в течение каждого интервала. Общая сумма вероятностей, умноженная на ширину полосы, должна быть равна 1. В нашем случае ширина штанги равна 0,5, поэтому получаем

sum(h$density*0.5) 
[1] 1 
+0

Если «вероятность = ИСТИНА» задает проблему. каждой точки, попадающей в каждый интервал, тогда я не понимаю, как значения могут быть больше 1 (моя ось равна 0-2 со значением больше 1) – Camilla

+0

'sum (h $ density * 0.05)' истинно равно 1 – Camilla

+0

Если у вас есть полоса шириной менее 1, плотность действительно может быть больше 1. Общая вероятность всегда рассчитывается как плотность вероятности, умноженная на длину интервала. –