2015-07-22 2 views
0

У меня есть данные в диапазоне от 19 до 49. Как я могу рассчитать вероятность того, что данные произошли между 25 и 40?вычисление вероятности из данных длинной серии в python pandas

46.58762816 
30.50477684 
27.4195249 
47.98157313 
44.55425608 
30.21066503 
34.27381019 
48.19934524 
46.82233375 
46.05077036 
42.63647302 
40.11270346 
48.04909583 
24.18660332 
24.47549276 
44.45442651 
19.24542913 
37.44141763 
28.41079638 
21.69325455 
31.32887617 
26.26988582 
18.19898804 
19.01329026 
28.33846808 
+0

Вы просто хотите подсчитать значения, находящиеся между 25 и 40, и делить этот счет на общее количество значений? –

+0

Да, я думаю, что это также будет работать @ ajcr – bikuser

+0

Это просто образец ваших данных или всего? –

ответ

3

Простейшее вы можете сделать, это использовать% значений, попадающих между 25 и 40.

Если s это ваш pandas.Series вы нам дали:

In [1]: s.head() 
Out[1]: 
0 46.587628 
1 30.504777 
2 27.419525 
3 47.981573 
4 44.554256 
Name: 0, dtype: float64 

In [2]: # calculate number of values between 25 and 40 and divide by total count 
s.between(25,40).sum()/float(s.count()) 
Out[2]: 0.3599 

В противном случае это потребует пытаться чтобы узнать, какое распространение могут иметь ваши данные (из данных, которые вы указали, что может быть всего лишь небольшим образцом ваших данных, похоже, что оно не соответствует никакому распространению, которое я знаю ...), проверяя, действительно ли оно следует за распределение, которое вы думаете, следует (u пойте тест Колмогорова-Смирнова или другой, как он), то вы можете использовать это распределение для расчета вероятности и т. д.

+0

Огромное спасибо, теперь я получил его и его работу thankz alot :) – bikuser