2015-02-26 3 views
0

У меня есть два массива. Один из них представляет собой массив реальных наблюдаемых значений -> размеры кластеров. Другим является массив размеров кластера, рассчитанный методом моделирования monte-carlo, поэтому мое точное распределение нулей. Я хотел бы преобразовать реальные наблюдаемые значения в p-значениях, поэтому я могу позже вычислить F-исправленные p-значения. Я могу сделать это элемент за элементом, но должен быть лучший способ:p-значения на основе точного распределения нулей

+1

что-то вроде '1 - numpy.searchsorted (np.sort (нуль), наблюдается)/LEN (наблюдается)' даст вам доля наблюдений в нуле, которая больше наблюдаемых значений (используйте 'side' для строгого или слабого неравенства) – user333700

ответ

1

проверить следующие тесты. Надеюсь, это полезно. Tukey's range test или новый тест множественного диапазона Дункана

И более подробную информацию можно найти в this page.

к сожалению, у меня не хватает репутации, чтобы положить в несколько ссылок ...

+0

вы неправильно поняли мой вопрос. Я хочу, чтобы найти p-значение для каждого числа из моего наблюдения против нулевого распределения. Итак, скажем, у меня есть кластер размером 25, я сортирую нулевые значения распределения и обнаруживаю, что 95 процентов из них ниже 25 и 5 процентов больше, поэтому p-значение 25 равно 0,05. Я хотел бы сделать это для всех наблюдений, поэтому я могу использовать statsmodel для его исправления – user2173836

Смежные вопросы