Невозможно найти a priori какое распределение некоторые данные (особенно с низким значением n, как в вашем примере).
Если у вас есть идея процесса, сгенерированного вашими данными, вы можете получить представление о том, какие дистрибутивы тестируются. Возможно, ваши данные поступают из семейства гамма-дистрибутивов, возможно, ваши данные поступают из семейства распределений Weibull и т. Д. Затем вы можете подобрать эти общие дистрибутивы и посмотреть, могут ли они упростить более распространенное распространение.
Для визуального представления того, насколько хорошо ваши данные могут аппроксимировать определенный дистрибутив, вы можете использовать PROBPLOT.
Как только вы определили возможные дистрибутивы, вы можете поместить их в данные и использовать Bayesian Information Criterion (BIC), чтобы сравнить, какое соответствие лучше всего описывает данные. Обратите внимание, что, если у вас нет огромного количества беспотенциальных данных, невозможно определить, какая из них подходит, если у вас есть несколько возможных распределений со сравнительно низким BIC.
Правда. Я надеялся на что-то более автоматизированное. – SkypeMeSM
@SkypeMeSM: Подгоняющая часть может быть автоматизирована. – zellus