Предполагая мультиномиальное распределение для цвета и размера переменных, необходимо оценить следующие параметры:
Для цвета:
- : красный вероятность.
- : вероятность белого.
Типоразмер:
- : вероятность быть большим дано быть красным.
- : вероятность того, что данный большой белый.
- : вероятность быть маленькой, учитывая, что она красная.
- : вероятность быть маленькой, если быть белой.
что в конечном итоге только 3, так как
Вероятность есть вероятность наблюдаемых данных, приведенных модели, в этом случае для набора данных с n наблюдениями цвета и размера:
,
И параметры:
,
Вероятность определяется по формуле:
Поскольку мы имеем дело с Бернулли распределений здесь цвет и размер данного цвета, мы можем написать его так:
Где является подсчетом наблюдений, которые являются красным и маленькими, а другой Ms определяется аналогичным образом.
Наконец, за счет оптимизации функции правдоподобия, вы получаете оценщики параметров:
По вопросам статистики вы бы лучше задавать статистикам на http://stats.stackexchange.com/ – matcheek