Как и в кластеризация Дирихля, Дирихле процесс может быть представлен следующей:Как решить групповые задания в Дирихле процесс кластеризации
- Китайского ресторан Процесс
- Стик Ломать процесс
- Поли Урна Модель
например, если мы рассмотрим Chinese Restaurant Process
процесс выглядит следующим образом:
- Первоначально ресторан не заполнен
- Первый вход (Алиса) сидит за столом (выбирает группу ).
- Второй человек, который должен войти (Боб), садится за стол.
- В какой таблице он сидит?
- Он садится на новой таблицы с вероятностью
α/(1+α)
- Он сидит с на существующей таблицу с Алисой (значит, он будет присоединиться к существующей группе) с вероятностью
1/(1+α)
- The (n + 1) -ый человек сидит в новой таблице с вероятностью
α/(n+α)α/(n+α)
, а в таблице k с вероятностьюnk/(n+α)nk/(n+α)
, гдеnk
это количество людей, которые в настоящее время сидят g в таблице k.
Возникает вопрос:
Первоначально, первый человек присоединится, скажем, G1 (т.е. группа 1),
Теперь второй человек присоединится
new group = G2 with probability α/(1+α) = P(N)
existing group = G1 with probability 1/(1+α) = P(E)
Теперь, если я вычислить вероятности для новая запись, у меня будут значения для обоих томов P(N)
и P(E)
. Затем
- Как я решаю, что новая запись будет присоединяться к какой группе G1 или G2?
- Будет ли принято решение на основе значений обеих вероятностей?
As,
If (P(N) > P(E))
then
_new entry_ will join G2
AND
If (P(E) > P(N))
then
_new entry_ will join G1