2015-08-11 8 views
0

Я работаю над примером, понимающим классификацию Наивного Байеса, и задаюсь вопросом, правилен ли мой мыслительный процесс. Таким образом, у меня есть три пользователя, и правда или ложь, если у них есть обувь Nike или Reebok, или и то, и другое. Таким образом, пользователи могут иметь более одной пары обуви. Я хочу рассчитать вероятность Reebok, если они владеют Nike. Вот мои данные:Stuck on Naive Bayes Классификация

User | Nike | Reebok 
Jesse | true | false 
Jake | false | true 
John | true | true - only user with both 

Вот как я пытаюсь сделать это:

1) P(both | Reebok) = 1/2 = 50% 
2) Prior Prob = P(both | total user = 1/3 = 33% 
3) P(Reebok | total user = 2/3 = 67% 
4) Posterior Prob = (50% * 33%)/67% = 25% 

Так что результат будет, если пользователь принадлежит Nike, они имеют заднюю вероятность на 25% владения Reebok годов.

+0

Я не понимаю ваш сложный расчет, но вы явно P (оба/только Reebok) должны быть 0, потому что вы можете иметь «оба», если у вас есть только «reebok». Если вы имеете в виду P (оба | reebok), то это 50%, и то же самое для P (оба | nike), поэтому вы получите прямой ответ. – Holt

+0

@ Holt - извините предположение, что пользователь может иметь более одной пары туфель. – jKraut

+0

Я голосую, чтобы закрыть этот вопрос не по теме, потому что это математический вопрос. Это было бы более уместно на math.stackexchange.com – DPenner1

ответ

0

По Bayes' theorem:

p(Reebok | Nike) = p(Reebok) p(Nike | Reebok)/p(Nike) 

В вашем примере:

  • p(Reebok) = 2/3
  • p(Nike) = 2/3
  • p(Nike | Reebok) = 1/2

Итак, результат p(Reebok | Nike) = 1/2 как и ожидалось.

+0

Итак, я рассчитал вероятность на 25%, но, согласно вашему ответу, это 50%. Мне нужно изменить свою логику. Будет ли Наивный Байес давать другой ответ? – jKraut

+0

@jKraut Нет, другого ответа нет. У вас нет независимой переменной 'Both'. Вы можете прямо проверить, что правильный результат равен 50%: Джейк и Джон принадлежат Nike, и только 50% из них принадлежат Reebok. –

+0

@jKraut Вы можете играть с более интересными случаями, когда 'p (Reebok | Nike)' не равно 'p (Nike | Reebok)', например, вы можете добавить четвертого пользователя, которому принадлежит только 'Reebok' –

Смежные вопросы