Я создаю текстовый классификатор для классификации отзывов как положительных или отрицательных. У меня есть запрос на NaiveBayes классификаторов формуле:Запрос о NaiveBayes Классификатор
| P(label) * P(f1|label) * ... * P(fn|label)
| P(label|features) = --------------------------------------------
| P(features)
Согласно моему пониманию, вероятности умножаются, если события происходят одновременно. Например. какова вероятность того, что А и В встречаются вместе. Уместно ли умножать вероятности в этом случае? Цените, если кто-нибудь может объяснить эту формулу в деталях. Я пытаюсь сделать ручную классификацию (просто чтобы проверить некоторые алгоритмы, сгенерированные классификациями, которые кажутся незначительными, это позволит мне определить точную причину ошибочной классификации).
В базовых вероятностных выражениях для вычисления p (метка | feature1, feature2) мы должны умножить вероятностные числа для вычисления появления признаков 1 и функции 2 вместе. Но в этом случае я не пытаюсь рассчитать стандартную вероятность, а силу положительности/негативности текста. Поэтому, если подытожить вероятности, я получаю число, которое может идентифицировать фактор положительности/отрицательности. Это немного необычно, но как вы думаете, это может дать хорошие результаты. Причина в том, что сумма и продукт могут быть совершенно разными. Например. 2 * 2 = 4, но 3 * 1 = 3
В базовых вероятностных выражениях для вычисления p (label | feature1, feature2) мы должны умножить вероятностные числа для вычисления вероятности появления признака 1 и функцию 2 вместе. Но в этом случае я не пытаюсь рассчитать стандартную вероятность, а силу положительности/негативности текста. Поэтому, если подытожить вероятности, я получаю число, которое может идентифицировать фактор положительности/отрицательности. Это немного необычно, но как вы думаете, это может дать хорошие результаты. Причина в том, что сумма и продукт могут быть совершенно разными. Например. 2 * 2 = 4, но 3 * 1 = 3 –
@AmitAgarwal: Я не думаю, что это правильный подход. Пожалуйста, проголосуйте за мой ответ, если вы сочтете это полезным. – stackoverflowuser2010
@ stackoverflowuser2010, см. Мой ответ выше. Не мог вписаться в комментарии. –