Хе там! Мне просто нужна помощь для реализации алгоритма классификации текста наивного байеса в Java, чтобы просто проверить набор данных для исследовательских целей. Обязательно реализовать алгоритм в Java; скорее используя инструменты Weka или Rapid Miner, чтобы получить результаты!Алгоритм классификации текста наивного байеса Наивный Байес
Мои Наборы данные имеют следующий вид данных:
Doc Words Category
означает, что у меня есть учебные слова и категория для каждой тренировки (String), известной заранее. Некоторые из набора данных приводится ниже:
Doc Words Category
Training
1 Integration Communities Process Oriented Structures...(more string) A
2 Integration Communities Process Oriented Structures...(more string) A
3 Theory Upper Bound Routing Estimate global routing...(more string) B
4 Hardware Design Functional Programming Perfect Match...(more string) C
.
.
.
Test
5 Methodology Toolkit Integrate Technological Organisational
6 This test contain string naive bayes test text text test
SO Набор данных поступает из базы данных MySQL, и он может содержать несколько строк учебных и тестовых строк, как хорошо! Дело в том, что мне просто нужно реализовать алгоритм классификации текста наивного байеса в Java.
Алгоритм должен следовать следующий пример упоминается hereТаблица 13.1
Источник: Read here
Дело в том, что я могу реализовать алгоритм в Java кодекса сам, но я просто нужно знать, возможно ли, что существует какая-то библиотека Java с документацией исходного кода, которая позволяет мне просто проверять результаты.
Проблема заключается в том, что мне просто нужны результаты всего за один раз, это означает, что это просто проверка результатов.
Итак, расскажите, пожалуйста, о какой-либо хорошей библиотеке java, которая помогает моему коду использовать этот алгоритм на Java, и это могло бы сделать мой набор данных возможным для обработки результатов, или кто-нибудь может дать мне хорошие идеи о том, как делайте это легко ... что-то хорошее, что может мне помочь.
Буду благодарен вам за помощь. Заранее спасибо
Где вы работаете? –
Вопросы, предлагающие нам рекомендовать или находить книгу, инструмент, библиотеку программного обеспечения, учебник или другой ресурс вне сайта, не относятся к теме для переполнения стека. – RandomSeed