2015-10-05 3 views
-2

Мне нужно создать классификатор, который будет классифицировать любую строку твита в определенную категорию. У меня около 15 или около того категорий. У меня есть набор учебных материалов со мной. Любые идеи, как я должен продолжать это? Для этого используйте Python или Java.Построение текстового классификатора

Я изучал классификаторы Textblob и Stanford NLP. Я просто не знаю, какой из них выбрать, чтобы добиться лучших результатов.

ответ

1

Мне нравится использовать scikit-learn для контролируемого обучения в Python. http://scikit-learn.org/stable/.

Для Java вы можете заглянуть в DKPro https://dkpro.github.io/, так как они использовали существующие инструментарий для различных задач NLP.

И, наконец, какой бы инструмент вы ни использовали, вы можете посмотреть, можете ли вы использовать TweetNLP http://www.ark.cs.cmu.edu/TweetNLP/ для компонента тегов POS.

Удачи вам!

Смежные вопросы