Классифицировать набор данных (stringToWord) фильтр weka

-1

Я новичок в weka.Классифицировать набор данных (stringToWord) фильтр weka

У меня есть набор данных (данные twitter) о конкретной компании .. Фильтр, который я использовал: string to word .., и я изменяю параметр wordstokeep = 100, чтобы повысить точность. затем я применил классификаторов: KSTAR 55%, RandomForest 57%, SMO 58% это не то, что самый хороший результат ..

есть какие-либо идеи, которые помогут мне улучшить это очень хорошо> >

источник

2016-04-29 user2199395

У вас может быть слишком мало учебных данных для разнообразных данных, таких как твиттер. –

Сначала попробуйте предварительно обработать ваши данные. Данные Twitter содержат много шума. Удалить:

URL
ретвитов
Hashtags
Специальные символы Еще одна вещь, которую вы можете сделать, это использование п-грамм. Попробуйте разные n-граммы и проверьте, какой из них вам больше всего подходит. Мое занятие - пойти с униграммами + bigrams.

Я также предлагаю использовать naiveBayesMultinomial классификатор. Лучше всего работать с текстовой классификацией и особенно в аналитическом анализе. Кроме того, это очень быстро. Если вы хотите, чтобы код предварительно обрабатывал данные, дайте мне знать :)

источник

2016-04-30 03:10:34

Классифицировать набор данных (stringToWord) фильтр weka

ответ

Смежные вопросы