0

Я работаю над проектом, в котором у меня около 18 классов с примерно 4000 экземпляров. У меня есть 7 атрибутов, 1 - строковые данные, остальные - номинальные. В настоящее время я использую StringToWordVector для атрибута строки с классификатором SMO Platt, обеспечивая хорошие результаты. Мы собираемся реализовать это, но я бы хотел попробовать другие классификаторы в случае, если возможно, я получу лучшие результаты. Какие-либо предложения?Проект Weka Classification с использованием StringToWordVector и SMO ​​

Кроме того, следует ли использовать MultiClassClassifier с таким количеством классов? Если да, то какие настройки я должен попробовать в этом?

Любые советы приветствуются!

+0

Попробуйте мультиномиальный наивный байесовский классификатор. Предпочтительная текстовая классификация для It дает результаты наравне с SVM. Это будет быстрее. –

+0

Multinomial Naive Bayes несовместим с многозначными номинальными атрибутами - это ошибка, которую я получаю, когда пытаюсь запустить модель. Наивные заливы выполнялись на 20% меньше точности, чем SMO. Я еще не пробовал все возможности с MuliClassClassifier и Naive Bayes, но я не вижу, чтобы он работал намного лучше. Спасибо за рекомендацию, хотя! –

ответ

0

AdaBoosted J48 Decision Tree дал лучшие результаты были хорошо известен в нашей дивизии

Смежные вопросы