2013-09-10 3 views
0

Я использую Weka в программе Java для классификации некоторых текстовых документов и хорошо работаю с классификатором NaiveBayesMultinomial.Weka - Как найти формат ввода для классификаторов

Однако я не могу найти документацию о том, как я могу фильтровать свои экземпляры (или файл ARFF), чтобы они могли быть приняты в качестве входных данных другими классификаторами. Если я загружу ARFF в графический интерфейс Weka Explorer, то большинство классификаторов будут выделены серым цветом. Использование фильтра StringToWordVector не влияет на это, и я также попробовал несколько других.

Может ли кто-нибудь сказать мне, как я могу подготовить свои данные, чтобы их могли принимать другие классификаторы, например, NaiveBayes, JRip или BayesNet?

ответ

0

В графическом интерфейсе WEKA Explorer, когда вы применяете StringToWordVector, прежний атрибут класса чаще всего переносится как первый атрибут, поэтому он не определяется как класс по умолчанию. Когда вы находитесь на вкладке «Классификация», убедитесь, что в качестве класса для вашего эксперимента выбран правильный атрибут.

Другим потенциальным источником проблем является то, что класс является числовым, тем самым предотвращая применение некоторых алгоритмов (которые ожидают номинальный класс).

Если это не поможет решить вашу проблему, отправьте отрывок из вашего файла ARFF (извлечение заголовка плюс один экземпляр), чтобы мы могли предоставить более точный совет.

Смежные вопросы