Я использую Weka в программе Java для классификации некоторых текстовых документов и хорошо работаю с классификатором NaiveBayesMultinomial.Weka - Как найти формат ввода для классификаторов
Однако я не могу найти документацию о том, как я могу фильтровать свои экземпляры (или файл ARFF), чтобы они могли быть приняты в качестве входных данных другими классификаторами. Если я загружу ARFF в графический интерфейс Weka Explorer, то большинство классификаторов будут выделены серым цветом. Использование фильтра StringToWordVector не влияет на это, и я также попробовал несколько других.
Может ли кто-нибудь сказать мне, как я могу подготовить свои данные, чтобы их могли принимать другие классификаторы, например, NaiveBayes, JRip или BayesNet?