2015-10-26 12 views
0

У меня есть набор для обучения и набор тестов, который я хочу классифицировать с помощью Weka. и потому, что мой атрибут - это текст. Я понимаю, что сначала должен применить сначала фильтр stringtoword. Как было описано here, я должен сделать следующее: 1- загрузить комплект для поездов и испытаний и применить фильтр. 2- Обучить классификатор с помощью учебного набора и сохранить модель. 3- Загрузите модель, чтобы применить ее на испытательном наборе.Прогнозирование множества тестовых наборов с помощью Weka

I мой эксперимент Я должен использовать обученный классификатор для тестирования нескольких наборов тестов. Так что мне нужно повторять 1,2 и 3, или я могу повторить только третий шаг?

и мне нужно заменить класс в тестовом наборе вопросительным знаком (?), Или я могу оставить класс своим, и классификатор попытается предсказать класс в любом случае?

ответ

2

Вы можете просто повторить третий шаг, предполагая, что все наборы тестов были отфильтрованы и сохранены с отфильтрованной версией. Если вы выберете кнопку «Дополнительные параметры ...» и проверьте окно прогнозов вывода, вам не нужно заменять класс вопросительным знаком.

+0

Мне очень жаль, но я до сих пор не понял :(.. когда вы говорите: «если все тестовые наборы были отфильтрованы и сохранены с отфильтрованной версией», вы имеете в виду, что мне нужно применить фильтр на ' шаг один »на всех наборах тестов, а затем классифицировать их один за другим, потому что у меня есть тестовые наборы, которые представляют собой данные, сгруппированные по году, которые я не хочу смешивать, и я хочу классифицировать их с использованием того же подготовленного классификатора, и я не знаю, как это сделать! Мне нужно повторить весь эксперимент для каждого набора тестов .. или мне просто нужно повторить последний шаг. – Ophilia

+0

Должно быть только последним шагом. Отфильтруйте свои данные и сохраните отфильтрованную версию в. arff и использовать его на шаге 3. – SJB

+0

Но я не думаю, что могу сделать следующее с несколькими тестовыми файлами: test1, test2, test3 ... testn: (java -Xmx1024m weka.filters.unsupervised.attribute.StringToWordVe ctor -b -i training.arff -o Output_training.arff -r test1.arff test2.arff test3.arff -s output_test1.arff output_test2.arff output_test3.arff -R 2 -W 5000 -C -T -I - N 1 -L -M 2), так как я хочу преобразовать несколько тестовых файлов вместо того, чтобы помещать их в один большой тестовый файл. – Ophilia

Смежные вопросы