2012-05-18 4 views

ответ

0

В вашем выводе должен быть некорректно классифицированный раздел с числом и процентом, который должен быть таким. Красное поле в этом image - это то, что вы ищете. Edit: Исходный образ here

+0

Я думаю, он/она хотел знать, можно ли увидеть отдельные ошибочно оформленные экземпляры. –

+0

Yup. Это моя ошибка. Перечитав это, вы определенно правы. – iCanHasFay

+0

Нет проблем. Ваш был информативным.=) –

11
  1. Перейти классифицировать вкладку Weka исследователя
  2. Нажмите больше опций ...
  3. Проверить выходные предсказания
  4. Нажмите OK

Надежда, что помогает ,

+1

Информативный, однако ss далеко, как я вижу, что на самом деле не работает при использовании кросс-валидации, так как нет возможности связать вывод Weka с неправильно классифицированными экземплярами с исходными экземплярами. – Vladtn

+0

Кажется, вам не хватает атрибута идентификатора. Проверьте ответ от @Menezes Sousa. Шаг 6 был для меня ключом. –

+1

@ Rushdi Shams Как я могу это сделать в командной строке? –

5

Я столкнулся с этой самой проблемой ранее, и теперь я занимаюсь ею просто отлично. Что я делаю:

  1. Сделать один атрибут String, который присваивает каждому экземпляру уникальный идентификатор. I присвоили имена документов каждому из моих экземпляров.
  2. Создайте файл .arff, поддерживаемый WEKA.
  3. Всякий раз, когда вам нужно запустить классификатор данных .arff, вы заметите, что вам нужно исключить атрибут идентификатора экземпляра. Если вы этого не сделаете, Weka выскажет ошибку, заявив, что классификатор не может обрабатывать атрибуты String. Вместо исключения запустите фильтр StringToNominal в InstanceID.
  4. Теперь, как сказал @Rushdi, нажмите «Дополнительные параметры» на вкладке «Классификация».
  5. Проверить выходные прогнозы на всплывающем окне «Параметры оценки классификатора».
  6. Введите номер атрибута идентификатора экземпляра в поле «Вывести дополнительные атрибуты».
  7. Запустите классификатор на все данные, за исключением атрибута идентификатора экземпляра. (Большинство классификаторов имеют это как опцию «StartSet» в «Ranker», например, которую я использую вместе с классификатором SMO.)
  8. Если вы сделали все правильно до сих пор, вы увидите все экземпляры, перечисленные вместе с их реальные и прогнозируемые выходные значения, а также идентификатор экземпляра, который может точно определить, какие документы были неправильно классифицированы.

Надеюсь, это поможет кому-то. Удачи!

+0

Это казалось бы идеальным. Однако у Simple Logistic нет опции StartSet – dorien

+0

Используйте FilteredClassifier. – pedrobisp

0

Это работает для меня:

  1. Decompile официальный weka.jar
  2. Поиск в библиотеке классификации, которую вы хотите проверить знать, как он работает и детерминированные какие экземпляры неправильно классифицирован.
Смежные вопросы