2009-11-27 4 views
4

Я использую функцию проводника Weka для классификации.Вопрос об использовании Weka, инструмент машинного обучения

Таким образом, у меня есть файл .arff с двумя функциями из NUMERIC, а мой класс является двоичным 0 или 1 (например, {0,1}).

Пример:

@RELATION summary 
@ATTRIBUTE feature1 NUMERIC 
@ATTRIBUTE feature2 NUMERIC 
@ATTRIBUTE class {1,0} 

@DATA 
23,11,0 
20,100,1 
2,36,0 
98,8,1 
..... 

загружаю этот .arff файл, используйте 10-кратное перекрестное подтверждение (не тестовый файл) и выберите NaiveBayes, а затем классифицировать данные, и это дает мне: 5 неправильно маркированы , 100 правильно помечены. Все идет нормально.

Теперь я существенно изменяю свой файл .arff (дайте полностью случайные значения для моих атрибутов объектов). И повторите выше, и я получаю ТОЧНУЮ ту же статистику при классификации.

Я пробовал это с большим количеством изменений в моем файле .arff, разных алгоритмах классификации. Тем не менее, ТОЧНАЯ та же статистика (в рамках одного и того же алгоритма) независимо от того, какие значения я даю моему файлу .arff.

Я делаю что-то неправильно здесь?

+0

Поскольку это уже решена, вы можете обновить название так что-то более конкретное? – Sentry

ответ

4

Трудно сказать без дополнительной информации, но у меня есть два предложения:

  1. Каковы относительные пропорции двух классов? Это от 5 до 100? Множество алгоритмов не работает с сильно искаженными классами.

  2. Просто догадайтесь, но попробуйте изменить метки классов от чисел до строк (например, «class1» и «class2»). Weka называет эти «номинальные» атрибуты, поэтому, возможно, использование чисел не допускается.

0

также: имейте в виду, что кросс проверки является довольно противный в пользовательском интерфейсе, как они только показать вам оригинальное дерево, так или иначе (прежде чем они свернуться в других данных). Если вы хотите, чтобы конечные деревья были сгенерированы, вам нужен программный API. Я предлагаю использовать набор данных для обучения/тестирования.

-1

Вы пытались изменить

@ATTRIBUTE class {1,0} 

с

@ATTRIBUTE class {yes,no} 
Смежные вопросы