Я использую функцию проводника Weka для классификации.Вопрос об использовании Weka, инструмент машинного обучения
Таким образом, у меня есть файл .arff с двумя функциями из NUMERIC, а мой класс является двоичным 0 или 1 (например, {0,1}).
Пример:
@RELATION summary
@ATTRIBUTE feature1 NUMERIC
@ATTRIBUTE feature2 NUMERIC
@ATTRIBUTE class {1,0}
@DATA
23,11,0
20,100,1
2,36,0
98,8,1
.....
загружаю этот .arff файл, используйте 10-кратное перекрестное подтверждение (не тестовый файл) и выберите NaiveBayes, а затем классифицировать данные, и это дает мне: 5 неправильно маркированы , 100 правильно помечены. Все идет нормально.
Теперь я существенно изменяю свой файл .arff (дайте полностью случайные значения для моих атрибутов объектов). И повторите выше, и я получаю ТОЧНУЮ ту же статистику при классификации.
Я пробовал это с большим количеством изменений в моем файле .arff, разных алгоритмах классификации. Тем не менее, ТОЧНАЯ та же статистика (в рамках одного и того же алгоритма) независимо от того, какие значения я даю моему файлу .arff.
Я делаю что-то неправильно здесь?
Поскольку это уже решена, вы можете обновить название так что-то более конкретное? – Sentry