Экземпляры в моем наборе данных имеют несколько числовых атрибутов и двоичный класс. В Weka есть способ использования кластера и передать результат классификатору (например, SMO), чтобы улучшить результаты классификации?Кластеризация перед классификацией в Weka
ответ
Один из способов, которые вы могли бы добавить данные кластера в ваши данные, используя метод ниже (в Weka проводнике):
- Загрузите ваш любимый Dataset
- Выберите кластерную модель (В моем случае, я использовал SimpleKMeans)
- Измените параметры кластеризатора в соответствии с требованиями
- Используйте обучение Набор для режима кластера
- Начала кластеризации процесс
- После Кластеры были получены, правой кнопкой мыши на списке результатов и выберите «Визуализируйте Cluster присвоений»
- Выберите Y, чтобы быть в кластер, а затем нажмите кнопку Сохранить, как показано ниже:
- Сохраните данные в назначенное место.
Затем вы можете загрузить этот файл и использовать информацию о кластере в своем классификаторе точно так же, как и любой другой атрибут. Просто убедитесь, что для класса установлен правильный атрибут, и вы должны быть права, чтобы идти.
ПРИМЕЧАНИЕ. Когда я запускал эти тесты, я использовал J48 для оценки класса, и казалось, что J48 использовал только значения кластеров для оценки класса. Точность модели также была удивительно высокой, поэтому либо набор данных был либо слишком простым, либо я мог пропустить шаг в процессе кластеризации.
Надеюсь, что это поможет!
В Weka проводнике, после загрузки набора данных
- выберите вкладку Preprocess,
- нажмите "Выбрать ..." Button,
- добавить бесконтрольный-атрибут-фильтр "AddCluster".
- нажмите рядом с кнопкой, чтобы открыть поле выбора кластеризатор, выберите кластеризатор,
- Configure/параметризировать кластеризатор
- закрыть все модальные диалоговые окна
Нажмите кнопку «Применить», чтобы применить фильтр , Он добавит еще один атрибут «кластер» как самый правый в списке атрибутов.
Затем продолжите свои эксперименты по классификации.
- 1. Кластеризация по сравнению с неконтролируемой классификацией
- 2. Работа со строковыми данными и классификацией в Weka
- 3. weka DBSCAN кластеризация, как получить основную точку
- 4. разница между классификацией и обнаружением
- 5. Кластеризация перед регрессией - рекомендательная система
- 6. Установите LinkType для класса Иерархическая кластеризация в WEKA
- 7. Кластеризация многих предложений с использованием weka lib в java
- 8. Выявление проблем с классификацией
- 9. Как переоценить модель в WEKA?
- 10. Разница между классификацией и прогнозом?
- 11. раз о TDA с классификацией
- 12. Разница между сегментацией и классификацией
- 13. Кластеризация с Scipy в Python? (иерархическая кластеризация)
- 14. кластеризация \ Группировка Challenge - кластеризация пары в группы
- 15. дискретизации в weka
- 16. Использование кластеризации для прогнозирования в Weka
- 17. Что такое оценка кластера в WEKA?
- 18. Кластеризация документов в Python
- 19. Weka: Как подготовить тестовый набор в WEKA
- 20. Scipy иерархическая кластеризация - кластеризация нового вектора
- 21. Кластеризация K-средних
- 22. k-mean weka java code
- 23. Как работает кластеризация БД?
- 24. видео кластеризация в MATLAB
- 25. кластеризация в каждой группе
- 26. Кластеризация текста в Python
- 27. Кластеризация в Gephi 0.8.2
- 28. Иерархическая кластеризация в JavaScript
- 29. Кластеризация текста в MATLAB
- 30. Переменная кластеризация в python
Опция фильтра AddCluster неактивна и не может применяться. Что может быть причиной этого? – njk
Я не знаю, это зависит от ваших данных. Возможно, попробуйте его с другим набором данных, например. с одним из встроенных наборов данных, которые поставляются с Weka? Просто чтобы убедиться, что он работает вообще. – knb
К сожалению, мне приходится работать с этим набором данных. Спасибо в любом случае за ответ. – njk