Кластеризация перед классификацией в Weka

Экземпляры в моем наборе данных имеют несколько числовых атрибутов и двоичный класс. В Weka есть способ использования кластера и передать результат классификатору (например, SMO), чтобы улучшить результаты классификации?Кластеризация перед классификацией в Weka

источник

2014-11-07 njk

Один из способов, которые вы могли бы добавить данные кластера в ваши данные, используя метод ниже (в Weka проводнике):

Загрузите ваш любимый Dataset
Выберите кластерную модель (В моем случае, я использовал SimpleKMeans)
Измените параметры кластеризатора в соответствии с требованиями
Используйте обучение Набор для режима кластера
Начала кластеризации процесс
После Кластеры были получены, правой кнопкой мыши на списке результатов и выберите «Визуализируйте Cluster присвоений»
Выберите Y, чтобы быть в кластер, а затем нажмите кнопку Сохранить, как показано ниже:

Weka Cluster Visualize

Сохраните данные в назначенное место.

Затем вы можете загрузить этот файл и использовать информацию о кластере в своем классификаторе точно так же, как и любой другой атрибут. Просто убедитесь, что для класса установлен правильный атрибут, и вы должны быть права, чтобы идти.

ПРИМЕЧАНИЕ. Когда я запускал эти тесты, я использовал J48 для оценки класса, и казалось, что J48 использовал только значения кластеров для оценки класса. Точность модели также была удивительно высокой, поэтому либо набор данных был либо слишком простым, либо я мог пропустить шаг в процессе кластеризации.

Надеюсь, что это поможет!

источник

2014-11-09 23:58:16

В Weka проводнике, после загрузки набора данных

выберите вкладку Preprocess,
нажмите "Выбрать ..." Button,
добавить бесконтрольный-атрибут-фильтр "AddCluster".
нажмите рядом с кнопкой, чтобы открыть поле выбора кластеризатор, выберите кластеризатор,
Configure/параметризировать кластеризатор
закрыть все модальные диалоговые окна

Нажмите кнопку «Применить», чтобы применить фильтр , Он добавит еще один атрибут «кластер» как самый правый в списке атрибутов.

Затем продолжите свои эксперименты по классификации.

источник

2014-11-10 12:45:32 knb

Опция фильтра AddCluster неактивна и не может применяться. Что может быть причиной этого? – njk

Я не знаю, это зависит от ваших данных. Возможно, попробуйте его с другим набором данных, например. с одним из встроенных наборов данных, которые поставляются с Weka? Просто чтобы убедиться, что он работает вообще. – knb

К сожалению, мне приходится работать с этим набором данных. Спасибо в любом случае за ответ. – njk

Кластеризация перед классификацией в Weka

ответ

Смежные вопросы