3

Экземпляры в моем наборе данных имеют несколько числовых атрибутов и двоичный класс. В Weka есть способ использования кластера и передать результат классификатору (например, SMO), чтобы улучшить результаты классификации?Кластеризация перед классификацией в Weka

ответ

2

Один из способов, которые вы могли бы добавить данные кластера в ваши данные, используя метод ниже (в Weka проводнике):

  1. Загрузите ваш любимый Dataset
  2. Выберите кластерную модель (В моем случае, я использовал SimpleKMeans)
  3. Измените параметры кластеризатора в соответствии с требованиями
  4. Используйте обучение Набор для режима кластера
  5. Начала кластеризации процесс
  6. После Кластеры были получены, правой кнопкой мыши на списке результатов и выберите «Визуализируйте Cluster присвоений»
  7. Выберите Y, чтобы быть в кластер, а затем нажмите кнопку Сохранить, как показано ниже:

Weka Cluster Visualize

  1. Сохраните данные в назначенное место.

Затем вы можете загрузить этот файл и использовать информацию о кластере в своем классификаторе точно так же, как и любой другой атрибут. Просто убедитесь, что для класса установлен правильный атрибут, и вы должны быть права, чтобы идти.

ПРИМЕЧАНИЕ. Когда я запускал эти тесты, я использовал J48 для оценки класса, и казалось, что J48 использовал только значения кластеров для оценки класса. Точность модели также была удивительно высокой, поэтому либо набор данных был либо слишком простым, либо я мог пропустить шаг в процессе кластеризации.

Надеюсь, что это поможет!

1

В Weka проводнике, после загрузки набора данных

  • выберите вкладку Preprocess,
  • нажмите "Выбрать ..." Button,
  • добавить бесконтрольный-атрибут-фильтр "AddCluster".
  • нажмите рядом с кнопкой, чтобы открыть поле выбора кластеризатор, выберите кластеризатор,
  • Configure/параметризировать кластеризатор
  • закрыть все модальные диалоговые окна

Нажмите кнопку «Применить», чтобы применить фильтр , Он добавит еще один атрибут «кластер» как самый правый в списке атрибутов.

Затем продолжите свои эксперименты по классификации.

+0

Опция фильтра AddCluster неактивна и не может применяться. Что может быть причиной этого? – njk

+0

Я не знаю, это зависит от ваших данных. Возможно, попробуйте его с другим набором данных, например. с одним из встроенных наборов данных, которые поставляются с Weka? Просто чтобы убедиться, что он работает вообще. – knb

+0

К сожалению, мне приходится работать с этим набором данных. Спасибо в любом случае за ответ. – njk

Смежные вопросы