2010-12-08 3 views
0

Я пробовал RSAR, бесплатный пакет, но мне интересно, есть ли там какие-то другие хорошие редукторы. Даже пакеты для R или Matlab, любые ресурсы, позволяющие мне найти минимальный набор атрибутов, которые объединяют данные. Например, имея набор с сотнями примеров почты и разных атрибутов, которые описывают их и классифицируются как спам или не спам, я хочу найти минимальный набор атрибутов, описывающих все данные, для отказа от бесполезной информации.Сокращение атрибутов на основе грубого набора

Я надеюсь, что я исключил себя, если нет, я открыт для ваших предложений.

Спасибо.

ответ

0

Учитывая тип проблемы, которую вы описываете, то есть: выбирая правильные атрибуты для классификации по электронной почте, лучшим способом может быть использование Weka (Weka home). Он имеет несколько алгоритмов выбора функций, которые могут быть интерактивно использованы для визуализации их эффекта или в сочетании с различными алгоритмами классификации для оценки их влияния на фактическую классификацию. (обратите внимание, что выбор атрибутов для классификации без правильной проверки для конкретного классификатора может привести к менее оптимальным результатам в реальной жизни).

Некоторые соответствующие ссылки:

Weka's manual regarding attribute selection

A (somewhat outdated) hands-on example

0

вы можете использовать RoughSets пакет языка R. См. Описание FS.one.reduct.computation в R (после установки пакета RoughSets)

например: HIRING2Matrix - таблица решений с количеством атрибутов. reduct1 это сокращенный набор атрибутов

< reduct1 - FS.one.reduct.computation (HIRING2Matrix, жадный = TRUE, то мощность = 1)

Смежные вопросы