4

Я довольно смущен о следующих двух проблемах: У меня есть 15-мерный набор данных, который следует использовать для группировки того, сколько типов атак содержится в наборе данных.анализ кластера? ярлык кластера

1. Теперь я уже сгруппировал свой набор данных в 5 кластеров (5 атак). Кто-нибудь знает, как я могу указать, какой кластер является атакой? (как обозначить кластеры не просто «кластер 1, кластер 2 ...»)

2. В контролируемой классификации у нас есть набор учебных материалов и набор данных тестирования, а тестирование проводится с помощью классификатора, построенного из набора данных подготовки , Мой вопрос в том, может ли такой же подход использоваться для кластеризации. Как построить модель с алгоритмом кластеризации, а затем автоматически классифицировать новый экземпляр в конкретный кластер? Возможно ли это?

ответ

5

Как неконтролируемый метод может идентифицировать именованные атаки?

Человеческое имя не указано в данных!

Для некоторых алгоритмов кластеризации вы можете автоматически назначать новые экземпляры, но в целом вы не можете (не зная модель, используемую кластеризацией). В худшем случае новое наблюдение было бы, например, merge два кластера в один. Что ты собираешься делать?

Если вы хотите классификация, используйте классификация, а не кластеризация.

У кластеров очень разные настроения. Если вы приблизитесь к нему с точки зрения классификации, вы не поймете этого. Вы используете кластеризацию для поиска чего-то неизвестен в данных, классификация для обобщения что-то к новым данным.

При необходимости вы также можете обучить классификатор кластера. Но не делайте этого слепо. Сначала убедитесь, что кластеры действительно полезны. Это много легче придумать совершенно бессмысленный результат кластеризации, чем с хорошей кластеризацией. Обучение классификатору бесполезных кластеров не даст значимого результата.

+0

thans для вашего ответа! теперь я хотел бы попытаться обучить классификатор на моем кластере. – wander

+0

Я не могу ответить на это, потому что я понятия не имею, какое программное обеспечение вы используете. Плюс, я вообще не использую классификацию. –

+0

Я использую weka API для кластеризации – wander

Смежные вопросы