2012-03-04 5 views
1

У меня есть кластерный вызов ...кластеризация Группировка Challenge - кластеризация пары в группы

У меня есть много пар данных (например, А < -> B, C < -> D, E < - > F, A < -> F и т. Д.) Мне нужно группировать \ кластеризовать их в N групп, например Группа № 1: A, B, F Group # 2: C, D. Кластеризация должна выполняться с использованием данной пары ассоциаций (то есть A и B парных)

Любая идея? Я довольно уверен, что для этого есть алгоритмы, но не уверен, как их искать.

ответ

0

Во-первых, вы знаете количество кластеров, которое ваши данные должны иметь до анализа?

Если да, то вы можете сделать что-то по линиям k-средств. (Http://en.wikipedia.org/wiki/K-means_clustering) Если нет, то вы можете использовать алгоритмы поиска структуры сообщества для изучения возможных кластеризации. (http://en.wikipedia.org/wiki/Community_structure)

+0

Да - Я могу определить количество кластеров. Я понял, что K-mean требует определенного «расстояния», которое нужно определить. Не знаю, как я это делаю здесь. Структура сообщества выглядит интересной. Спасибо! – user1042960

+0

Справа, гоча. Ну, если трудно измерить расстояние, вы также можете взглянуть на алгоритмы блочной модели. Мне понравилось http://arxiv.org/abs/1008.3926, но чтение исследовательского документа для того, что может быть простым приложением, может быть излишним. Существует много различных алгоритмов блочной модели, поэтому поиск в Google может оказаться полезным для поиска того, что «подходит». – 2perdo

+0

yep, боюсь, что для меня слишком много греческих букв :-) Я нашел свой эквивалент для расстояний, но не для координат, которые требуются для K-mean. Поэтому я сейчас сосредоточен на K-mediods - кажется лучшим (учитывая стоимость работы). Я буду держать вас в курсе – user1042960

Смежные вопросы