2016-07-20 1 views
0

У меня есть набор данных, который я сгруппировал, используя два разных алгоритма кластеризации. Результаты примерно одинаковы, но номера кластеров переставляются. Теперь для отображения ярлыков с цветовой кодировкой я хочу, чтобы идентификаторы ярлыков были одинаковыми для тех же кластеров. Как я могу получить правильную перестановку между двумя идентификаторами ярлыков?номера переупорядочиваемых кластеров для правильного соответствия

Я могу сделать это с использованием грубой силы, но, возможно, есть лучший/более быстрый метод. Я был бы очень признателен за любую помощь или указатели. Если возможно, я ищу функцию python.

ответ

1

Наиболее известный алгоритм поиска оптимального соответствия - это венгерский метод.

Поскольку это не может быть объяснено в нескольких предложениях, я должен отнести вас к книге по вашему выбору, или Wikipedia article "Hungarian algorithm".

Возможно, вы получите хорошие результаты (даже идеально, если разница действительно крошечная), просто выбирая максимум матрицы соответствия, а затем удаляя эту строку и столбец.

Смежные вопросы