2014-05-21 3 views
0

У меня есть несколько документов, созданных в разное время. Я хочу, чтобы временного кластера этих документов.Кластеризация документов вовремя

i.e. Я хочу сгруппировать документы в группы документов со связанными метками времени. Например, если в количестве документов, созданных в момент времени X, есть «всплеск», они будут сгруппированы в один и тот же кластер и так далее ...

Предположим, мы не знаем, сколько кластеров может быть.

+2

Google «лопнуть обнаружения», «обнаружение всплеска», «пик обнаружения». Тот факт, что вы смотрите на документы, в значительной степени не имеет значения, просто рассматривайте их как точечные события. –

ответ

1

Если вы не знаете, сколько кластеров, растущий новый газ - хороший алгоритм для запуска. Вы можете играть с демонстрационными примерами здесь: http://www.demogng.de/

В вашей задаче нужен 1D случай.

Вы можете найти одну из реализаций здесь: https://github.com/BelBES/libGNG

Смежные вопросы