Я столкнулся с настоящей проблемой. Мне нужно сделать кластер Kmeans для 5 миллионов векторов, каждый из которых содержит около 32 колос. Я пробовал Mahout, который требует Linux, и я нахожусь в окнах, я сдерживаюсь от использования ОС Linux и любого вида симулятора.KMeans кластеризация для более чем 5 миллионов векторов
Может ли кто-нибудь предложить алгоритм кластеризации KMeans, который масштабируется до 5M векторов и может сходиться быстро?
Я проверил несколько, но они не будут масштабироваться. Это означает, что они медленны и навсегда завершаются.
Благодаря
, сколько кластеров? Евклидова или индивидуальная метрика? – denis
Euclidean clusters – 2012-02-27 18:36:21