2016-03-28 2 views
0

Предположим, у меня есть один размерный набор данных, который содержит много одинаковых номеров, например набор данных S = c(rep(4, times(1000)), rep(5, times(808)), rep(9, times(990))). Есть ли эффективные способы выполнения k-средств в R? Фактически по моим данным у меня всего около 20 разных точек, но каждый из них появляется около 100000 раз, он работает очень медленно. Поэтому я задаюсь вопросом, есть ли более эффективный способ.k-средство для многих точек в R

ответ

0

K-средство может быть выполнено с весами. Это просто сделать.

Но IIRC версия, включенная в R, не реализована таким образом. Версия на flexclusterможет быть есть, но это чистый R и намного намного медленнее.

В любом случае, вы захотите реализовать это в Fortran или C, как в обычной версии kmeans. Возможно, вы можете найти пакет, который уже имеет хорошую реализацию.

+1

спасибо. Я нахожу функцию kmeansW {FactoClass}, которая работает хорошо. –

Смежные вопросы