Я хотел бы использовать Махаланобис расстояние в K-означают алгоритм, потому что у меня есть 4 переменных, которые сильно коррелируют (0,85)K-средства и расстояние Махаланобиса
Мне кажется, что лучше использовать расстояние Махаланобиса в этом случае.
Проблема заключается в том, что я не знаю, как реализовать ее в R с помощью алгоритма K-средних.
Думаю, мне нужно «подделать» его, чтобы преобразовать данные до этапа кластеризации, но я не знаю, как это сделать.
Я пробовал классические километры с эвклидовым расстоянием при стандартизации данных, но, как я уже сказал, слишком много корреляции.
< подходят - kmeans (mydata.standardize, 4)
Я также попытался найти параметр расстояния, но я думаю, что не существует в kmeans функция().
Ожидаемый результат - способ применения алгоритма K-средних с расстоянием Махаланоби.
[*** Что вы пробовали? ***] (http://mattgemmell.com/2008/12/08/what-have-you-tried/) –
Можем ли мы ждать с закрытием до тех пор, пока OP не будет возможность улучшить ее вопрос? Можете ли вы расширить свой вопрос тем, что вы пробовали до сих пор, и каков ваш ожидаемый результат? –
Извините, я подумал, был быстрый ответ на этот вопрос. Я отредактировал сообщение – Ricol