Я прочитал газету k-means++: The Advantages of Careful Seeding и не совсем понятно, алгоритм при условии, которое:K-средства ++ алгоритм
«Пусть D (х) обозначим кратчайшее расстояние от точки данных х до ближайшего центра мы уже выбраны.
1a. Выберите начальный центр равномерно c1 при случайном из X.
1b. Выберите следующий центр CI, выбирая Ci = х '∈ X с вероятностью (D (х')^2)/Sum_of (D (x)^2)
1 с. Повторите шаг 1b, пока мы не выбрали всего k центров.
2-4. Действуйте со стандартными к-означает алгоритм «
(Лучше смотреть на алгоритме в приведенной выше ссылке)
Тем шаг 1b. Что они означают» выбрать Ci = х»∈ X с вероятностью (D (x ')^2)/Sumof (D (x)^2) ». Они означают выбор элемента, который имеет наибольшую долю? И как выполнить такое вычисление может привести к выбору оптимальных центроидов?
Не знаете, почему это получило -1. – icedwater