В документах кластерного анализа, использующих метаэвристические алгоритмы, многие оптимизировали ошибку квантования среднего квадрата (MSE). Например, в [1] и [2].Какая цель оптимизирована внутрикластерной суммой расстояний или MSE?
У меня есть путаница с результатами. Они сказали, что они использовали MSE в качестве целевой функции. Но они сообщили значения результата в внутрикластерной сумме евклидовых расстояний.
K-Means минимизирует внутрикластерную сумму квадратов (WCSS) (от wiki) [3]. Я не мог найти, в чем разница между WCSS и MSE, когда используется евклидово расстояние в случае разницы при вычислении MSE.
В случае K-сред WCSS минимизирован, и если мы будем использовать ту же функцию MSE с алгоритмами метаэвристики, они также минимизируют ее. В этом случае, как меняется сумма евклидовых расстояний для K-средних и других?
Я могу воспроизвести результаты, показанные в статьях, если я оптимизирую внутрикластерную сумму евклидовых расстояний.
Я думаю, что я делаю что-то неправильно здесь. Кто-нибудь может мне с этим помочь.
Главный вопрос: Какие цели было ссылочные документы [1] и [2] оптимизируют, и какие функции ЦЕННОСТИ приведены в таблице?
Это всего лишь два примера многих других документов, которые используют сумму квадратных расстояний внутри кластера. Мне показалось, что цитаты мне тоже проблематичны. Есть ли проблема в оптимизации внутрикластерной суммы эвклидовых расстояний? В моем исследовании говорится, что если я не ошибаюсь, хотя они сказали оптимизировать MSE, но они оптимизировали внутрикластерную сумму эвклидовых расстояний. – phoxis
Наименьший из ближайших кластеров всегда является ближайшим кластером наименьших квадратов. Поэтому, беря квадратный корень, обычно не наносит большого вреда. Предполагая, что для вас «внутренний кластер» является объектно-ориентированным, а не парным расстоянием. –
Также я считаю, что в последнем случае есть тонкое равенство. –