Мне необходимо написать программу, которая реализует кластеризацию kmeans
для данного набора данных (я грубо понимаю, как работает алгоритм kmeans). Поскольку я хочу, чтобы моя программа была общей, я хотел бы понимать следующие термины:Понимание некоторых терминов в кластеризации K-классов
Для данного набора данных, который содержит 100 строк и 10 столбцов (при условии, что каждый столбец является функцией), как определить следующие параметры:
- измерение: Как я знаю, что размерность этого набора данных?
- data point: Означает ли это, что каждая ячейка
[row][col]
является точкой данных или всей строкой является одной точкой данных (вектор точек)?
Каждое измерение соответствует признаку, точка данных представляет собой строку, то есть точку в этом НЗ-мерном пространстве. –