Это назначение поможет вам понять шаги в KNN. KNN основан на расстояниях. Найдите ближайших соседей K, а затем, возможно, проголосуйте за проблему классификации.
Ваши данные обучения можно рассматривать как (x1, x2, y): возраст и прибыль - это функции (x1, x2), в то время как BUY или NOT BUY - это метка/вывод y.
Чтобы применить Knn, вам необходимо рассчитать расстояние, которое основано на особенностях. Поскольку в двух функциях используются разные единицы (год, доллар США), вы должны преобразовать их в неблокирующие функции, которые называются нормализацией, часть 4.1 в вашем раздаточном материале. После этого вектор функций будет выглядеть (-0,4, -0,8). Число должно быть между -1 и 0, если используется предлагаемая формула в части 4.1.
Затем используйте нормализованную функцию для расчета расстояний (евклидова в раздаточном материале) между каждой точкой данных обучения и вашей заинтересованной компанией (также нормализуется). Это требуется в 4.2.
Последний шаг должен состоять в том, чтобы выбрать ближайшего соседа K и решить ПОКУПАТЬ или НЕ ПОКУПАЙТЕ, судя по выходам этих соседей. (возможно, простое голосование)