2016-03-14 3 views
-1

Это моя домашняя работа. Я не прошу вас делать домашнее задание здесь, мне нужен намек, чтобы продолжать идти.Data Mining - K ближайший сосед

Page1

Page2

Я знаю, что K ближайшего соседа алгоритм, однако я всегда видел на графиках не нравится. Можете ли вы, ребята, сказать мне, что я должен делать? Я пытался понять, как начать делать это, но я не мог. Я был бы признателен за небольшой намек от вас, ребята.

ответ

1

Это назначение поможет вам понять шаги в KNN. KNN основан на расстояниях. Найдите ближайших соседей K, а затем, возможно, проголосуйте за проблему классификации.

Ваши данные обучения можно рассматривать как (x1, x2, y): возраст и прибыль - это функции (x1, x2), в то время как BUY или NOT BUY - это метка/вывод y.

Чтобы применить Knn, вам необходимо рассчитать расстояние, которое основано на особенностях. Поскольку в двух функциях используются разные единицы (год, доллар США), вы должны преобразовать их в неблокирующие функции, которые называются нормализацией, часть 4.1 в вашем раздаточном материале. После этого вектор функций будет выглядеть (-0,4, -0,8). Число должно быть между -1 и 0, если используется предлагаемая формула в части 4.1.

Затем используйте нормализованную функцию для расчета расстояний (евклидова в раздаточном материале) между каждой точкой данных обучения и вашей заинтересованной компанией (также нормализуется). Это требуется в 4.2.

Последний шаг должен состоять в том, чтобы выбрать ближайшего соседа K и решить ПОКУПАТЬ или НЕ ПОКУПАЙТЕ, судя по выходам этих соседей. (возможно, простое голосование)

Смежные вопросы