Я пытаюсь вычислить сходство между n сущностями, которые описываются entity_id, type_of_order, total_value.Вычислить сходство между n объектами
Пример данных может выглядеть следующим образом:
NR entity_id type_of_order total_value
1 1 A 10
2 1 B 90
3 1 C 70
4 2 B 20
5 2 C 40
6 3 A 10
7 3 B 50
8 3 C 20
9 4 B 50
10 4 C 80
Моим вопрос был бы то, что является бог способом измерения подобия между ENTITY_ID 1 и 2, например, в отношении к type_of_order и total_value для этого тип заказа.
Может ли простой KNN дать удовлетворительные результаты или я должен рассмотреть другие алгоритмы?
Любое предложение было бы высоко оценено.
Какая дистанционная функция лучше всего использовать, действительно зависит от приложения. Попробуйте несколько и посмотрите, что дает наилучшие результаты. Обычные включают нормы L1 и L2. Сначала вам нужно было бы сопоставить тип_о_опс. KNN - это схема классификации, а не метрика, поэтому я не знаю, как это будет использоваться для этого. Или, может быть, я неправильно понимаю вопрос. – Lidae