1

У меня есть l2-мерный набор данных из 1000 образцов, состоящий из 5 значений температуры, 5 значений цены, одно целое значение, представляющее оценку экспертом-человеком (undecided = 0, good = 1, bad = 2, опасность = 4) и двоичную переменную решения, которую я хочу научиться прогнозировать.Классификатор с гетерогенными данными

Как найти классификатор, который может справиться с этими разнородными данными?

Я думал о создании одного классификатора для каждого возможного человеческого суждения (0,1,2,4), поэтому 4 классификатора. Итак, для каждой оценки человеческого суждения я бы: - центр и снизить температуру и цены - возможно, использовать PCA для устранения некоторых нерелевантных функций. - использовать метод машинного обучения для классификации (например, многослойные нейронные сети или SVM)

Правильно ли мой подход? (?, Что если бы было 1000 возможных человеческих суждений вместо 4)

ответ

2

Типичный способ категорий кодирования для SVMs или ИНС является 1-из-C кодирования:

Обычно почти каждый классификатор может обрабатывать гетерогенные данные. Но вы должны предварительно обрабатывать входы (масштабировать, нормализовать, ...). В ссылках, которые я вам дал, должно быть много намеков.

Смежные вопросы