Классификатор с гетерогенными данными

У меня есть l2-мерный набор данных из 1000 образцов, состоящий из 5 значений температуры, 5 значений цены, одно целое значение, представляющее оценку экспертом-человеком (undecided = 0, good = 1, bad = 2, опасность = 4) и двоичную переменную решения, которую я хочу научиться прогнозировать.Классификатор с гетерогенными данными

Как найти классификатор, который может справиться с этими разнородными данными?

Я думал о создании одного классификатора для каждого возможного человеческого суждения (0,1,2,4), поэтому 4 классификатора. Итак, для каждой оценки человеческого суждения я бы: - центр и снизить температуру и цены - возможно, использовать PCA для устранения некоторых нерелевантных функций. - использовать метод машинного обучения для классификации (например, многослойные нейронные сети или SVM)

Правильно ли мой подход? (?, Что если бы было 1000 возможных человеческих суждений вместо 4)

источник

2012-04-27 AdeB

Типичный способ категорий кодирования для SVMs или ИНС является 1-из-C кодирования:

Neural Network FAQ - Subject: How should categories be encoded?
A Practical Guide to Support Vector Classification - 2.1 Категориальная функция

Обычно почти каждый классификатор может обрабатывать гетерогенные данные. Но вы должны предварительно обрабатывать входы (масштабировать, нормализовать, ...). В ссылках, которые я вам дал, должно быть много намеков.

источник

2012-04-27 15:44:59 alfa

Классификатор с гетерогенными данными

ответ

Смежные вопросы