маркировка набора данных в машинном обучении

У меня есть вопрос о некоторых базовых концепциях машинного обучения. В примерах, я заметил, давался краткий обзор. Для обучения системы в качестве входных данных вводится вектор-функция. В случае контролируемого обучения набор данных помечен. У меня путаница в маркировке. Например, если мне нужно различать два типа изображений, я предоставил вектор функций и на выходе для тестирования, я предоставил 1 для типов A и 2 для типа B. Но если я хочу извлечь интересующую область из набора данных изображений. Как я буду пометить свои данные для извлечения ROI с помощью SVM. Надеюсь, я смогу передать свое замешательство. Спасибо в ожидании.маркировка набора данных в машинном обучении

источник

2016-02-14 prog_131

Позвольте мне привести пример перед вами, возможно, это будет сузить круг этого вопроса. если у меня есть изображение комнаты, и я хочу классифицировать, есть ли у нее стул или нет. Это будет линейная классификация, и бинарные метки могут быть назначены. Но что, если я хочу знать координаты/расположение стула? Можно ли это сделать в процессе классификации? –

Вы можете изменить свой вопрос, чтобы добавить этот пример. –

В подконтрольном обучении, такие как SVMs, набор данные должны быть составлен следующим образом:

<i-th feature vector><i-th label>

где i идет от 1 до количества шаблонов (также примеров или наблюдения) в вашей подготовке так что это представляет собой одну запись в вашем учебном наборе, которая может использоваться для обучения классификатора SVM.

Итак, у вас есть набор, состоящий из таких кортежей, и если у вас есть всего 2 ярлыка (проблема с двоичной классификацией), вы можете легко использовать SVM. В самом деле, модель SVM будет обучена благодаря учебному набору и учебным лейблам, и как только этап обучения закончится, вы можете использовать другой набор (называемый набором валидации или набором тестов), который структурирован так же, как и набор для обучения, проверьте точность ваших SVM.
Другими словами, рабочий процесс SVM должен быть структурированы следующим образом:

Поезд SVM с использованием обучающего набора и подготовки этикетки
предсказать метки для набора проверки с использованием модели, обученной на предыдущем шаге
Если вы знаете, каковы фактические метки проверки, вы можете сопоставить прогнозируемые метки с фактическими метками и проверить, сколько ярлыков было правильно предсказано. Соотношение между количеством правильно предсказанных меток и общим количеством меток в наборе валидации возвращает скаляр между [0; 1], и это называется точностью вашей модели SVM.
, если вы заинтересованы в ROI, вы можете проверить подготовленные параметры SVM (в основном веса и смещения), чтобы восстановить гиперплоскость разделительный

Важно также знать, что подготовка набора записей должен быть правильно, априори обозначен: если метки тренировки неверны, SVM никогда не сможет правильно предсказать результат для ранее невидимых шаблонов. Вам не нужно указывать данные в соответствии с ROI, который вы хотите извлечь, данные должны быть правильно помечены априори: SVM будет иметь весь набор изображений типа A и набор изображений типа B и узнает границу решения для разделения изображений типа A и изображений типа B. Вам не нужно обманывать метки: если вы это делаете, вы не выполняете классификацию и/или машинное обучение и/или распознавание образов. Вы в основном обманываете результаты.

источник

2016-02-14 11:00:13 Alessiox

маркировка набора данных в машинном обучении

ответ

Смежные вопросы