У меня есть вопрос о некоторых базовых концепциях машинного обучения. В примерах, я заметил, давался краткий обзор. Для обучения системы в качестве входных данных вводится вектор-функция. В случае контролируемого обучения набор данных помечен. У меня путаница в маркировке. Например, если мне нужно различать два типа изображений, я предоставил вектор функций и на выходе для тестирования, я предоставил 1 для типов A и 2 для типа B. Но если я хочу извлечь интересующую область из набора данных изображений. Как я буду пометить свои данные для извлечения ROI с помощью SVM. Надеюсь, я смогу передать свое замешательство. Спасибо в ожидании.маркировка набора данных в машинном обучении
ответ
В подконтрольном обучении, такие как SVMs, набор данные должны быть составлен следующим образом:
<i-th feature vector><i-th label>
где i
идет от 1 до количества шаблонов (также примеров или наблюдения) в вашей подготовке так что это представляет собой одну запись в вашем учебном наборе, которая может использоваться для обучения классификатора SVM.
Итак, у вас есть набор, состоящий из таких кортежей, и если у вас есть всего 2 ярлыка (проблема с двоичной классификацией), вы можете легко использовать SVM. В самом деле, модель SVM будет обучена благодаря учебному набору и учебным лейблам, и как только этап обучения закончится, вы можете использовать другой набор (называемый набором валидации или набором тестов), который структурирован так же, как и набор для обучения, проверьте точность ваших SVM.
Другими словами, рабочий процесс SVM должен быть структурированы следующим образом:
- Поезд SVM с использованием обучающего набора и подготовки этикетки
- предсказать метки для набора проверки с использованием модели, обученной на предыдущем шаге
- Если вы знаете, каковы фактические метки проверки, вы можете сопоставить прогнозируемые метки с фактическими метками и проверить, сколько ярлыков было правильно предсказано. Соотношение между количеством правильно предсказанных меток и общим количеством меток в наборе валидации возвращает скаляр между [0; 1], и это называется точностью вашей модели SVM.
- , если вы заинтересованы в ROI, вы можете проверить подготовленные параметры SVM (в основном веса и смещения), чтобы восстановить гиперплоскость разделительный
Важно также знать, что подготовка набора записей должен быть правильно, априори обозначен: если метки тренировки неверны, SVM никогда не сможет правильно предсказать результат для ранее невидимых шаблонов. Вам не нужно указывать данные в соответствии с ROI, который вы хотите извлечь, данные должны быть правильно помечены априори: SVM будет иметь весь набор изображений типа A и набор изображений типа B и узнает границу решения для разделения изображений типа A и изображений типа B. Вам не нужно обманывать метки: если вы это делаете, вы не выполняете классификацию и/или машинное обучение и/или распознавание образов. Вы в основном обманываете результаты.
- 1. PCA в машинном обучении
- 2. Оценка оценки в машинном обучении
- 3. Огромные наборы данных в машинном обучении sklearn
- 4. Номинальный ценный набор данных в машинном обучении
- 5. Преимущества TDD в машинном обучении
- 6. Интерпретация кривой обучения в машинном обучении
- 7. Создание контролируемой модели в машинном обучении
- 8. Значимость PCA или SVD в машинном обучении
- 9. условие в формуле в машинном обучении
- 10. Что такое метод NumericToNominal в машинном обучении.
- 11. Как увеличить производительность R в машинном обучении?
- 12. Что означает «Oracle» в машинном обучении?
- 13. Вопрос о классификаторах в машинном обучении
- 14. Когда использовать генеративные алгоритмы в машинном обучении?
- 15. Каково определение «гибкости» метода в машинном обучении?
- 16. Интуиция о ядро-трюке в машинном обучении
- 17. Маркировка объектов в обучении Хаара
- 18. Как вычислить потерю журнала при машинном обучении
- 19. Маркировка сложного набора данных
- 20. C++ library/framework, API для моделей Mixture в машинном обучении
- 21. Обработка геопространственных координат при машинном обучении
- 22. Как работает процедура весовой системы в машинном обучении?
- 23. Скомпенсированный класс и неуравновешенный класс в машинном обучении
- 24. Большое количество функций в машинном обучении плох (регрессия)?
- 25. Нужно ли нормализовать/стандартизировать данные в машинном обучении?
- 26. Почему так называемое «ядро» в машинном обучении функции ядра?
- 27. Используете ли мы модель гамма-смеси (GMM) для кластеризации данных в машинном обучении так часто?
- 28. Маркировка классов в разделах данных
- 29. Маркировка или маркировка неструктурированных данных
- 30. Какой классификатор в машинном обучении может быть лучше, если у меня есть перекрытие классов?
Позвольте мне привести пример перед вами, возможно, это будет сузить круг этого вопроса. если у меня есть изображение комнаты, и я хочу классифицировать, есть ли у нее стул или нет. Это будет линейная классификация, и бинарные метки могут быть назначены. Но что, если я хочу знать координаты/расположение стула? Можно ли это сделать в процессе классификации? –
Вы можете изменить свой вопрос, чтобы добавить этот пример. –