1

Я написал многоклассовый классификатор с использованием логистической регрессии, который обучается с использованием подхода «один против всех». Я хочу построить кривую обучения для обученного классификатора.Кривые обучения для логистической регрессии Multi-класса

Должна ли отображаться кривая обучения на основе класса по классам или она должна быть единым графиком для классификатора в целом? Есть ли разница?

Чтобы уточнить, кривая обучения представляет собой график обучения & перекрестная проверка/набор тестов ошибок/затрат против установленного размера обучения. Этот сюжет должен позволить вам увидеть, увеличивает ли размер набора тренировок улучшает производительность. В более общем плане кривая обучения позволяет определить, имеет ли ваш алгоритм ошибку смещения (при подгонке) или дисперсии (по сравнению).

Некоторые подробности относительно моего кода:

  • анализирует MNIST рукописные цифры изображения
  • предсказывает цифры (0-9) в образе
  • на основе класса Coursera Эндрю Нг на машине обучения
+0

Что именно вы подразумеваете под «кривой обучения»? Просто сюжет прогресса обучения? Почему это должно влиять на прогнозы классификатора? – cfh

+0

[Кривая обучения] (https://followthedata.files.wordpress.com/2012/06/screen-shot-2012-06-02-at-21-31-03.png). График ошибки обучения и теста, а также размер установленного набора. Что должно позволить мне понять, будет ли увеличение размера набора тренировок значительно повысить производительность – jkarimi

ответ

1

Вообще-то, я бы заговорил все. Или напишите сценарий, чтобы собрать все и заговорить все.

Я думаю, что необходимость в целом участке классификатора очевидна. Но класс по-классу поражает меня так же ценно, чтобы у вас не было проблем из одного класса. Если, скажем, «5» упорно не устойчиво к увеличению обучающих данных, но общий классификатор по-прежнему помогают им, я бы предпочел, чтобы исследовать ситуацию для этого одного класса, прежде чем я вылил на большее количество данных.

Смежные вопросы