3

Как я понимаю, при создании контролируемой модели обучения наша модель может иметь высокую предвзятость, если мы делаем очень простые предположения (например, если наша функция является линейной), что заставляет алгоритм пропустить отношения между нашими функциями и целевым выходом, что приводит к ошибки. Это недооценивает.Может ли модель иметь как высокую предвзятость, так и высокую дисперсию? Переопределение и подкрепление?

С другой стороны, если мы сделаем наш алгоритм слишком сильным (много полиномиальных функций), он будет очень чувствителен к небольшим колебаниям нашего набора тренировок, вызывающим ovefitting: моделирование случайного шума в данных обучения, а не предполагаемое выходы. Это перерабатывает.

image showing underfitting and overfitting

Это имеет смысл для меня, но я слышал, что модель может иметь как высокую дисперсию и высокую предвзятость, и я просто не понимаю, как это будет возможно. Если высокая предвзятость и высокая дисперсия являются синонимами для подфиксации и переобучения, то как вы можете переопределить и подкрепить на одной и той же модели? Является ли это возможным? Как это может случиться? Как это выглядит, когда это происходит?

+3

Возможно, лучше на http://stats.stackexchange.com – Paul

+0

[Bias-variance_tradeoff] (https://en.wikipedia.org/wiki/Bias-variance_tradeoff) Может быть полезно вам –

+0

[еще одна хорошая статья] (https://theclevermachine.wordpress.com/2013/04/21/model-selection-underfitting-overfitting-and-the-bias-variance-tradeoff/) –

ответ

2

Представьте проблему с регрессией. Я определяю классификатор, который выводит максимум целевой переменной, наблюдаемой в данных обучения, для всех возможных входов.

Эта модель является одновременно предвзятой (может представлять только выходной сигнал, независимо от того, насколько богата или изменена входная мощность) и имеет высокую дисперсию (максимальный набор данных будет демонстрировать большую изменчивость между наборами данных).

Вы правы в определенной степени, что предвзятость означает, что модель, скорее всего, подстроится, а дисперсия означает, что она подвержена переобучению, но они не совсем одинаковы.

-1

Можете ли вы указать, где вы узнали об этом?

Оба комплектации и переоборудования являются по существу характеристиками вашей модели в отношении вашего учебного набора. Таким образом, модель может быть подкреплена и переоснащена в то же время только для разных наборов тренировок в соответствии с моим пониманием.

+0

Я нашел эту вещь в курсе машинного обучения Эндрю Нг в Курте. Пожалуйста, просмотрите [видео] (https://www.coursera.org/learn/machine-learning/lecture/Kont7/learning-curves), начиная с 00:15. Вы найдете его в 00:30. –

Смежные вопросы