Краткий ответ: Это фундаментальная характеристика функции журнала.
считают:
log(x), where x spans (0,1)
Диапазон значений LOG (х) можно взять:
is (-Inf, 0)
Более конкретно на ваш вопрос - логарифмического правдоподобия определяется по формуле: (фото)
l(w) = y * log(h(x)) + (1 - y) * log (1 - h(x))
where,
h(x) is a sigmoid function parameters by w:
h(x) = (1 + exp{-wx})^-1
Для простоты рассмотрим случай учебного примера, где у = 1, уравнение принимает вид:
правдоподобия (л):
= y * log (h(x));
= log (h(x))
ч (х) в логистической регрессии, может быть представлена с помощью функции сигмовидной. он имеет диапазон (0,1)
Следовательно, спектр (л):
(log (0), log(1)) = (-Inf, 0)
(l) spans the range (-Inf, 0)
выше упрощение только рассмотрел (у = 1) случай. Если вы считаете всю функцию правдоподобия журнала (т. Е. Для y = 1 & y = 0), вы увидите функцию с перевернутой чашей.Следовательно, существует оптимальный вес, который максимизирует логарифмическую вероятность (l) или минимизирует отрицательную логарифмическую вероятность (-l)