2014-02-04 4 views
1

Я работаю над вычислением ковариации вручную в matlab (без использования функции cov). Во всяком случае, я смущен тем, почему и когда нормализуется N или N-1. Мне были предоставлены образцы данных размером 2x400. Таким образом, две переменные и 400 выборок. Может ли кто-нибудь объяснить, когда определенная нормализация уместна или она слегка субъективна? СпасибоСоотношение: нормализовать на N или N-1?

ответ

0

Для оценки отклонения , используя N-1 вместо N, имеет целью корректировать смещение оценки. См., Например, here. Для covariance Думаю, это та же идея.

1

Нормализация по N-1 является «правильной» в том смысле, что результирующая оценка несмещена. Это означает, что если номер выборки переходит на бесконечность, оценка ковариации приближается к истинной ковариации.

Если вы нормализуетесь на N, оценка имеет (слегка) более низкий уровень шума, но является смещенным, то есть дает неправильный результат, если N приближается к бесконечности.

Обратите внимание, что приведенное выше применяется только в том случае, если вы не знаете среднего значения: Если вы знаете средние значения, нормализация по N правильная (вам также необходимо подключить правильные средства в формуле , конечно).

+0

Чтобы использовать технические термины, деление на «N» является оценкой максимального правдоподобия, а деление на «N-1» является несмещенной оценкой минимальной дисперсии. –

Смежные вопросы