У меня есть набор данных, более 1000 строк и 20 атрибутов (показано в столбцах). Я хочу использовать среднюю центрировку, которая включает в себя удаление среднего значения из каждого значения, чтобы дать среднее значение 0. Удаляем ли я среднее значение атрибута по атрибуту или удаляем среднее из всех атрибутов из каждого?Статистическое среднее центрирование - с использованием общего среднего значения или атрибута
Например, если среднее значение атрибута A равно 500, а среднее значение атрибута B равно 1000. Для всех значений в А я мог бы удалить 500, который дает атрибут среднее 0. Тогда я мог бы сделать то же самое для атрибута B.
ИЛИ
Я мог бы взять 750 от всех значений для обоих атрибутов.
Более статистически верно?
Мой вопрос связан с этим: Если я вычитаю разные значения из разных атрибутов, тогда атрибуты не будут сопоставимы, так как каждая сумма была взята из каждой суммы. Если я вычитаю одно и то же значение из всех, то некоторые столбцы могут быть заполнены только отрицательными цифрами (и таким образом отрицают эффект средней центрировки).
Спасибо,
Спасибо, это фантастическое объяснение, и это действительно помогает. – ThePerson