2013-10-08 3 views
0

Я работаю над моделью прогнозирования оттока игрока для игры. У меня есть количество раундов, которые играли временные ряды в течение 60 дней. Прежде чем подавать временные ряды алгоритмам классификации, мне нужно нормализовать временные ряды.Нормализация временных рядов, как обращаться с нулями

Я думал об использовании нормировки min-max с помощью преобразования x в x/Max (x). Макс (x) в 60-дневном временном ряду не обязательно отражает пик того, сколько раз игрок обычно играет день.

Но z-нормализация с помощью преобразования x в (x-mean (x))/std (x) не будет работать, так как мне нужно сохранить информацию о днях без воспроизведения, равна нулю. Выполнение z-нормализации отображает 0 в разные значения, что делает их несравнимыми.

Существует ли схема нормализации, которая не требует информации о максимуме временных рядов и может отображать 0 еще до 0?

ответ

0

Вы можете преобразовать свои значения в вероятности путем деления каждого значения в массиве на сумму значений в массиве (коэффициент нормирования «сумма до единицы»). Ietransform x to x./sum(x) Это будет отображать 0 значений в 0 и не требует информации о максимальном значении.

+0

это не может быть ответом.Put как комментарий – DevelopmentIsMyPassion

Смежные вопросы