2014-11-03 2 views
0

Как функция ts() использует свой параметр frequency? Каков эффект назначения неправильных значений как frequency?Роль параметра частоты в ts

Я пытаюсь использовать данные об использовании веб-сайта за 1,5 года, чтобы построить модель временных рядов, чтобы я мог прогнозировать использование для следующих периодов. Я использую данные на ежедневном уровне. Что должно быть frequency здесь - 7 или 365 или 365,25?

+0

Частота - это компонент сезонности во временных рядах. Если у вас есть ежедневный набор данных, вы можете установить 365 как частоту, но вам нужно иметь как минимум 730 наблюдений (два периода). Несмотря на некоторые проблемы с ним в R, см. [Здесь] (http://stats.stackexchange.com/questions/65585/auto-arima-does-not-recognize-seasonal-pattern) для возможного решения. Частота 7 раз в неделю. Если ваши данные содержат один, вероятно, вы должны добавить его также, см. [Здесь] (http://stats.stackexchange.com/questions/52462/arima-double-seasonality-with-dummy-in-r-error-xreg) для примера –

+0

@Braj, пожалуйста, сообщите нам, что вы думаете о полученных ответах, например если он является правильным или, по крайней мере, полезным, или если ответы могут быть улучшены с дальнейшими разъяснениями. –

+0

@Maciej Baranowski: ts здесь - объект временных рядов в R. – Braj

ответ

0

Здесь параметр frequency не является частотой, которую вы можете наблюдать в данных ваших временных рядов. Вместо этого вы должны указать частоту, с которой были взяты образцы временного ряда. В вашем случае это просто 1 день, или 1.

Значение, которое вы здесь дадите, повлияет на результаты, которые вы получите позже при выполнении аналитических операций (примеры - это средние запросы на единицу времени или преобразование Фурье для получения (реальных) частот в данных). Например. если вы хотите получить все свои результаты в часах, а не в днях, вы должны были бы передать 24 вместо 1 как frequency, потому что ваши образцы данных были взяты с частотой 24 часа.

+0

То, что вы говорите и что говорит Стефан выше, звучит напротив меня. Не могли бы вы помочь мне разобраться! Это различие является основным соусом, который у меня есть! – Braj

+0

На самом деле это две разные вещи, которые описывают Стефан и я. Ваш вопрос касается параметра для некоторой функции, а не общего вопроса о том, что такое частота. Я думаю, что я ответил на ваш вопрос, в то время как Стефан обычно описывает, что такое частота. –

+0

Что описывает Стефан, это одна из вещей, которые вы можете захотеть выбраться из своих данных при ее обработке. То, что я описываю, важно на предыдущем шаге, когда вы создаете свой объект серии данных. –

0

frequency является периодом, в котором повторяются сезонные циклы. Я использую «the» в цитатах с запасом, так как, конечно, часто бывает несколько циклов в данных временных рядов. Например, ежедневные данные часто показывают недельные паттерны (частота 7) и годовые паттерны (частота 365 или 365,25 - разница часто не имеет значения).

В вашем случае я бы предположил, что недельные шаблоны доминируют, поэтому я бы назначил frequency=7. Если ваши данные имеют дополнительные шаблоны, например праздничные эффекты, вы можете использовать специализированные методы, учитывающие множественные сезонные периоды, или работать с фиктивным кодированием и структурой, основанной на регрессии.

Смежные вопросы