2009-12-29 2 views
4

Мне нужно написать программу, которая выполняет арифметику (+ - * /) в многократных временных рядах различного диапазона дат (в основном с 2007-2009 гг.) И частоты (еженедельно, ежемесячно, ежегодно. ..).Самый полезный способ сравнить несколько временных рядов

я придумал:

  • найти ряд с самым высоким Freq. затем заполнить другую серию нулями, чтобы они имели одинаковое количество элементов. затем выполните операцию.

Как я могу представить данные наиболее значимым образом?

Пытаясь думать обо всех возможностях

+0

Почему вы хотите, чтобы серия имела одинаковое количество элементов? Ваши цели для представления данных? –

+0

Целью является поиск наиболее значимого способа представления данных на графике. было бы бессмысленно, если бы у него была неравномерная шкала времени? я мог ошибаться – Peter

+0

Может быть, дать простой пример? – wallyk

ответ

2

Если ноль может быть содержательным значение этого временного ряда (например, температура в градусах Цельсия), он не может быть хорошей идеей, чтобы заполнить все пробелы нулями (т.е. вас не смогут отличить реальные значения и значения заглушки впоследствии). Вы можете захотеть interpolate ваших временных рядов. Основной структурой данных для этого может быть массив/двойной список.

1

Вы можете взять несколько подходов:

  • использовать лучшие зерна временных рядов данные (например, секунду) и интерполировать/заполнить данные при необходимости
  • использовать грубейшие мелкозернистый (например, года) и суммировать данные при необходимости
  • любой средний шаг между двумя крайностями

Вы всегда должны знать ваши данные, потому что:

  • в случае интерполирования вы должны выбрать лучший алгоритм (линейный или квадратичную интерполяцию, сплайны, экспоненциальную ...)
  • в случае подведения итогов вы должны выбрать соответствующую функцию агрегации (сумма, максимальная, средняя ...)

Как только вы будете иметь одинаковые временные шкалы для всех временных рядов, вы можете выполнить свою арифметическую магию, но помните, что интерполяция генерирует дополнительную информацию, а обобщение удаляет доступную информацию.

1

Я довольно подробно изучил эту проблему. Опасность интерполяционных методов заключается в том, что вы смещаете различные меры - особенно волатильность - и вводите ложную корреляцию. Я обнаружил, что интерполяция Фурье смягчила это до некоторой степени, но лучший подход заключается в том, чтобы пойти другим путем: объединить ваши более частые наблюдения, чтобы соответствовать периодичности вашей менее частой серии, а затем сравнить их.

Смежные вопросы