2013-09-06 4 views
0

ОК, поэтому у вас есть исторические данные в виде [say] массива целых чисел. Это, например, может представлять свободное пространство на сервере HDD в течение двух лет, причем каждый элемент массива представляет собой ежедневный образец.Алгоритм простого анализа тренда

данные (в свободном пространстве, в данном примере), имеет тенденцию к снижению, но и имеет периодические положительные всплески, когда файлы были удалены/сжаты, и т.д.

Как бы вы об определении общей тенденции к двухлетний период, т. е. сгладить пики и впадины в данных?

Теперь я сделал статистику уровня A, а затем модуль статистики в своей степени, но с тех пор я спал более 7000 раз, и хорошо, он просочился из моего мозга.

Я не после того, как немного кода как такового, больше описания того, как вы бы подойти к этой проблеме ...

Заранее спасибо!

ответ

2

Если бы я делал это, чтобы произвести линию через точки для меня смотреть, я бы, вероятно, использовать тот или иной вариант лесс, описанный в http://en.wikipedia.org/wiki/Local_regression, http://stat.ethz.ch/R-manual и/R-заплата/библиотека/статистика/html/лесс. HTML. В принципе, вы находите сглаженное значение в любой конкретной точке, делая взвешенную регрессию в точках данных вблизи этой точки, причем самые близкие точки имеют наибольший вес.

+0

Это именно то, что я искал - метод делать то, что вы делаете визуально, пытаясь определить выражение стиля y = n.x для набора данных. Спасибо. –

5

Вы получите много разных ответов, и тот, который вы выберете, действительно зависит от более конкретных требований, которые могут возникнуть у вас. Примеры:

  1. Фильтр нижних частот или любой другой метод спектрального анализа и использование низких частот для определения тренда.

  2. Линейная регрессия (время/значение), чтобы найти «r» (корреляция между временем и значением).

  3. Скользящее среднее из последних образцов «n». Если «n» достаточно велико, это мой любимый столько раз, сколько этого достаточно, и его очень легко закодировать. Это своего рода приближение к № 1 выше.

Я уверен, что они будут другими.

+0

Спасибо, Ницан. Позор Я не могу принять ответ на два сообщения. Проголосовать ++. –

Смежные вопросы