2016-02-18 3 views
0

У меня есть поток данных, по которым я хочу оценить плотность ядра (или гистограмму). Входным параметром является длина окна. Например, 60 секунд или 5 минут или месяц. Любые данные, превышающие размер окна, должны минимально оценивать оценку. Однако я не могу сохранить фактическую точку данных. Как только появится новый образец данных, я хочу добавить его в оценку и отбросить. Поскольку это среда с ограниченными ресурсами (как ЦП + память), метод предпочтительно должен быть O (1) в пространстве и временной сложности.Оценка плотности ядра на основе ядра

Есть ли готовые библиотеки, которые уже выполняют эту работу? Я бы предпочел что-то в GO, но я бы взял реализацию на любом языке.

Если нет существующих реализаций, существует ли алгоритм, который я могу ссылаться и реализовывать?

(Поиск по Google не дал мне никакого прямого ответа, я новичок в машинное обучение и статистику)

ответ

1

Геометрический распадающаяся гистограмма будет выполнять работу.

$$ ч (я) = Л (я) * (1 - е^{- 1/\ тау}) + е^{- 1/\ тау} \ дельта (Ij) $$

где $ j $ - новое наблюдение, $ h (i) $ - текущая средняя гистограмма, а $ \ tau $ - постоянная времени.

Смежные вопросы