2014-01-05 8 views
1

У меня возникли трудности с установкой дискретной функции распределения (я специально использую отрицательное биномиальное распределение). Вот моя настройка: у меня есть источник входящих элементов, каждый из которых имеет неизвестную продолжительность жизни. Каждый день, некоторые истекает (большая часть в первый день, еще немного на второй день и т. Д.). Для существующего источника входящих элементов (источник старше 180 дней) мне удалось смоделировать продолжительность жизни нового элемента с отрицательным биномиальным распределением до приемлемой ошибки (используя MLE - Оценка максимального правдоподобия).Установка дискретного (отрицательного биномиального) распределения для ранних значений данных

Проблема Проблема возникла из-за новых источников поступающих предметов. Я хочу оценить срок службы их предметов через короткое время (скажем, через 5-7 дней). Когда я пытаюсь применить MLE, я получаю значительно более низкие значения (т. Е. 3 вместо 30). Я предполагаю, что это потому, что MLE не может понять, что масса последнего дня (7-й день) на самом деле является 1-CDF (6) (кумулятивная функция распределения за предыдущие 6 дней) и фактически содержит живые предметы.

Существует ли хороший подход к дискретному распределению только на основе ранних значений данных и суммы массы других значений? Я мог бы написать некоторую оптимизационную функцию для нее и дать вес только 6 дням, но я чувствую, что это даст мне субоптимальную производительность.

У меня все в порядке с теоретическим объяснением, но если вы можете обращаться к определенным функциям или библиотекам, я могу работать в Matlab, R, Python и C#.

ответ

0

Проблема, с которой вы столкнулись, называется «цензурированными» данными. По сути, вы определенно знаете, что время жизни некоторых предметов больше (теперь минус время начала). Ваша догадка о том, как исправить функцию правдоподобия, указывает в правильном направлении. Я думаю, что цензурные данные обычно рассматриваются в текстах по анализу выживаемости. В статье [1] в Википедии есть несколько кратких замечаний о цензурированных данных, которые также могут помочь.

Существует пакет для анализа выживания в R, названном «выживание». Могут быть другие пакеты R. Dunno о пакетах для других систем.

[1] http://en.wikipedia.org/wiki/Survival_analysis

+0

Спасибо! Смотрю. –

Смежные вопросы