У меня есть 2 набора данных, один из смоделированных (искусственных) данных и другой с наблюдаемыми данными. Они имеют несколько разные статистические распределения, и я хочу заставить моделированные данные соответствовать наблюдаемому распределению данных в распространении данных. Другими словами, мне нужны смоделированные данные, чтобы лучше представлять хвосты наблюдаемых данных. Вот пример.Изменение распределения одного набора данных в соответствии с другим набором данных
model <- c(37.50,46.79,48.30,46.04,43.40,39.25,38.49,49.51,40.38,36.98,40.00,
38.49,37.74,47.92,44.53,44.91,44.91,40.00,41.51,47.92,36.98,43.40,
42.26,41.89,38.87,43.02,39.25,40.38,42.64,36.98,44.15,44.91,43.40,
49.81,38.87,40.00,52.45,53.13,47.92,52.45,44.91,29.54,27.13,35.60,
45.34,43.37,54.15,42.77,42.88,44.26,27.14,39.31,24.80,16.62,30.30,
36.39,28.60,28.53,35.84,31.10,34.55,52.65,48.81,43.42,52.49,38.00,
38.65,34.54,37.70,38.11,43.05,29.95,32.48,24.63,35.33,41.34)
observed <- c(39.50,44.79,58.28,56.04,53.40,59.25,48.49,54.51,35.38,39.98,28.00,
28.49,27.74,51.92,42.53,44.91,44.91,40.00,41.51,47.92,36.98,53.40,
42.26,42.89,43.87,43.02,39.25,40.38,42.64,36.98,44.15,44.91,43.40,
52.81,36.87,47.00,52.45,53.13,47.92,52.45,44.91,29.54,27.13,35.60,
51.34,43.37,51.15,42.77,42.88,44.26,27.14,39.31,24.80,12.62,30.30,
34.39,25.60,38.53,35.84,31.10,34.55,52.65,48.81,43.42,52.49,38.00,
34.65,39.54,47.70,38.11,43.05,29.95,22.48,24.63,35.33,41.34)
summary(model)
Min. 1st Qu. Median Mean 3rd Qu. Max.
16.62 36.98 40.38 40.28 44.91 54.15
summary(observed)
Min. 1st Qu. Median Mean 3rd Qu. Max.
12.62 35.54 42.58 41.10 47.76 59.2
Как я могу заставить данные модели иметь изменчивость, которую наблюдаемый имеет в R?
Это больше похоже на математическое обсуждение, а затем на программирование. Возможно, это было бы хорошо на [Cross Validated] (http://stats.stackexchange.com)? (Кроме того, «более высокая частота» не имеет контекста с текущими данными. Возможно, вам придется изменить свой образец, чтобы правильно отразить характер временных рядов.) – r2evans
Кроме того, вы должны указать тип распространения и параметры дистрибутива 'model', если это не просто другое эмпирическое распределение, и в этом случае вам нужно четко указать, что у вас есть два эмпирических распределения. – r2evans
@ r2evans Хороший момент, я избавился от лишнего вопроса.Я не уверен, что тип распределения и параметры для дистрибутива 'model', но это смоделированные данные. –