У меня есть два набора данных. FIRST
- это список продуктов и их ежедневные цены от поставщика, а SECOND
- это список дат начала и окончания (а также другие важные данные для анализа). Как я могу рассказать Stata, чтобы вытащить цену в начале, а затем в конце дня с FIRST
в SECOND
на указанные даты. Обратите внимание: если нет точной даты сопоставления, я бы хотел, чтобы она получила доступную последнюю дату. Например, если у SECOND
есть дата 1/1/2013, а у FIRST
есть цены на ... 12/30/2012, 12/31/2012, 1/2/2013, ... он возьмет 12/31/2012 цена.Объединение данных для индивидуального анализа
Обычно я делаю это с помощью Excel, но у меня есть миллионы наблюдений, и это невозможно.
Я поставил пример FIRST
и SECOND
, а также то, что оптимальным решением было бы дать в качестве выхода POST_SECOND
FIRST
Product Price Date
1 3 1/1/2010
1 3 1/3/2010
1 4 1/4/2010
1 2 1/8/2010
2 1 1/1/2010
2 5 2/5/2010
3 7 12/26/2009
3 2 1/1/2010
3 6 4/3/2010
SECOND
Product Start Date End Date
1 1/3/2010 1/4/2010
2 1/1/2010 1/1/2010
3 12/26/2009 4/3/2010
POST_SECOND
Product Start Date End Date Price_Start Price_End
1 1/3/2010 1/4/2010 3 4
2 1/1/2010 1/1/2010 1 1
3 12/26/2009 4/3/2010 7 6
@SOConnell Объединение данных в один и внесение переменных индикатора, но это становится очень грязным и плохо работает – CJ12