Я новичок в концепции концепции уменьшения стоимости и задаюсь вопросом, может ли быть решена следующая проблема.Карта Уменьшить для анализа временных рядов
У нас есть журнал данных в форме, как это:
TransID Date Operation DocumentID User
1 01/01/2010 Open aaa Anne
2 01/11/2010 Close aaa Anne
3 01/12/2010 Open bbb Mary
4 01/12/2010 Close bbb Mary
Мы хотим, чтобы иметь возможность рассчитать различные показатели времени, такие как:
- Сколько времени проходит между открытым и Близкие операции в среднем по всему миру? или
- Сколько времени проходит между Open и Close average для каждого пользователя?
Есть ли простой способ достичь этого с помощью map-reduce? Мы рассматриваем MongoDB или Hadoop.
Объем данных может быть большим - миллиарды записей. Благодаря!
Это, безусловно, возможно, я сделал это раньше. –