Java Сегмент Большой массив данных

-1

У меня есть огромные данные в приведенном ниже форматеJava Сегмент Большой массив данных

 TIME STAMP Sum of T2I Obj 
     11/17/2014 00:02:13 a 0.524 
     11/17/2014 00:05:49 a 2.104 
     11/17/2014 00:09:06 a 3.245 
     11/17/2014 00:14:25 a 13.427 
     11/17/2014 00:15:36 a 2.832 
     11/17/2014 00:17:13 a 3.098 
     11/17/2014 00:20:49 a 0.751 
     11/17/2014 00:24:16 a 0.884

Полный вход:

https://docs.google.com/spreadsheets/d/168ejowAajGfXv-JBQKm7u3_G8-oPM8Mfn1TC-3MzXsA/edit?usp=sharing

Обработанные Выходной файл: (см последний лист один час выходной и нужно изменить что до восьми часов)

МОЙ ПОЛНЫЙ КОД Попробованная:

https://drive.google.com/file/d/0BzTX2wIhk3Wza1lGVmhHcFZQX0k/view?usp=sharing

Как вы можете видеть, указанный файл имеет дату в одном столбце и значения в другом столбце.

Я хочу сегментировать все отдельные данные для комбинированных данных для 8-часового интервала.

т.е.

TIME STAMP  Average 
    11/17/2014 08 0.524 (AVG of all the data between 00hr -8hr) 
    11/17/2014 16 2.104 (AVG of all the data between 08hr -16hr) 
    11/17/2014 24 3.245 (AVG of all the data between 16hr -24hr)

Любая помощь от экспертов Java !!

источник

2014-12-10 Satishtamilan

Прежде всего: я не вижу здесь фактического вопроса, и, поскольку никто не будет просто писать какой-то код из синего, вы можете рассказать нам, с чем именно вы боретесь. Тогда возникает вопрос: как именно будет рассчитан ваш результат? (например, почему интервалы 0h-8h, 8h-16h и т. д., откуда они берутся?) – GameDroids

HI @ Dinistro Я включил полный код и входной файл. Я могу обрабатывать выходные данные за каждый час. Я нахожу вызов для объединения 8 часов. – Satishtamilan

Выходной файл прилагается ниже .. https://docs.google.com/spreadsheets/d/1WWbVD0HF349KNCTxR2UJzpXuKCNSq0eHPU4Uf9qdZHQ/edit?usp=sharing – Satishtamilan

Что вы пытаетесь сделать здесь, это процесс ETL. Лучше использовать некоторую структуру, которая делает это, например, kettle. Если у вас есть распределенные данные, то лучше использовать задания hadoop mapreduce.

источник

2014-12-10 14:32:49 Raghuveer

HI Рагувир, Есть примеры для вышеуказанных случаев решенных с Kettle .. – Satishtamilan

В одном из моих предыдущая команда проектов использовала чайник с drule, чтобы решить шаблон ETL. Однако я не использовал его лично. – Raghuveer

Java Сегмент Большой массив данных

ответ

Смежные вопросы