У меня вопрос о реализации hadoop в одном из моих проектов. В основном требование состоит в том, что мы ежедневно получаем buch журналов, содержащих информацию о видео (когда он был воспроизведен, когда он остановился, какой пользователь играет его и т. Д.).Использование hadoop для анализа данных
Нам необходимо проанализировать эти файлы и вернуть данные статистики в ответ на запрос HTTP. Пример запроса: http://somesite/requestData?startDate=someDate&endDate=anotherDate. В основном этот запрос запрашивает количество всех видеороликов, воспроизводимых между диапазоном дат.
Мой вопрос в том, можем ли мы использовать hadoop для решения этой проблемы?
Я читал в различных статьях hadoop не в режиме реального времени. Итак, чтобы подойти к этому сценарию, я должен использовать hadoop в сочетании с MySQL?
Что я думал о том, чтобы написать картографическую/уменьшающую работу и хранить счетчик для каждого видео за каждый день в mysql. Работу hadoop можно планировать как один раз в день. Затем данные Mysql могут использоваться для обслуживания запроса в режиме реального времени.
Правильно ли этот подход? Куст полезен в этом каким-либо образом? Просьба дать некоторые рекомендации по этому вопросу.