2016-05-02 3 views
0

У меня есть исходная таблица MySql. Я должен экспортировать дату в Hive для аналитической цели. Первоначально, когда размер данных в MySQL был менее полным, экспорт данных Mysql в Hive не был проблемой с использованием Sqoop. Теперь, когда мой размер данных вырос, как я могу получить инкрементное обновление данных MySql для улья?Инкрементные обновления в Hive

ответ

0

Вы можете использовать sqoop для дополнительных обновлений, Sqoop документация хорошо, вот ссылка https://sqoop.apache.org/docs/1.4.2/SqoopUserGuide.html#_incremental_imports

+0

Спасибо за указание на то, что. Еще одна вещь. Как обрабатывать «обновленные» записи, поскольку «Улей» добавляется только. Нам еще предстоит перейти на обновленный Hive, который поддерживает транзакцию. – sss

+0

Создать улей вид на столе в результате только новые записи Некоторые вещи, как выберите t1. * Из тест-t1 присоединиться ( выберите идентификатор, макс (доработанный) maxModified из тестовой группы по идентификатору ) s на t1.id = s.id и t1.modifed = s.maxModified – vgunnu

Смежные вопросы