Мы используем Cloudera CDH 4, и мы можем импортировать таблицы из наших баз данных Oracle в наш склад HDFS, как ожидалось. Проблема в том, что у нас есть 10 тысяч таблиц внутри наших баз данных, и sqoop поддерживает только импорт одной таблицы за раз.sqoop import multiple tables
Какие опции доступны для импорта нескольких таблиц в HDFS или Hive? Например, какой был бы лучший способ импортировать 200 таблиц из oracle в HDFS или Hive за раз?
Единственным решением, которое я видел до сих пор, является создание задания sqoop для каждого импорта таблицы и последующего запуска их по отдельности. Поскольку Hadoop предназначен для работы с большим набором данных, похоже, что должен быть лучший способ.
Можете ли вы рассказать мне, как я могу напрямую импортировать эти таблицы в улей, чтобы в конкретную базу данных в улье – Shantesh