2016-08-02 3 views
-1

Это мой первый вопрос здесь, и я был бы очень благодарен, если бы y'all мог мне помочь.Соответствующие записи между таблицей Hive и таблицей Netezza

Я запустил импорт sqoop для переноса стола из Netezza в Hive. Теперь мне нужно сопоставить записи из таблицы Netezza с таблицей Hive, чтобы проверить, что все записи были успешно импортированы в улей. Мне нужно убедиться, что каждая запись одной таблицы сопоставляется с другой, а также обнаруживает непревзойденные записи, если они есть. Мой руководитель проекта предложил использовать сценарий для фильтрации непревзойденных записей и вставки в новые таблицы. (Соедините обе таблицы с помощью уникального ключа и используйте «где», чтобы отфильтровать несогласованные записи). Проблема в том, что я новичок в Hadoop и не знаю, как это сделать.

Не могли бы вы помочь?

ответ

0

Первым делом вы можете запустить запрос SELECT, чтобы подсчитать количество ребер на импортированной таблице Hive.

select count(*) from hive_table; 

Если отсчеты не совпадают между таблицей Netezza и улья таблицы, то вам необходимо сначала проверить журналы, которые генерируются во время Sqoop импорта. Это даст вам представление о том, почему реплики не были загружены.

+0

У меня уже есть счетчик (*) и количество записей. Есть ли способ получить доступ к таблице Netezza из улья? – Shaunte

+0

Нет, я так не думаю. Таблица/данные должны быть на HDFS для Hive для доступа к ней для любых вычислений. – JPWorks

Смежные вопросы