Это мой первый вопрос здесь, и я был бы очень благодарен, если бы y'all мог мне помочь.Соответствующие записи между таблицей Hive и таблицей Netezza
Я запустил импорт sqoop для переноса стола из Netezza в Hive. Теперь мне нужно сопоставить записи из таблицы Netezza с таблицей Hive, чтобы проверить, что все записи были успешно импортированы в улей. Мне нужно убедиться, что каждая запись одной таблицы сопоставляется с другой, а также обнаруживает непревзойденные записи, если они есть. Мой руководитель проекта предложил использовать сценарий для фильтрации непревзойденных записей и вставки в новые таблицы. (Соедините обе таблицы с помощью уникального ключа и используйте «где», чтобы отфильтровать несогласованные записи). Проблема в том, что я новичок в Hadoop и не знаю, как это сделать.
Не могли бы вы помочь?
У меня уже есть счетчик (*) и количество записей. Есть ли способ получить доступ к таблице Netezza из улья? – Shaunte
Нет, я так не думаю. Таблица/данные должны быть на HDFS для Hive для доступа к ней для любых вычислений. – JPWorks