У меня есть таблица, в которой нет первичного ключа и даты/времени. Эта таблица аналогична таблице транзакций, которая сохраняет все данные (Нет удаления/обновления).Инкрементная загрузка данных с использованием sqoop без первичного ключа или метки времени
Моя проблема теперь заключается в том, что я хочу, чтобы данные HDFS попадали в HDFS, не загружая всю таблицу снова каждый раз, когда я запускаю инкрементную нагрузку.
Код ниже содержит последнюю строку, импортированную в HDFS, если моя таблица имеет первичный ключ.
sqoop job \
--create tb_w_PK_DT_append \
-- \
import \
--connect jdbc:mysql://10.217.55.176:3306/SQOOP_Test \
--username root \
--incremental append \
--check-column P_id \
--last-value 0 \
--target-dir /data \
--query "SELECT * FROM tb_w_PK_DT WHERE \$CONDITIONS" \
-m 1;
Любое решение для получения последних данных, импортированных без изменения первичного ключа или даты.
У меня есть аналогичное требование, но запись будет удалена/обновляется в источнике РСУБДЕ без какого-либо уникального идентификатора столбца или меток времени. любая идея о том, как ее решить? – kumsgs