Нужно ли проверять контрольную сумму после перемещения файлов в Hadoop (HDFS) с сервера Linux через Webhdfs?Проверка контрольной суммы в Hadoop
Я хотел бы убедиться, что файлы на HDFS не повреждены после их копирования. Но нужно ли проверять контрольную сумму?
Я прочитал клиент делает контрольную сумму, прежде чем данные записываются в HDFS
Может кто-нибудь помочь мне понять, как я могу убедиться, что исходный файл в системе Linux является такой же, как съеденной файл на HDFS с помощью webhdfs.
контрольной суммы файла на linux box и hdfs идут разные –
'hadoop fs -checksum файл: /// path/in/linux/file1' не работал для меня, он возвращает 'NONE'. любые идеи почему? –
Является ли ваш путь 'file: /// path/in/linux/file1' hdfs path? – Abhi