0
Есть 100 файлов изображений с различными цветами .Я хочу, чтобы получить уникальный образ на основе цветаКак обрабатывать файлы изображений с помощью PIG
Есть 100 файлов изображений с различными цветами .Я хочу, чтобы получить уникальный образ на основе цветаКак обрабатывать файлы изображений с помощью PIG
Там нет встроенного в Hadoop/Свиньи API для обработки данных изображения.
Для обработки данных изображения с помощью Свиньи/MapReduce, выполните следующие действия:
конвертировать все изображения в Sequence Файл/Files
Key Value Image_file_id Image Content
нагрузки это файл в HDFS.
прибудет MD5SUM изображений и удалить duplciates –
обратитесь к этой статье: http://www.hadoopsphere.com/2013/02/data-de-duplication-tactics-with-hdfs.html –