Я работаю над побочным проектом, в котором мы хотим обрабатывать изображения в программе создания карты памяти (для возможного развертывания на эластичной карте Amazon mapreduce). Ввод в процесс будет списком всех файлов, каждый из которых содержит немного дополнительных данных (лат/длинное положение нижнего левого угла - это аэрофотоснимки).Hadoop: обрабатывать файлы изображений в коде Python
Фактическая обработка должна проходить в Python, чтобы мы могли использовать библиотеку изображений Python. Все примеры потоковой передачи Python, которые я могу найти, можно использовать для ввода текста stdin и процесса. Могу ли я отправлять данные изображения на Python через stdin? Если да, то как?
Я написал класс Mapper в Java, который принимает список файлов и сохраняет имена, дополнительные данные и двоичное содержимое в файл последовательности. Я думал, может быть, мне нужно написать собственный Java-конвертер, который принимает файл последовательности и передает его на Python. Это правильный подход? Если да, то какова должна быть Java для вывода изображений и Python для их просмотра?
В случае, если это не очевидно, я не очень знакомы с Java ИЛИ Python, так что возможно я просто откусить намного больше, чем я могу жевать это как мое введение в обоих языках ...