У меня есть файл размером 7GB .tgz, который является архивом тысяч фотографий с высоким разрешением, с которыми я хотел бы работать в Python. Я могу сделать все следующее в случае одного изображения, но я не уверен, как работать с такими большими данными и форматом файла .tgz. У меня есть Googled, но, возможно, я не использую лучшие поисковые термины. Явный код будет наиболее полезен для меня, чтобы понять.Обработка больших данных в Python
Как загрузить данные .tgz в Python? (pickle, numpy, tarfile? pip install tarfile терпит неудачу.) В конечном итоге я захочу преобразовать их в массивы numpy.
Как сделать все изображения в заданное разрешение?
Как преобразовать все изображения в оттенки серого?
Целью является манипулирование данными для использования в сверточной нейронной сети (CNN).
Хотя, не совсем ответ и еще одно предложение: если вам нужно обработать данные, возможно, стоит сначала распаковать данные, а затем обработать распакованные изображения несколько раз. –