Я запускаю алгоритмы анализа изображений на Apache-Spark с помощью Python.Pyspark: Сохранение изображений на HDFS
Использование Matplotlib, окончательный вывод, содержащий изображения (numpy 2D-массив) и графики (с использованием подзаголовка), должен сохраняться в общем изображении, таком как jpeg, png, tiff и т. Д. На HDFS.
Как ниже кода, я хочу, чтобы каждый исполнитель запускал RDD и сохранял файлы изображений. Есть ли способ сохранить файлы по hdfs от каждого исполнителя? Пожалуйста, поделитесь любыми идеями, если у вас есть.
Спасибо!
ax1 = plt.subplot(131)
plt.subplots_adjust(wspace=0.4)
im = plt.imshow(map1, interpolation='nearest')
divider = make_axes_locatable(ax1)
cax = divider.append_axes("right", size="2.5%", pad=0.1)
cb = plt.colorbar(im,cax=cax)
ax1.set_title("Test1")
ax2 = plt.subplot(132)
plt.imshow(map2, cmap='gray', interpolation='nearest')
ax2.set_title("Test2")
ax3 = plt.subplot(133)
plt.imshow(map3, cmap='gray', interpolation='nearest')
ax3.set_title("Test3")
plt.savefig(filepathname, bbox_inches = 'tight', pad_inches=0)