Я начинающий для PySpark, недавно я попытался отправить простое приложение python (пакетное изменение размера) в мой искровой кластер. Я могу запустить приложение через pycharm успешно, и когда я подаю заявку на иск, изображения также будут изменены.Как правильно преобразовать обычное приложение Python в версию PySpark
это мой исходный код Python:
import os
from PIL import Image
size_64 = (64,64)
for f in os.listdir('.')
if f.endswith('.jpg'):
i = Image.open(f)
fn, fext = os.path.splitext(f)
i.thumbnail(size_64)
i.save('resize/{}_64'.format(fn, fext))
Тогда я превратил его так, что я думал, что я могу представить мой питон приложение правильно:
import os
from PIL import Image
from pyspark import SparkContext, SparkConf
APP_NAME = "ImageResizer"
def main(sc):
size_64 = (64,64)
for f in os.listdir('.')
if f.endswith('.jpg'):
i = Image.open(f)
fn, fext = os.path.splitext(f)
i.thumbnail(size_64)
i.save('resize/{}_64'.format(fn, fext))
print 'done'
if __name__ == "__main__":
conf = SparkConf().setAppName(APP_NAME)
conf = conf.setMaster("spark://10.233.70.48:7077")
sc = SparkContext(conf=conf)
main(sc)
Однако, мне сказали, что я фактически не использовал искру (я так думаю, но я просто не знаю, как). Мне интересно, как я могу правильно преобразовать исходный код в путь Pyspark.
Может ли кто-нибудь, кто знаком с pyspark, помочь мне? И любые предложения о том, где я могу правильно и систематически научиться писать приложения PySpark? Спасибо
Является ли это опечатка ?: я - Image.open (е) –
@nfreze да, извините. –