У меня есть класс с именем some_class() в файле Python здесь:Передача функций класса в PySpark РДУ
/some-folder/app/bin/file.py
Я ввожу его в свой код здесь:
/some-folder2/app/code/file2.py
По
import sys
sys.path.append('/some-folder/app/bin')
from file import some_class
clss = some_class()
Я хочу использовать функцию этого класса с именем some_function в карте искры
sc.parallelize(some_data_iterator).map(lambda x: clss.some_function(x))
Это дает мне ошибку:
No module named file
While class.some_function, когда я называю его пределами карты функция pyspark, т.е., как правило, но не в РДУ pySpark в. Я думаю, что это как-то связано с pyspark. Я понятия не имею, где я ошибаюсь.
Я пробовал трансляцию этого класса и все еще не работал.
Есть ли способ добавить папку в путь вместо одного файла – mousecoder
addPyFile может принимать файл 'zip'. Вы можете закрепить все дерево исходных текстов, а затем добавить его с помощью addPyFile. – KSR