Я посылаю вывод одной функции, которая является dataframe для другой функции.Как передать вывод одной функции другой в Spark
val df1 = fun1
val df11 = df1.collect
val df2 = df11.map(x =fun2(x,df3))
Выше 2 строки являются главными функциями. Df1 очень большой, поэтому, если я собираюсь на драйвере, он дает выход из памяти или gc. Какие r способов отправить вывод одной функции другой в искру?
почему вы делаете оплаченный здесь? вы всегда можете сделать df1.map (x => fun2 (x)) – Knight71
Если я не добавлю коллекцию, тогда она дает ошибку исключения нулевого указателя. Потому что мы должны собрать результат у водителя. –