Мне нужен результирующий фрейм данных в строке ниже, чтобы иметь псевдоним «maxDiff» для столбца max ('diff') после groupBy. Однако нижняя строка не меняет никаких изменений и не выдает ошибку.Атрибут столбца после groupBy в pyspark
grpdf = joined_df.groupBy(temp1.datestamp).max('diff').alias("maxDiff")
да .. это работает .. кроме этого func. не требуется – mhn
Это не так, если вы уже импортировали 'pyspark.sql.functions' в свой скрипт – Nhor