У меня есть dataframe с конфигурируемые имена столбцов, напримерКак переименовать имена столбцов в свече SQL
Journey channelA channelB channelC
j1 1 0 0
j1 0 1 0
j1 1 0 0
j2 0 0 1
j2 0 1 0
конфигурируемые я имею в виду не может быть «п» каналы в dataframe.
Теперь мне нужно преобразование, в котором мне нужно найти сумму всех каналов что-то вроде
df.groupBy("Journey").agg(sum("channelA"), sum("channelB"), sum("channelC"))
Выход из которых будет:
Journey sum(channelA) sum(channelB) sum(channelC)
j1 2 1 0
j2 0 1 1
Теперь я хочу, чтобы переименовать названия колонок к исходным названиям, и я мог бы сделать это с помощью
.withColumnRenamed("sum(channelA)", channelA)
но, как я упоминал канал список настраивается, и я хотел бы, чтобы общее утверждение колонки переименования переименовать все мои суммированные столбцы в исходные имена столбцов, чтобы получить ожидаемый dataframe как:
Journey channelA channelB channelC
j1 2 1 0
j2 0 1 1
Любые предложения, как подойти к этой