мне интересно, как я могу достичь следующих в Спарк (Pyspark)Спарк добавить новый столбец dataframe со значением из предыдущего ряда
Начальная Dataframe:
+--+---+
|id|num|
+--+---+
|4 |9.0|
+--+---+
|3 |7.0|
+--+---+
|2 |3.0|
+--+---+
|1 |5.0|
+--+---+
Результирующая Dataframe:
+--+---+-------+
|id|num|new_Col|
+--+---+-------+
|4 |9.0| 7.0 |
+--+---+-------+
|3 |7.0| 3.0 |
+--+---+-------+
|2 |3.0| 5.0 |
+--+---+-------+
Мне удается «добавить» новые столбцы к фреймворку данных, используя что-то вроде: df.withColumn("new_Col", df.num * 10)
Однако я не знаю, как я могу добиться этого «сдвига строк» для нового столбца, так что новый столбец имеет значение поля из предыдущей строки (как показано в примере). Я также не мог найти ничего в документации API о том, как получить доступ к определенной строке в DF по индексу.
Любая помощь будет оценена по достоинству.