У меня есть кадр данных, который имеет столбец с секундами секунд.
В дополнение к этому я хотел бы добавить столбец, который содержит разницу между текущим и предыдущим значением времени, другими словами, временную разницу с последней строки в кадре данных на основе столбца временной метки.Создать новый столбец в Spark DataFrame с разницей предыдущих значений из другого столбца
Как бы добавить такой столбец на основе более ранних значений?
Я использую Scala API.
Вы группируете/разделяете данные? – zero323
Не так давно - только что перечислили все строки из журнала и хотите наметить некоторые измерения в зависимости от времени –
Если вы не группируете кадры данных, вы не будете работать для вас (я имею в виду, что вы можете, но вы действительно этого не хотите) , Вместо этого используйте скользящее: http://stackoverflow.com/a/32679114/1560062. Если вы решили сгруппировать, вы можете использовать функции окна, как показано здесь: http://stackoverflow.com/q/34535833/1560062 – zero323