У меня есть две столбца временной метки в кадре данных, которые я хотел бы получить в минуту, или, наоборот, часовую разницу. В настоящее время я могу получить разницу в день, с округлением, делаяSpark Scala: DateDiff из двух столбцов по часам или минутам
val df2 = df1.withColumn("time", datediff(df1("ts1"), df1("ts2")))
Однако, когда я смотрел на странице дока https://issues.apache.org/jira/browse/SPARK-8185 я не видел какие-либо дополнительные параметры, чтобы изменить единицы. Является ли их другой функцией, которую я должен использовать для этого?
Мое решение будет вычислять значение для каждой строки в DataFrame. Пожалуйста, будьте более конкретными, если есть проблема с этим. Кроме того, для вашего решения я считаю, что лучше избегать строковых выражений (сложнее протестировать и подвергнуть больше ошибок): 'val df2 = df1.select ((unix_timestamp (ts1) - unix_timestamp (ts2))/3600D)' , –