2016-08-07 6 views
1
df1: 

Timestamp: 

1995-08-01T00:00:01.000+0000 

Есть ли способ отделить день месяца от столбца временной метки кадра данных с помощью pyspark. Не в состоянии предоставить код, я новичок в искру. У меня нет подсказки о том, как действовать.Временная разметка в pyspark

ответ

2

Вы можете разобрать этот штамп времени с помощью UNIX_TIMESTAMP:

from pyspark.sql import functions as F 

format = "yyyy-MM-dd'T'HH:mm:ss.SSSZ" 
df2 = df1.withColumn('Timestamp2', F.unix_timestamp('Timestamp', format).cast('timestamp')) 

Затем вы можете использовать DayOfMonth в новом столбце Timestamp:

df2.select(F.dayofmonth('Timestamp2')) 

Подробнее detials об этих функциях можно найти в pyspark functions documentation.

+0

Не могли бы вы взглянуть на 'https: // stackoverflow.com/ questions/48195836/convert-day-lights-saving-time-string-to-timestamp-give-wrong-results' – User12345

0

Код:

df1.select(dayofmonth('Timestamp').alias('day')) 
Смежные вопросы