2016-08-21 2 views
-2

У меня есть структура в rdd, которая содержит время записи следующим образом: 02:00:30. Я хочу преобразовать данные из этого формата во второй формат, я хочу сделать это: 02 * 3600 + 00 * 60 + 30 Может кто-то, пожалуйста, помогите мне сделать это лечение в pyspark ?? заранее спасибо.математическая операция с pyspark

+2

Добро пожаловать на SO. Сначала проверьте эту ссылку http://stackoverflow.com/help/how-to-ask –

ответ

0

карта это

rdd=rdd.map(lambda row: [3600*int(row[0].split(':')[0])+60*int(row[0].split(':')[1])+*int(row[0].split(':')[2])) 
Смежные вопросы