2014-11-13 6 views
-1

Как рассчитать разницу во времени между двумя одинаковыми твитами (с точки зрения текста) и добавить столбец в фрейме данных, чтобы показать, что тайм-аут разности по времени (новое имя столбца) td3 = t3-t2. td13 = t13-t12, если t13 и t12 оба одинакового текста/твита.разница во времени между двумя одинаковыми твитами

входных данных

Tweet Текст TIME-Stamp

к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 17:18:53
к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 22:37:11 к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 22:44:51
к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-25 13:24:31
к.т. aamaadmiparty загрузить AAP 2014-03-25 19:31:06 Rt aamaadmiparty скачать aap 2014-03-25 19:34:29 к.т. aamaadmiparty скачать AAP 2014-03-25 19:42:10 к.т. aamaadmiparty скачать AAP 2014-03-25 19:53:38

Желаемая Вывод данных

Tweet ТекстTIME- ШтампТ-Diff

к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 17:18:53 к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 22:37:11 5,305 часов к.т. aamaadmiparty Арвинд Кеджривал листья 2014-03-24 22:44:51 5,432778 часов

к.т. aamaadmiparty загрузить AAP 2014-03-25 19:31:06 Rt aamaadmiparty скачать AAP 2014-03-25 19:34:29 3.383333 мин к.т. aamaadmiparty скачать AAP 2014-03-25 19:42:10 11.06667 мин к.т. aamaadmiparty скачать AAP 2014-03-25 23:36: 57 4.0975 часов

этот код работает, но как добавить его в колонке с помощью петли для большого набора данных, не ясна для меня .... ФРА рабочего dataframe ..

difftime (ДФ [49,2] , DF [48,2]) разница во времени 3.383333 минут difftime (DF [51,2], DF [48,2]) Время разница 11.06667 минут DF $ diff_time < - (difftime (DF [65, 2], DF [48,2])) difftime (DF [65,2], DF [48,2]) Время разница 4.0975 часов

+0

Просьба представить образцы данных, а также показать некоторые усилия. – zx8754

+0

Сэр я обновил свой запрос с подробным примером ... пожалуйста, помогите мне @ zx8754 –

ответ

0

a)

# toy data 
time_1 = strptime("3/22/2014 15:08", "%m/%d/%Y %H:%M") 
time_2 = strptime("3/22/2014 15:15", "%m/%d/%Y %H:%M") 
ID = "user_1" 
df = data.frame(ID, time_1, time_2) 

#  ID    time_1    time_2 
# 1 user_1 2014-03-22 15:08:00 2014-03-22 15:15:00 

# by base R 
df$diff_time <- with(df, time_2 - time_1) 
# by dplyr 
library(dplyr) 
df %>% mutate(diff_time = time_2 - time_1) 

# you get 
#  ID    time_1    time_2 diff_time 
# 1 user_1 2014-03-22 15:08:00 2014-03-22 15:15:00 7 mins 
Смежные вопросы