2015-07-18 2 views
1

Я работаю над набором данных из Kaggle и вот некоторые части набора данныхКак изменить ячейки в колонке в R

enter image description here

Так что я хотел бы удалить время в «Дата ", который будет показывать только« 15-05-13 »вместо« 15-05-13 17:00 ». Мне было интересно, как это кодировать?

Я думаю, что это должно быть что-то вроде этого:

train$Dates <- sub("15-05-13 17:00", "15-05-13", train$Dates) 

Но таким образом, он собирается взять меня навсегда, потому что набор данных огромен ...

ответ

1

Wendy, все, что вам нужно:

train$date <- format(as.Date(train$date,'%y-%m-%d'),'%y-%m-%d’) 

> train 
     date 
1 15-05-13 
2 15-05-13 
3 15-05-13 
2

Я расколоть колонку Даты в два, с помощью "" в качестве сепаратора

train <- data.frame(date = c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00")) 
train 
#    date 
# 1 15-05-13 17:00 
# 2 15-05-13 16:00 
# 3 15-05-13 15:00 

train <- data.frame(date=c("15-05-13 17:00", "15-05-13 16:00", "15-05-13 15:00")) 
within(train, date<-data.frame(do.call('rbind', strsplit(as.character(date), ' ', fixed=TRUE)))) 
train 
# date.X1 date.X2 
# 1 15-05-13 17:00 
# 2 15-05-13 16:00 
# 3 15-05-13 15:00 

и сбросили колонку времени

train$time <- NULL 

Теперь, если вы звоните поезд:

# date.X1 
# 1 15-05-13 
# 2 15-05-13 
# 3 15-05-13 
+0

Спасибо так много @Chani это супер полезно !!!! :) – munmunbb