2016-05-21 3 views
0

Я загрузил файл csv, используя read.csv. Это имеет 18 столбцов и 9000+ строк.Объединение данных с использованием R

Из этого я специально пытаюсь работать с двумя столбцами: 1) Дата, у которой есть дата. 2) текст обзора, который содержит несколько строк текста для каждой записи и представляет собой список.

Я добыл эти две колонок отдельно от CSV и пытаюсь объединить их вместе, чтобы получить объект, который выглядит как

Date   review_text 
2009-01-01  " This is good" 
2010-01-01  "Was a great experience" 

и так далее. Я пробовал использовать c, paste и cbind, но не могу объединить эти два объекта. Пожалуйста, дайте мне знать, если у вас есть предложения. В отношении связанной заметки, как только я их совмещаю, я пытаюсь сортировать результирующий объект по дате, группировать записи по кварталам, так что будет лучшим объектом для этого? Пожалуйста посоветуй. Спасибо!

+0

Просьба указать [воспроизводимый пример] (http://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example). Это облегчит вам помощь других. – shreyasgm

+0

Кроме того, найдите 'data.frame', который является объектом, в котором должны находиться ваши данные, и' order', который позволит вам сортировать ваши данные. – shreyasgm

ответ

0

Это будет мое решение, с lubridate и dplyr пакетов:

library(dplyr) 
library(lubridate) 

set.seed(123) 
reviews <- data.frame(
    date = as.Date("2016-05-21") - runif(100, 0, 365), 
    text = paste("Test", 1:100) 
) 

output <- reviews %>% 
    arrange(date) %>% 
    group_by(dyear = year(date), dQ = quarter(date)) %>% 
    summarise(
    output = paste(paste(date, text), collapse = ":::") 
) %>% 
    ungroup() %>% 
    arrange(dyear, dQ) 

Выход немного трудно отправить, потому что части персонажей очень долго. Это подводит меня к самым важным вопросам: почему вы хотите это сделать?

Редактировать: о, ваше разъяснение вашего вопроса сделало этот ответ неуместным. Взгляните на функцию merge, но трудно обеспечить что-либо, если вы не дадите воспроизводимый пример, чтобы мы знали вашу структуру данных.
Удачи!

Смежные вопросы