2016-01-12 4 views
2

Я пытаюсь проанализировать данные Twitter. Здесь вы можете найти мой код R:Как я могу построить график по оси y?

Я не понимаю, как я могу извлечь и нарисовать значение «часов» из моего набора данных по оси y. Благодаря

library(ggplot2) 
# data <- read.csv("data.csv", header=T, stringsAsFactors=FALSE, sep = ",") 
data <- read.csv(header = TRUE, stringsAsFactors = FALSE, 
       text = '"time","impressions","engagements" 
       "1",2015-10-24 15:39:00,400,"8.0" 
       "2",2015-10-24 15:28:00,575,"17.0" 
       "3",2015-10-23 16:52:00,1646,"29.0" 
       "4",2015-10-23 16:45:00,1489,"46.0"') 
# remove duplicate rows 
# data <- data[-c(177, 323, 615, 497, 809), ] 
data$impressions <-as.numeric(as.character(data[,2])) 
data$engagement <-as.numeric(as.character(data[,3])) 

# Convert times to POSIXct 
data$time <- as.POSIXct(data$time) 

ggplot(data, aes(x=time, y=impressions)) + 
theme_bw() + 
geom_point(shape = 21, color = "red", size = data$engagement*0.1, position = position_jitter(width = 0.5)) + scale_y_continuous(minor_breaks=0,breaks=seq(0,2000,200),limits=c(0,2000)) 

данных выглядит, что

"time","impressions","engagements" 
"1",2015-10-24 15:39:00,400,"8.0" 
"2",2015-10-24 15:28:00,575,"17.0" 
"3",2015-10-23 16:52:00,1646,"29.0" 
"4",2015-10-23 16:45:00,1489,"46.0" 
+0

Извините, моя ошибка – co7000

+0

как насчет добавления 'scale_x_datetime (date_labels ="% H:% M ")' to 'ggplot'? Я не уверен точно, что вы хотите, чтобы метки были – rawr

ответ

4

способ извлечения часов (так как ваша колонка Время правильно отформатированный), заключается в использовании функции часов() из пакета lubridate в R.

library(lubridate) 
library(ggplot2) 

data <- read.csv("data.csv", header=T, stringsAsFactors=FALSE, sep = ",") 

# remove duplicate rows 
data <- data[-c(177, 323, 615, 497, 809), ] 

data$impressions <-as.numeric(as.character(data[,2])) 
data$engagement <-as.numeric(as.character(data[,3])) 
# extract hour from time column 
data$Hour <- lubridate::hour(data$time) 
+2

. Fyi r имеет встроенный 'format (data $ time, '% H')' – rawr

Смежные вопросы