2014-10-23 2 views
1

У меня есть кадр данных с столбцами даты и количества. Мне нужно создать гистограмму с осью x, отображающей год и месяц, а ось y отображает сумму соответствующих строк, которые попадают в соответствующий период.Запланированные данные за год-месяц с отсутствующими значениями

data <- data.frame(Date = as.Date(c("01/01/2014","02/01/2014","03/03/2014","07/08/2014","08/08/2014","09/08/2014","10/10/2014"), "%d/%m/%Y")) 

x <- as.Date(data$Date) 
y <- sample(10, length(x)) 
tmp <- data.frame(dt = format(x, "%Y-%m"), cnt = y, stringsAsFactors = FALSE) 

# # Pre-Allocate the table 
# minYr = min(as.numeric(strftime(data$Date, "%Y"))) 
# maxYr = min(as.numeric(strftime(data$Date, "%Y"))) 
# # The table will contain the number of months in a year. 
# n <- (maxYr - minYr + 1) * 12 
# dt <- character(n) 
# cnt <- numeric(n) 
# for (i in minYr:maxYr) { 
#  for (j in c("01","02","03","04","05","06","07","08","09","10","11","12")) { 
#   lev <- (i - minYr) * 12 + as.numeric(j) 
#   dt[lev] <- paste0(as.character(i),"-",j,"-01") 
#   cnt[lev] <- 0 
#  } 
# } 
# dt = as.Date(dt, format="%Y-%m-%d") 
# tmp <- data.frame(dt = format(dt, "%Y-%m"), cnt, stringsAsFactors = FALSE) 
# tmp <- rbind(tmp, data.frame(dt = format(x, "%Y-%m"), cnt = y, stringsAsFactors = FALSE)) 
# 

tmp2 <- aggregate(cnt ~ dt, tmp, sum) 

g <- ggplot(tmp2, (aes(x = dt, y = cnt))) 
g + geom_bar(stat="identity") 

В приведенном выше коде использованы данные, но если в течение определенного месяца нет транзакций, они не будут отображаться. Я хочу, чтобы в диаграмме отображались отсутствующие месяцы со значением нуля.

Указанный фрагмент кода предопределяет каждый месяц в течение периода с нулями и дает мне желаемый ответ, но мне было интересно, могу ли я избежать этого, нажав на встроенные функции ggplot.

ответ

0

Для этого вы можете использовать scale_x_date. Но вам нужно изменить переменную x на класс Date.

library(scales) 
g <- ggplot(tmp2, (aes(x = as.Date(paste0(dt, '-01')), y = cnt))) 
g + geom_bar(stat="identity") + 
    scale_x_date(name='dt', breaks = date_breaks("month"), labels = date_format('%Y-%m')) 

EDIT: Для того, чтобы получить желаемую ширину баров, вы можете добавить width аргумент в geom_bar:

g + geom_bar(stat="identity", width=28) + 
    scale_x_date(name='dt', breaks = date_breaks("month"), labels = date_format('%Y-%m')) 

И, конечно, вы можете также добавить пределы в scale_x_date аргумент, чтобы сделать его начало и конец в нужном месте:

g + geom_bar(stat="identity", width=28) + 
    scale_x_date(name='dt', 
       breaks = date_breaks("month"), 
       labels = date_format('%Y-%m'), 
       limits=as.Date(c('2014-01-01', '2014-12-01'))) 
+0

благодарит за код. Это то, что выходит, когда я запускаю исходный код [IMG] http://i.imgur.com/MIEBBQW.jpg [/ IMG], в то время как это то, что появляется, когда я использую scale_x_date [IMG] http: // i.imgur.com/ht4xBGh.jpg[/IMG]. Я нахожу, что толщина стержней несовместима. – chribonn

Смежные вопросы