Я запустил задание Pig в кластере Hadoop, которое сбило кучу данных в то, что R может обрабатывать, чтобы выполнить когортный анализ. У меня есть следующий сценарий, а также второго по последней строке у меня есть данные в формате:Гистограмма вложенной области в R
> names(data)
[1] "VisitWeek" "ThingAge" "MyMetric"
VisitWeek является датой. ThingAge и MyMetric являются целыми числами.
Данные выглядит следующим образом:
2010-02-07 49 12345
Сценарий у меня до сих пор:
# Load ggplot2 for charting
library(ggplot2);
# Our file has headers - column names
data = read.table('weekly_cohorts.tsv',header=TRUE,sep="\t");
# Print the names
names(data)
# Convert to dates
data$VisitWeek = as.Date(data$VisitWeek)
data$ThingCreation = as.Date(data$ThingCreation)
# Fill in the age column
data$ThingAge = as.integer(data$VisitWeek - data$ThingCreation)
# Filter data to thing ages lt 10 weeks (70 days) + a sanity check for gt 0, and drop the creation week column
data = subset(data, data$ThingAge <= 70, c("VisitWeek","ThingAge","MyMetric"))
data = subset(data, data$ThingAge >= 0)
print(ggplot(data, aes(x=VisitWeek, y=MyMetric, fill=ThingAge)) + geom_area())
Эта последняя строка не работает. Я пробовал много вариаций, баров, гистограмм, но, как обычно, R docs побеждает меня.
Я хочу, чтобы он показывал стандартную диаграмму в виде таблицы в стиле Excel - один временной ряд для каждой ThingAge, уложенной в течение недель по оси x, с датой на оси y. Примером такого рода диаграммы здесь: http://upload.wikimedia.org/wikipedia/commons/a/a1/Mk_Zuwanderer.png
Я читать документы здесь: http://had.co.nz/ggplot2/geom_area.html и http://had.co.nz/ggplot2/geom_histogram.html и этот блог http://chartsgraphs.wordpress.com/2008/10/05/r-lattice-plot-beats-excel-stacked-area-trend-chart/, но я не могу достаточно заставить его работать на меня.
Как я могу это достичь?
Могли бы вы предоставить воспроизводимый пример? Трудно сказать, что происходит не так. – hadley