2014-09-16 2 views
6

Я хотел бы построить данные в data.frame xy для каждой группы (определяется ID). Если в год до 1946 года находится группа, необходимо выполнить plot 2. Когда годами между 1946 и 2014 годами, должно быть выполнено plot1.R: нужны конечные значения «ylim» в функции

Моя проблема: это нормально работает без значений NA, но поскольку у меня есть пробелы в данных, я полагаюсь на NA, чтобы определить эти пробелы данных. Вот почему я получаю сообщение об ошибке: error in plot.window(need finite 'ylim' values). Я попытался поставить finite=T в plot1 по оси y, но это дает ошибку subscript out of bounds. Есть ли способ решить эту проблему, и графика правильно построена?

В следующем идет мой код: он длинный, но большая часть кода состоит из plot() вариантов, на которые я полагаюсь.

# read in sample data and split it up by group (defined by ID) 
xy <- data.frame(NAME=c("NAME2","NAME2","NAME2","NAME2","NAME2","NAME3","NAME3","NAME3","NAME3","NAME5","NAME5","NAME5","NAME5"), ID=c(48,48,48,48,48,32,32,32,32,67,67,67,67),YEAR=c(1981,1983,1984,1988,1989,1984,1984,1988,1988,1899,1933,1948,1958),VALUE=c(0,205,-570,0,-310,-3680,-3680,NA,-3680,0,NA,13,-98)) 
ind <- split(x = xy,f = xy[,'ID']) 

# Plot Scenario 1: if only years between 1946 and 2014 are present for each group do this: 
    plot1 <- function(x) { 
    fname <- paste0(x[1, 'ID'], '.png') 
    png(fname, width=1679, height=1165, res=150) 
    par(mar=c(6,8,6,5)) 
    plot(x = c(1946, 2014), 
     y = range(x$VALUE), 
     type='n', 
     main=x[1, 'NAME'], 
     xlab="Time [Years]", 
     ylab="Value") 
    axis(2, at = seq(-100000, 100000, 500), cex.axis=1, labels=FALSE, tcl=-0.3) 
    points(ind[[i]][,c('YEAR','VALUE')], type="l", lwd=2) 
    points(ind[[i]][,c('YEAR','VALUE')], type="p", lwd=1, cex=1, pch=21, bg='white') 
    abline(h=0) 
    dev.off() 
} 

# Plot Scenario 2 if years under 1946 are present do this: 
plot2 <- function(x) { 
    fname <- paste0(x[1, 'ID'], '.png') 
    png(fname, width=1679, height=1165, res=150)  
    par(mar=c(6,8,6,5)) 
    plot(x[,c('YEAR','VALUE')], 
     type='n', 
     main=x[1, 'NAME'], 
    xlab="Time [Years]", 
    ylab="Value [mm]") 
axis(2, at = seq(-100000, 100000, 500), cex.axis=1, labels=FALSE, tcl=-0.3) 
points(ind[[i]][,c('YEAR','VALUE')], type="l", lwd=2) 
points(ind[[i]][,c('YEAR','VALUE')], type="p", lwd=1, cex=1, pch=21, bg='white') 
abline(h=0) 
dev.off() 
} 

# Execute functions 
    lapply(ind, function(x) ifelse(any(x$YEAR < 1946 & x$YEAR < 2014), plot2(x), plot1(x))) 

ответ

4

В plot1 измените y = range(x$VALUE) на y = range(x$VALUE, na.rm=TRUE)NA удалить пропущенные значения.

У вас есть еще одна проблема, а именно, что в обеих функциях вы ссылаетесь на ind[[i]], что я предполагаю, что в какой-то момент этот код был частью цикла. Я думаю, что все ссылки на ind[[i]] должны быть x.

+0

это было именно оно! Спасибо!! – kurdtc

+2

конкретно, я считаю, что это 'range', который возвращает' NA' (и ничего больше). что-то вроде 'plot (1: 5, c (2,3, NA, 5, NA))' будет выполнено успешно. –

+1

@CarlWitthoft Да, это когда оба значения из диапазона - 'NA'. – Thomas