2016-10-17 3 views
0

Я работаю с 5-летними данными PUMS 2010-2014. Я пытаюсь использовать репликативные веса, чтобы найти стандартную ошибку. Стандартная формула ошибки приведена в документации, но мне не удается включить это в формулу в Microsoft Excel или R, в двух программах, с которыми я работаю. Я могу сопоставить две переменные в Excel, чтобы получить сумму каждого реплицированного веса и PWGTP, но я думаю, что есть более простой способ.Использование репликации весов для определения прямой стандартной ошибки для данных PUMS

Кто-нибудь здесь работал с данными PUMS и реплицирующими весами? Документацию можно найти здесь:

http://www.census.gov/programs-surveys/acs/technical-documentation/pums/documentation.2014.html

ответ

1

В R, вы можете сделать что-то вроде этого:

wgt <- "PWGTP" 
var <- "SEX" 

est <- aggregate(PUMS[[wgt]], by=list(PUMS[[var]]), FUN=sum, simplify=T, drop=F) 

err <- vector("list", 80) 
for(i in 1:80){ 
    err[[i]] <- aggregate(PUMS[[paste0(wgt, i)]], by=list(PUMS[[var]]), FUN=sum, simplify=T, drop=F) 
    err[[i]] <- (err[[i]][,2] - est[,2])**2 
} 

SE <- ((4/80)*colSums(do.call(rbind, err)))**.5 

Это при условии, что вы используете Person записи и вычисления SE для переменной " SEX».

Существуют другие формулы для вычисления SE среднего, медианного, пропорции и т. Д. Используемая здесь формула, вероятно, является наиболее часто используемой, поэтому я предполагаю, что это тот, о котором вы спрашиваете.

0

Пакеты survey и srvyr будут вам полезны.

library(tidyverse) 
library(survey) 
library(srvyr) 

hga <- read_csv("ss11hga.csv") # georgia, but it will be the same for you 

# survey design, specifying replicate weights 
pumsd_hh <- hga %>% 
    as_survey_rep(
    weights = WGTP, 
    repweights = starts_with("WGTP"), 
    combined_weights = TRUE 
) 

# calculate average income and standard error by size of household 
pumsd_hh %>% 
    filter(!is.na(FINCP)) %>% 
    mutate(NP = ifelse(NP > 5, 5, NP)) %>% 
    group_by(NP) %>% 
    summarise(
    survey_mean(FINCP, na.rm = TRUE) 
) 
Смежные вопросы