2014-12-17 4 views
1

Я использую dcast функция для rshape datframe в R, но при использовании большой dataframe. Я преобразовал это в ffdf dataframe, неспособный использовать функцию dcast, пожалуйста, помогите мне, если есть альтернативы. Найдите в приведенном ниже примере я использовал для малых dataframe и то, что я хочу сделать для ffdf dataframe:Reshape ffdf dataframe в R

- hdsample <- read.csv("C:/Users/PK5016573/Desktop/hdsample.csv") 
- View(hdsample) 


hd<-dcast(hhpsample,MemberID~Year+Specialty+ProcedureGroup+Vendor+PlaceSvc+PCP+PrimaryConditionGroup+CharlsonIndex) 

Это работает, но:

hhp<-read.ffdf("C:/Users/PK5016573/Desktop/hdsample.csv") 

hd<-dcast(hhpsample,MemberID~Year+Specialty+ProcedureGroup+Vendor+PlaceSvc+PCP+PrimaryConditionGroup+CharlsonIndex) 

Это дает мне ошибку, пожалуйста, помогите

заранее спасибо pavan kancharala

+4

Просьба привести воспроизводимый пример. – akrun

+0

Привет, akrun, пожалуйста, удалите данные с URL: http: //www.heritagehealthprize.com/c/hhp/data после загрузки сортировки в excel, возьмите только два экземпляра UserID, попробуйте первый пример, после чего возьмите все данные и попробуйте второй код u найдет ошибку –

+0

Это 'HHP_release1'? – akrun

ответ

0

У меня был ответ на этот вопрос, но он может не работать в основном по фактору данных

# Reshape_function to process on data 
    # Reshaping data as per year and Primary condition group 
    library(reshape2) 
    library(ffbase) 
    reshapefunction<-function(x){ 
    df=dcast(x,MemberID~ Year+PrimaryConditionGroup, 
    value.var= "rep.x..each...2668990.",    
    fun.aggregate = sum) 
    } 
    # Reshaping data using reshape_function 
    # Specifying size of chunks to process the data 
    PrimaryConditionGroup<-ffdfdply(x=hhp,split=hhp$MemberID 
    ,FUN = function(x) reshapefunction(x),BATCHBYTES = 100000000,trace=TRUE) 

View(PrimaryConditionGroup) 

Все данные были взяты из kaggle конкуренции добавил еще один столбец "rep.x..each ... 2668990.", который содержит 1 в каждом ряду, используемом для целей агрегации

Смежные вопросы