Я пытаюсь запустить симуляцию параллельно.Обработка списка данных в R
iterations = 50000
sim = foreach(i=1:iterations) %dopar% sim(dataframe, ...)
Каждый элемент в списке sim является фреймворком данных с 40 столбцами и 100 строками. Каждый блок данных имеет столбец идентификатора. Я хочу определить средний балл по идентификатору более 50 000 симуляций.
Я попытался следующие, но это было довольно медленно, я думаю, потому что приходилось постоянно отращивать в dataframe:
results = do.call(rbind.data.frame, sim)
avg.scores = ddply(sim,~Player,summarise,mean=mean(score))
Я также попытался установить атрибуты в списке, чтобы преобразовать его в dataframe в (Most efficient list to data.frame method?), но закончил с более чем 25 столбцами и разными именами столбцов
Я не уверен, есть ли способ вычислить средние значения путем повторения по спискам или мне нужно создать dataframe или datatable сначала, а затем вычислить средние значения.
Благодарим за любые предложения!
Использование 'rbindlist' Дром data.table пакет – Metrics