Выполнение такого же действия для нескольких файлов

У меня есть несколько файлов в одной папке, и я хотел бы выполнять одно и то же действие с каждым файлом, используя R, без изменения имени файла в моем скрипте каждый раз. В частности, у меня есть 26 файлов .csv, которые мне нужно идентифицировать повторяющиеся записи в отдельности. Любые советы по наилучшему способу сделать это приветствуются.Выполнение такого же действия для нескольких файлов

источник

2013-05-29 KES

Я хотел бы использовать list.files внутри lapply. Например, я думаю, что-то вроде этого, это хорошее начало:

res <- lapply(list.files(path=FILES_DIRECTORY, 
           pattern='*.csv', ## I look for csv files, 
           full.names=T), ## to get full names path+filename 
        function(file){ ff <- read.csv(file) 
            ff[duplicated(ff),] 
        })

Вы можете также назвать получившийся список с именами файлов.

names(res) <- gsub('[.]csv','', 
         list.files(path=FILES_DIRECTORY,pattern='*.csv'))

источник

2013-05-29 13:36:28 agstudy

Я считаю, что вы могли бы избежать того, чтобы назвать список в отдельную команду, если вы используете '' sapply' с USE.NAMES = TRUE, вместо 'lapply'. –

@MatthewPlourde да, вы можете использовать 'sapply' здесь, даже если вы не получите красивое имя (вы получите полные имена путей). Лично я редко использую 'sapply', и я предпочитаю использовать' lapply'. – agstudy

Замечательно, я не могу дождаться, чтобы попробовать. Спасибо вам за помощь. – KES

Может быть, вы должны сделать это лечение сделано вызывающим терминалом с чем-то вроде:

R --save --args *.csv < myScript.R

См How can I read command line parameters from an R script?

источник

2013-05-29 13:34:29

Выполнение такого же действия для нескольких файлов

ответ

Смежные вопросы