У меня есть набор столбцов из 3 миллионов строк, 500 столбцов. Хотя столбцы являются числовыми, при импорте из файла csv все рассматриваются как фактор, а не числовые. Я пытаюсь преобразовать их обратно в числовое значение с помощью командыПреобразование коэффициента в числовое
wikifixedn<-as.numeric(as.character(wikifixed))
wikifixed - это dataframe.
Это навсегда ... Мой MacBook Pro с 16 ГБ оперативной памяти и 2,3 ГГц Core i7 взбалтывает это более часа. Могу ли я увидеть где-нибудь, как далеко я буду в процессе или если процесс движется? Это еще один, более быстрый метод решения проблемы разговора?
BTW: Я пытался, при импорте файла CSV, чтобы заставить столбцы, которые будут рассматриваться как числовые, используя
> wikifixed<-read.csv('~/OneDrive/kredible/finaldata/wutao/wikipediausers.csv', header = TRUE, stringsAsFactors=F)
Тем не менее, при проверке я получаю
> is.numeric(wikifixed)
[1] FALSE
'as.numeric (уровни (yourfactor)) [yourfactor]' будет быстрее – akrun
Я бы использовал 'fread' из пакета data.table' для чтения. Также посмотрите на аргумент' colClasses' (также в 'read, csv') – user20650
стоит попробовать 'readr :: read_csv ('yourfile')' – ExperimenteR