У меня очень большой файл csv. Я хочу рассчитать частоту элементов во втором столбце, чтобы графовать гистограмму. Пример моих данных:Частота элементов в списке в R
0010,10.1.1.16
0011,10.2.2.10
0012,192.168.2.61
0013,192.168.173.19
0014,10.2.2.10
0015,10.2.2.10
0016,192.168.2.61
Я использовал ниже:
inFile <- read.csv("file.csv")
summary(inFile)
hist(inFile$secondCol)
выхода резюме:
X0010 X10.1.1.16
Min. :11.00 10.2.2.10 :3
1st Qu.:12.25 192.168.173.19:1
Median :13.50 192.168.2.61 :2
Mean :13.50
3rd Qu.:14.75
Max. :16.00
Поскольку файл очень большой, я не получаю правая гистограмма. Какие-либо предложения?
Я согласен, но моя проблема в том, что файл очень большой, не может быть открыт с R. Вот почему я читаю значения один за другим. Поэтому сначала мне нужно заполнить список, а затем применить гистограмму. Вопрос о том, как заполнить список, исходя из частоты элемента. – SimpleNEasy
, какую версию R (и 32- или 64-разрядную) вы используете и насколько велики ваши данные? – Arun
R версия 2.15.2 (2012-10-26), платформа: x86_64-w64-mingw32/x64 (64-разрядная версия). У меня более одного файла и размер меняются. Размеры в Gb. – SimpleNEasy