allWords
- вектор 1,3 миллиона слов с некоторым повторением. То, что я хочу сделать, это создать два вектора:R берет навсегда, чтобы вычислить простую процедуру
А со словом
B с вхождением слова
Так что я могу позже присоединиться к ним в матрице и тем самым связать их, например: «мама», 3; «Карандаш», 14 и т.д.
for(word in allWords){
#get a vector with indexes for all repetitions of a word
temp <- which(allWords==word)
#Make "allWords" smaller - remove duplicates
allWords= allWords[-which(allWords==word)]
#Calculate occurance
occ<-length(temp)
#store
A = c(A,word)
B = c(B,occ)
}
Этот цикл занимает навсегда, и я не знаю, почему или то, что я делаю неправильно. Чтение 1,3 миллиона слов из файла происходит так же быстро, как 5 секунд, но выполнение этих основных операций никогда не прекращает работу алгоритма.
Вы в Круге 2 [в R Inferno] (http://www.burns-stat.com/pages/Tutor/R_inferno.pdf) – GSee
Кто-то должен дать это лучшее название ... может быть, «сокращение и увеличение объектов в цикле» – Frank