Я пытаюсь использовать LDA() из пакета topicmodels на довольно большом наборе данных. Попробовав все, чтобы исправить следующие ошибки: «В nr * nc: NA, создаваемые целым переполнением» и «Каждая строка входной матрицы должна содержать хотя бы одну ненулевую запись», я попал в эту ошибку.ДокументTermMatrix должен иметь весовую частоту весов Ошибка
ask<- read.csv('askreddit201508.csv', stringsAsFactors = F)
myDtm <- create_matrix(as.vector(ask$title), language="english", removeNumbers=TRUE, stemWords=TRUE, weighting=weightTf)
myDtm2 = removeSparseTerms(myDtm,0.99999)
myDtm2 <- rollup(myDtm2, 2, na.rm=TRUE, FUN = sum)
rowTotals <- apply(myDtm2 , 1, sum)
myDtm2 <- myDtm2[rowTotals> 0, ]
LDA2 <- LDA(myDtm2,100)
Error in LDA(myDtm2, 100) :
The DocumentTermMatrix needs to have a term frequency weighting
Я думал, что положил weighting = weightTf, чтобы сделать его временной частотой вместо tf-idf. Я думал, что rollup() не работает. Но если я удалю накопительный пакет, я бы получил другую ошибку. Но кванда определенно отлично работает для меня. Благодарю . – user1569341