Моя задача состоит в том, чтобы применить LDA на наборе амазонских обзоров и получить 50 темкак сделать LDA в R
Я извлекаемые текст обзора в векторе, и теперь я пытаюсь применить LDA
Я создал ЦМР
matrix <- create_matrix(dat, language="english", removeStopwords=TRUE, stemWords=FALSE, stripWhitespace=TRUE, toLower=TRUE)
<<DocumentTermMatrix (documents: 100000, terms: 174632)>>
Non-/sparse entries: 4096244/17459103756
Sparsity : 100%
Maximal term length: 218
Weighting : term frequency (tf)
, но когда я пытаюсь сделать это, я получаю следующее сообщение об ошибке:
lda <- LDA(matrix, 30)
Error in LDA(matrix, 30) :
Each row of the input matrix needs to contain at least one non-zero entry
Искал некоторые решения и используется хлопнул в
matrix1 <- rollup(matrix, 2, na.rm=TRUE, FUN = sum)
все еще получает ту же ошибку
Я очень новый для этого кто-то может мне помочь или предложить мне ссылку для изучения о this.It будет очень полезно
Там нет пустых строк в моей исходной матрицы и содержит только один столбец, который содержит отзывы
Возможный дубликат [Удалить пустые документы из DocumentTermMatrix в R topicmodels?] (Http://stackoverflow.com/questions/13944252/remove-empty-documents-from-documenttermmatrix-in-r-topicmodels) – scoa
по существу, сообщение об ошибке сообщает вам, что som e документов пуст. Вы должны удалить те – scoa
В моей исходной матрице нет пустых строк. После этого, когда я делаю DTM, а затем запускаю LDA, он дает мне ошибку –