2015-11-16 7 views
1

Я бегу следующий код и получения ошибки:R | Ошибка в .jcall()

Error in .jcall("RWekaInterfaces", "[S", "tokenize", .jcast(tokenizer, : java.lang.NullPointerException

setwd("C:\\Users\\jbarr\\Desktop\\test) 
library (tm); library (wordcloud);library (RWeka); library (tau);library(xlsx); 

Comment <- read.csv("testfile.csv",stringsAsFactors=FALSE) 
str(Comment) 
review_source <- VectorSource(Comment) 

corpus <- Corpus(review_source) 
corpus <- tm_map(corpus, removePunctuation) 
corpus <- tm_map(corpus, removeNumbers) 
corpus <- tm_map(corpus, stripWhitespace) 
corpus <- tm_map(corpus, removeWords,stopwords(kind = "english")) 
corpus <- tm_map(corpus, content_transformer(tolower)) 
corpus <- tm_map(corpus, removeWords, c("member", "advise", "inform", "informed", "caller", "call","provided", "advised")) 


dtm <- DocumentTermMatrix(corpus) 
dtm2 <- as.matrix(dtm) 
wordfreq <- colSums(dtm2) 
wordfreq <- sort(wordfreq, decreasing=TRUE) 
head(wordfreq, n=100) 
wfreq <- head(wordfreq, 500) 
set.seed(142) 
words <- names(wfreq) 
dark2 <- brewer.pal(6, "Dark2") 
wordcloud(words[1:100], wordfreq[1:100], rot.per=0.35, scale=c(2.7, .4), colors=dark2, random.order=FALSE) 
write.xlsx(wfreq, "C:\\Users\\jbarr\\Desktop\\test") 

Интересная проблема я выбежала этот код на несколько файлов, а только определенные из них имеют ошибку ,

Пожалуйста, дайте мне знать, что вы думаете. Благодаря!

ответ

-1

Похоже, что в вашей базе данных есть НС. Запустите is.na() и удалите эти строки. Попробуйте снова запустить код. Он должен работать.

Cheers! Sanmeet

+0

Это не дает ответа на вопрос. Чтобы критиковать или запросить разъяснения у автора, оставьте комментарий ниже своего сообщения - вы всегда можете прокомментировать свои собственные сообщения, и как только у вас будет достаточно [репутации] (http://stackoverflow.com/help/whats-reputation), вы будете быть в состоянии [прокомментировать любое сообщение] (http://stackoverflow.com/help/privileges/comment). - [Из обзора] (/ review/low-quality-posts/11184026) –

+0

@MartinEvans Но логика в порядке. –

0

Предложение: Я получаю эту ошибку при чтении (.xlsx) файл Excel с помощью:

df2 <- read.xlsx2("foobar.xlsx", sheetName = "Sheet1", startRow = 1, endRow = 0). 

Обратите внимание, что появляется, что значение EndRow должно быть NULL или действительное число. Но

df2 <- read.xlsx2("foobar.xlsx", sheetName = "Sheet1") 

отлично работает. Таким образом, вы можете проверить свои значения аргументов и аргумент на выравнивание параметров.

0

Sanmeet прав - это проблема с NA в вашем фрейме данных.

непосредственно перед вашей линии: review_source < - VectorSource (Комментарий)

вставить строку ниже:

Комментарий [который (is.na (Комментарий))] < - "NULLVALUEENTERED"

Это изменит все ваши значения na на фразу NULLVALUEENTERED (не стесняйтесь изменить это). Нет больше NA, и код должен работать нормально.

Смежные вопросы