Я пытаюсь запустить парсер Stanford в Ubuntu, используя код python. Мой текстовый файл имеет размер 500 Мбайт, который я пытаюсь проанализировать. У меня есть оперативная память 32 ГБ. Я увеличиваю размер JVM, но я не делаю, действительно ли это увеличивается или нет, потому что каждый раз я получаю эту ошибку. Пожалуйста, помогите мнеСтэнфордский парсер из памяти
WARNING!! OUT OF MEMORY! THERE WAS NOT ENOUGH ***
*** MEMORY TO RUN ALL PARSERS. EITHER GIVE THE ***
*** JVM MORE MEMORY, SET THE MAXIMUM SENTENCE ***
*** LENGTH WITH -maxLength, OR PERHAPS YOU ARE ***
*** HAPPY TO HAVE THE PARSER FALL BACK TO USING ***
*** A SIMPLER PARSER FOR VERY LONG SENTENCES. ***
Sentence has no parse using PCFG grammar (or no PCFG fallback). Skipping...
Exception in thread "main" edu.stanford.nlp.parser.common.NoSuchParseException
at edu.stanford.nlp.parser.lexparser.LexicalizedParserQuery.getBestParse(LexicalizedParserQuery.java:398)
at edu.stanford.nlp.parser.lexparser.LexicalizedParserQuery.getBestParse(LexicalizedParserQuery.java:370)
at edu.stanford.nlp.parser.lexparser.ParseFiles.processResults(ParseFiles.java:271)
at edu.stanford.nlp.parser.lexparser.ParseFiles.parseFiles(ParseFiles.java:215)
at edu.stanford.nlp.parser.lexparser.ParseFiles.parseFiles(ParseFiles.java:74)
at edu.stanford.nlp.parser.lexparser.LexicalizedParser.main(LexicalizedParser.java:1513)
Как вы загружаете файл в парсер? Как файл или как огромная строка, содержащая содержимое? –
огромные строки @TritonMan – rombi
Правильно, вам нужно либо передать имя файла, либо поток или что-то в этом роде. Если вы загрузите весь файл в строку, файл размером 500 МБ, который займет слишком много ОЗУ. –