2009-12-23 4 views
1

Я пытаюсь это:Stanford POS Таггер в Java

Sentence<TaggedWord> taggedString = MaxentTagger.tagStringTokenized("here is a string to tag"); 

, который дает мне:

Error: \u\nlp\data\pos-tagger\wsj3t0-18-left3words\left3words-wsj-0-18.tagger (The system cannot find the path specified)

Я использую Стэнфорда POS tagger.

Что я могу сделать для решения этой проблемы?

+0

Загрузить полный пакет Stanger tagger, там вы найдете модели, например, left3words ... tagger. – Skarab

ответ

4

Кажется, вы должны сначала создать экземпляр Tagger прохождения включаемого файла:

new MaxentTagger("models/left3words-wsj-0-18.tagger"); 

Что довольно противный, как метод мечения, который был использован статична:

MaxentTagger.tagStringTokenized("here is a string to tag"); 

Я также должен был пройти -Xmx256m, чтобы он работал с этой настройкой.

+2

Да, это было довольно неприятно, но это было исправлено Теперь :-). Версия 3 имеет довольно чистый API! Теперь вы должны быть хорошо с MaxentTagger tagger = new MaxentTagger (args [0]); String ans = tagger.tagString («Вот строка для тега»); –

2

Это говорит о том, что он не может найти этот путь. Так, существует ли это на вашей машине?

Обратите внимание, что косые черты - обратная косая черта - поддерживает ли ваша ОС обратная косая черта в качестве разделителя файлов?

Также обратите внимание, что это абсолютный путь - это предназначено?

Если все остальное в порядке, существует ли файл?

Редактировать: если нет, вы должны скачать его здесь (http://github.com/tiendung/ruby-nlp/blob/master/left3words-wsj-0-18.tagger), поместите его в путь, который задает система, и посмотрите, что произойдет.

+0

он не существует, но я не знаю, откуда я должен его получить. я загрузил это: http: //nlp.stanford.edu/software/tagger.shtml, поэтому я предположил, что все файлы будут включены: S – Lilz

+0

Добавлен URL-адрес моего ответа – danben

Смежные вопросы