2016-02-28 2 views
3

Я использую GATE NLP обработать мой документ, и я хочу использовать имена сущностей, чтобы использовать в качестве кандидатов тегов В Gate есть OpenNLP и LingPipe как я прочитал форму ответа here @Shashikant Кора ответ он сказалНазванного Распознавание объектов в воротах с помощью LingPipe

, если у вас есть предложение «Мой друг Джо Смит пошел в магазин Walmart », OpenNLP выделяет две названных объектов - «Джо Смит» и «Walmart». Я не мог получить его как «Джо Смит» как Человек и «Walmart» как Организация.

и предлагает использовать LingPipe поэтому я использовал LingPipe, который обеспечил в ворота NLP как здесь

SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController"); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR")); 
     pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR")); 
     Corpus corpus = Factory.newCorpus("SegmenterCorpus"); 
     Document document = Factory.newDocument(handler.toString()); 
     corpus.add(document); 
     pipeline.setCorpus(corpus); 
     pipeline.execute(); 

Однако, когда я запускаю свою программу, у меня есть это исключение

Exception в потоке «main» gate.creole.ResourceInstantiationException: Нет файла модели! в gate.lingpipe.NamedEntityRecognizerPR.init (NamedEntityRecognizerPR.java:55) в gate.lingpipe.NamedEntityRecognizerPR.init (NamedEntityRecognizerPR.java:55)

Что значит ни в файле модели при условии ?? Извините, потому что я задаю этот вопрос, но я совершенно не знаком с этим полем , и я просто узнал об ANNIE, и мне не нужен какой-либо файл, когда я использовал его для извлечения POS-тегов любую помощь?

+0

'NamedEntityRecognizer' требует параметр' model'. Попробуйте сначала протестировать ваш конвейер в GATE Developer (GUI) ... Но мне не удалось запустить LingPipe NamedEntityRecognizer. Кажется, что плагин сломан в GATE 8.1. Возможно, попробуйте также список рассылки. – dedek

+0

Да, кажется, что плагин LingPipe сломан, он дает мне ошибку, что LingPipe существует, хотя его в файле ворот * _ * .... Я читаю о Gazetteer, чтобы использовать его. Я надеюсь найти Java-код ..... thanx @dedek –

+0

Я не знаю, откуда появился плагин ворот. Может потребоваться модель LingPipe (скомпилированный идентификатор распознавания сущности, обученный корпусу с заданным набором тегов) в пути к классам. Если вы можете посмотреть код gate.lingpipeNamedEntityRecognizerPR, он может указать, какой путь он ищет. Тогда вам просто нужно поместить его в classpath. –

ответ

2

И, наконец, это работает для меня.

Я пробовал File ->Ready Made Applications ->LingPipe ->LingPipe IE System в GATE GUI. И он был загружен ОК.

Рабочая модель была: $gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker

Полная соответствующая конфигурация для gate.lingpipe.NamedEntityRecognizerPR был:

...  
<string>modelFileUrl</string> 
<gate.util.persistence.PersistenceManager-URLHolder> 
    <urlString>$gatehome$plugins/LingPipe/resources/models/ne-en-news-muc6.AbstractCharLmRescoringChunker</urlString> 
</gate.util.persistence.PersistenceManager-URLHolder> 
... 

GATE screen clip

+0

Я очень благодарен за то, что вы вернулись и ответили на вопрос :))) .... Я попробую это сейчас thanx снова :)))) –

Смежные вопросы