Я использую GATE NLP
обработать мой документ, и я хочу использовать имена сущностей, чтобы использовать в качестве кандидатов тегов В Gate есть OpenNLP
и LingPipe
как я прочитал форму ответа here @Shashikant Кора ответ он сказалНазванного Распознавание объектов в воротах с помощью LingPipe
, если у вас есть предложение «Мой друг Джо Смит пошел в магазин Walmart », OpenNLP выделяет две названных объектов - «Джо Смит» и «Walmart». Я не мог получить его как «Джо Смит» как Человек и «Walmart» как Организация.
и предлагает использовать LingPipe
поэтому я использовал LingPipe, который обеспечил в ворота NLP как здесь
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController");
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.TokenizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.NamedEntityRecognizerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.POSTaggerPR"));
pipeline.add((ProcessingResource) Factory.createResource("gate.lingpipe.SentenceSplitterPR"));
Corpus corpus = Factory.newCorpus("SegmenterCorpus");
Document document = Factory.newDocument(handler.toString());
corpus.add(document);
pipeline.setCorpus(corpus);
pipeline.execute();
Однако, когда я запускаю свою программу, у меня есть это исключение
Exception в потоке «main» gate.creole.ResourceInstantiationException: Нет файла модели! в gate.lingpipe.NamedEntityRecognizerPR.init (NamedEntityRecognizerPR.java:55) в gate.lingpipe.NamedEntityRecognizerPR.init (NamedEntityRecognizerPR.java:55)
Что значит ни в файле модели при условии ?? Извините, потому что я задаю этот вопрос, но я совершенно не знаком с этим полем , и я просто узнал об ANNIE, и мне не нужен какой-либо файл, когда я использовал его для извлечения POS-тегов любую помощь?
'NamedEntityRecognizer' требует параметр' model'. Попробуйте сначала протестировать ваш конвейер в GATE Developer (GUI) ... Но мне не удалось запустить LingPipe NamedEntityRecognizer. Кажется, что плагин сломан в GATE 8.1. Возможно, попробуйте также список рассылки. – dedek
Да, кажется, что плагин LingPipe сломан, он дает мне ошибку, что LingPipe существует, хотя его в файле ворот * _ * .... Я читаю о Gazetteer, чтобы использовать его. Я надеюсь найти Java-код ..... thanx @dedek –
Я не знаю, откуда появился плагин ворот. Может потребоваться модель LingPipe (скомпилированный идентификатор распознавания сущности, обученный корпусу с заданным набором тегов) в пути к классам. Если вы можете посмотреть код gate.lingpipeNamedEntityRecognizerPR, он может указать, какой путь он ищет. Тогда вам просто нужно поместить его в classpath. –