2015-03-24 4 views
0

Похоже, у stanfordnlp есть эти модели SR в течение некоторого времени. Я действительно новичок в NLP, но сейчас мы используем PCFG парсер, и мы имеем серьезные проблемы с производительностью (что мы сократить длину синтаксического анализа 35)PCFG vs SR Parser

  1. Я думаю, если мы могли бы попробовать использовать SR. Я попробовал это с помощью тегатора POS от stanford (english-left3words-distsim.tagger) Вы знаете, как SR находится на точности против PCFG? Я также обнаружил проблемы с обнаружением корневого кода при помощи SR и dep parse: Пример:
    Michael Jeffrey Jordan, также известный своими инициалами, MJ, является американским бывшим профессиональным баскетболистом, предпринимателем и нынешним владельцем большинства и председателем Charlotte Bobcats PCFG действительно точный с корнем и определяет игрока как корень.
  2. Был бы также признателен за понимание людей NN, например, (https://mailman.stanford.edu/pipermail/java-nlp-user/2014-November/006513.html) в вышеуказанном сообщении. Нужно ли мне использовать другой теггер - left3words? Прошу прощения, если это звучит немного наивно. Но все, что я хочу, это правильный корень предложения и его зависимости. Выполняет ли пометка POS заранее?

Большое спасибо.

+0

Не понимаю вопрос # 2. Можете ли вы изменить это? Парсер анализа с уменьшением смены сдвига не использует архитектуру нейронной сети, которую использует анализатор зависимостей NNDep. –

ответ

0
  1. Английский анализатор сдвига, поставляемый с CoreNLP, на самом деле немного лучше, чем парсер PCFG, по нашим тестовым данным. Вы можете увидеть показатели производительности в нижней части shift-reduce parser homepage.
  2. Я просил разъяснений в комментарии выше.
+0

Я не уверен, согласен ли я с этим. Я вижу, например, следующее предложение: Адам Ричард Сэндлер (родился 9 сентября 1966 года) - американский актер, комик, сценарист, предприниматель, кинорежиссер и музыкант. В то время как корень предложения PCFG - у актера есть уходящие края комика, сценариста, .. .музыкант; для парсера SR он не связывает комика, музыканта. Какая комбинация использует следующее: http: //nlp.stanford.edu: 8080/parser/index.jsp –

+0

Все, что мы можем сказать наверняка: это один из стандартных тестовых наборов синтаксического анализа, парсер SR делает немного лучше в среднем. Ваш пробег может значительно варьироваться в зависимости от данных, с которыми вы работаете. –

+0

«Какая комбинация использует [парсерная демонстрация]?» Он использует базовый английский парсер PCFG. –

Смежные вопросы