ответ

2

This FAQ answer объясняет разницу в длинном абзаце. Соответствующие части приведены ниже:

Можете ли вы объяснить разные парсеры?

Этот ответ относится к английскому языку. В основном это относится к другим языкам, хотя некоторые компоненты отсутствуют на некоторых языках. Файл englishPCFG.ser.gz содержит только неэлексизированную грамматику PCFG. Это, в основном, синтаксический анализатор, описанный в документе ACL 2003 Accurate Unlexicalized Parsing.

... Файл englishFactored.ser.gz содержит две грамматики и приводит систему к запуску трех парсеров. Сначала он запускает (более простой) парсер PCFG, а затем нетипизированный анализатор зависимостей, а затем запускает третий парсер, который находит синтаксический анализ с лучшим совместным счетом по двум другим синтаксическим анализаторам через модель продукта. Это описано в документе NIPS Fast Exact Inference.

... на английском языке, хотя грамматик и методы синтаксического анализа отличаются, среднее качество englishPCFG.ser.gz и englishFactored.ser.gz похоже, и поэтому многие люди выбирают быстрее englishPCFG.ser.gz, хотя englishFactored.ser.gz иногда делает лучше, потому что она включает лексикализацию. Для других языков факторизованные модели значительно лучше, чем модели PCFG, и это то, что люди обычно используют.

Имеются ссылки на документы, ссылки на которые указаны по адресу the main parser page.

+0

Спасибо Jon за простое объяснение – SvckG

Смежные вопросы