2010-04-26 2 views

ответ

8

Стэнфордского Parser просто возвращает список зависимостей между словарных токенов. (Мы делаем это, чтобы избежать внешних зависимостей библиотек.) Но если вы хотите манипулировать зависимостями, вы почти наверняка захотите разместить их в структуре данных графа. Обычно мы используем jgrapht: http://jgrapht.sourceforge.net/

+0

Спасибо. Я использую это, чтобы извлечь из предложений троек (Subject, Verb, Object). Моя идея заключалась в том, чтобы сначала обнаружить сущности в предложении, а затем для каждой пары сущностей найти путь между ними в графе зависимостей, содержащем глагол. Проблема в том, что, хотя это работает в некоторых случаях, для некоторых это не так. Как и этот: «Бумага - это тонкий плоский материал, полученный сжатыми волокнами». Здесь анализатор Стэнфорда находит прямую связь nsubj между «бумагой» и «материалом». Можете ли вы рекомендовать любой хороший способ сделать это трехкратное извлечение? Спасибо. – pns

+3

В представлении SD копула (глагол «быть») не рассматривается как предикат, а существительное или прилагательное рассматривается как предикат: тонкий (бумага) материал (бумага). См. Обсуждение в http://nlp.stanford.edu/pubs/dependencies-coling08.pdf (раздел 2.2) Но если вы хотите отменить это, вы можете искать зависимость от существительного или прилагательного перепишите его как be (бумага, тонкая) be (бумага, материал) –

+0

Привет, вы можете мне помочь Mr pns, я хочу сделать то же самое, но я не знаю, как –

Смежные вопросы