2013-04-13 1 views
4

Я хочу извлечь субординированное предложение, основное предложение, относительное предложение, ограничительное относительное предложение, не ограничивающее относительное предложение из предложений, но я не знаю, как это делается. например:Предложение формы формулы извлечения

«Я впервые увидел ее в Париже, где я жил в начале девяностых».
[основное положение] [относительное положение]

«Она протянула руку, которая была повреждена».
[основное положение] [ограничительное относительное положение]

, пожалуйста, помогите мне сделать эту работу?

ответ

3

Вы должны быть в состоянии извлечь эту информацию (с разумной точностью) с помощью синтаксического анализа. Существует ряд реализаций here. В этот список я бы добавил свой собственный, доступный для скачивания here. t, чем любой другой высокоточный синтаксический анализатор, и документированы достаточно хорошо (для кода исследования).

+1

Спасибо за ваш ответ. Я прочитал документ анализатора Стэнфорда, но я не знаю, как написать программу, чтобы получить главное предложение ... из предложения. пожалуйста, дайте мне руководство, как получить главное предложение ... предложения на Java с вашим парсером или другими. – SahelSoft

+1

В стиле аннотаций Penn Treebank предложения обычно обозначаются как «S». Узлом «S» в верхней части дерева обычно является основное предложение, а любые содержащиеся узлы «S» являются вспомогательными. Конечно, это путают фрагменты (FRAG) и другие связанные метки (SBAR, SBARQ и т. Д.). Вы захотите ознакомиться с инструкциями аннотации Penn Treebank и создать собственную эвристику для тех лейблов, которые вы считаете «основной» и «вспомогательной» для своего приложения. – AaronD