2014-11-20 2 views
5

Я помещаю испанский текст со Стэнфордским POS Tagger (через NLTK в Python).Значение Stanford Spanish POS Tagger tags

Вот мой код:

import nltk 
from nltk.tag.stanford import POSTagger 
spanish_postagger = POSTagger('models/spanish.tagger', 'stanford-postagger.jar') 
spanish_postagger.tag('esta es una oracion de prueba'.split()) 

Результат:

[(u'esta', u'pd000000'), 
(u'es', u'vsip000'), 
(u'una', u'di0000'), 
(u'oracion', u'nc0s000'), 
(u'de', u'sp000'), 
(u'prueba', u'nc0s000')] 

Я хочу знать, где я могу найти то, что именно означает pd000000, vsip000, di0000, nc0s000, sp000?

ответ

9

Это упрощенная версия набора тегов, используемого в AnCora treebank. Вы можете найти их документацию к тегам здесь: https://web.archive.org/web/20160325024315/http://nlp.lsi.upc.edu/freeling/doc/tagsets/tagset-es.html

«Упрощение» состоит из обнуления многих конечных полей, которые не относятся строго к тегу части речи. Например, наш теггер частичной речи всегда дает вам значения null (0) для поля NER исходного набора тегов (см. EAGLES noun documentation).

Вкратце: поля в тегах POS, созданных нашим агентом, точно соответствуют полям POS AnCora, но многие из этих полей будут иметь значение. Для большинства практических целей вам нужно посмотреть только первые 2-4 символа тега. Первый символ всегда указывает на широкую категорию POS, а второй символ указывает какой-то подтип.


Мы находимся в процессе написания какой-то вводную документацию для использования испанского языка с CoreNLP (это означает, что понимание этих тегов, и многое другое) прямо сейчас. На данный момент вы можете найти более подробную информацию на первой странице нашего technical documentation.

+0

Спасибо за ваш ответ. –

+0

Есть ли способ получить полный тег, используя Stanford NLP? Меня больше всего интересует человек, число и пол глагола. Я смог сделать это, используя Freeling POS Tagging, но я не знаю, как со Стэнфордским НЛП. – Kage

+0

Kage, я ответил на ваш вопрос здесь: http://stackoverflow.com/questions/29556109/spanish-pos-tagging-with-stanford-nlp-is-it-possible-to-get-the-person-number –

Смежные вопросы