Я помещаю испанский текст со Стэнфордским POS Tagger (через NLTK в Python).Значение Stanford Spanish POS Tagger tags
Вот мой код:
import nltk
from nltk.tag.stanford import POSTagger
spanish_postagger = POSTagger('models/spanish.tagger', 'stanford-postagger.jar')
spanish_postagger.tag('esta es una oracion de prueba'.split())
Результат:
[(u'esta', u'pd000000'),
(u'es', u'vsip000'),
(u'una', u'di0000'),
(u'oracion', u'nc0s000'),
(u'de', u'sp000'),
(u'prueba', u'nc0s000')]
Я хочу знать, где я могу найти то, что именно означает pd000000, vsip000, di0000, nc0s000, sp000?
Спасибо за ваш ответ. –
Есть ли способ получить полный тег, используя Stanford NLP? Меня больше всего интересует человек, число и пол глагола. Я смог сделать это, используя Freeling POS Tagging, но я не знаю, как со Стэнфордским НЛП. – Kage
Kage, я ответил на ваш вопрос здесь: http://stackoverflow.com/questions/29556109/spanish-pos-tagging-with-stanford-nlp-is-it-possible-to-get-the-person-number –