Если это не так строго к использованию только NLTK, вы можете попробовать наш надежный и независимый от языка POS мечения инструментария RDRPOSTagger.
(Лицензия: GPLv2; Язык программирования: Python & Java)
RDRPOSTagger получает высокую производительность как в обучении и процесс мечения. Кроме того, RDRPOSTagger достигает очень конкурентоспособной точности по сравнению с самыми современными результатами.
Обновлено 18/11/2015: версия 1.2 с улучшенной точностью маркировки, особенно на морфологически богатых языках. См. Экспериментальные результаты, включая скорость работы и точность маркировки в this paper.
RDRPOSTagger поддерживает предварительно подготовленные модели POS и морфологических меток для болгарского, чешского, голландского, английского, французского, немецкого, хинди, итальянского, португальского, испанского, шведского, тайского и вьетнамского языков. RDRPOSTagger также поддерживает предустановленные модели универсальной маркировки POS для 40 языков.
Возможный дубликат [NLTK Пометка испанских слов с помощью корпуса] (http://stackoverflow.com/questions/14732465/nltk-tagging-spanish-words-using-a-corpus) – alvas