Я лингвист, пытающийся выяснить, как использовать NLTK
и как пометить части речи в корпусах.Невозможно использовать NLTK pos_tag в Python v2 или v3
Я пытаюсь использовать функцию pos_tag и получить такое же сообщение об ошибке, как другой плакат: ASCii кодек не может декодировать байт ...
Смотрите эту ссылку: NLTK 3 POS_TAG throws UnicodeDecodeError
Я попробовал все из предлагаемые решения, в том числе тот, который дается оригинальным плакатом, но без успеха ни на одном из них.
Есть ли более возможные решения этой проблемы?
Добро пожаловать в переполнение стека. «У меня такая же проблема, как и у этого парня, я попробовал решение, но это не сработало» не оставляет нам многого для продолжения. Попробуйте прочитать короткий текст (пара предложений) и вернуться сюда с текстом, кодировкой и сообщением об ошибке. – alexis
PS. Если вы получаете ошибки в Unicode, вам будет намного лучше, если вы просто забудете о python 2. Python 3 намного лучше справляется с несколькими кодировками. – alexis
PPS. Вопрос, на который вы ссылаетесь, устарел: Текущая версия NLTK (3.0.2) * * совместима с python 3, и вы должны использовать ее таким образом. – alexis