Я использую python2.7, nltk 3.2.1 и python-crfsuite 0.8.4. Я следую за этой страницей: http://www.nltk.org/api/nltk.tag.html?highlight=stanford#nltk.tag.stanford.NERTagger для модуля nltk.tag.crf.ТипError: должен быть unicode, а не str в NLTK
Для начала я просто запустить этот
from nltk.tag import CRFTagger
ct = CRFTagger()
train_data = [[('dfd','dfd')]]
ct.train(train_data,"abc")
Я попытался это слишком
f = open("abc","wb")
ct.train(train_data,f)
, но я получаю следующее сообщение об ошибке,
File "C:\Python27\lib\site-packages\nltk\tag\crf.py", line 129, in <genexpr>
if all (unicodedata.category(x) in punc_cat for x in token):
TypeError: must be unicode, not str
Можете ли вы показать нам данные в «abc»? Там лежит ваша проблема, согласно ошибке ... –