NLTK TweetTokenizer не работает (Python)

В настоящее время я установил NLTK и выполнил команду nltk.download(). Однако не все библиотеки установлены (он застревает на panlex_lite).NLTK TweetTokenizer не работает (Python)

Дело в том, что, когда я пытаюсь импортировать Tweet Tokenizer я получаю ошибку:

File "create_docs.py", line 7, in
from nltk.tokenize import TweetTokenizer ImportError: cannot import 
name TweetTokenizer

Как я могу справиться с этим? Ура!

источник

2016-11-30 Vladimir Vargas

вы пробовали nltk.download ('panlex_lite')? – sb0709

@ sb0709, yes it prints: '[nltk_data] Загрузка пакета panlex_lite в [nltk_data]/home/vladimir/nltk_data ... ' Но это не закончится. –

Это потому, что неправильно установлены библиотеки, поэтому необходимо пропустить «panlex_lite» библиотеки и должны работать.

Currently is open issue for this, solution will be as follow:

I guess, we could add something like if id != 'panlex_lite' to the code... 

But, as for me, the easiest way looks like this: 

get https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml 
remove panlex from it 
upload it to a public Gist 
pass the gist's url to the downloader: python -m nltk.downloader -d /usr/local/share/nltk_data -u https://gist.githubusercontent.com/demidovakatya/61dab385d74065ae825c80496a197980/raw/c6ff7fbf44265c7f8c9e961e3e1158cd812d6af1/index.xml all

здесь ссылка на вопрос: look at last 2 conversations

источник

2016-12-01 00:27:52 sb0709

NLTK TweetTokenizer не работает (Python)

ответ

Смежные вопросы