2017-01-12 2 views
9

Я пытаюсь импортировать пакет NLTK в питона 2,7Corpora/игнорируемых слов не найден, когда библиотека импорта NLTK

import nltk 
    stopwords = nltk.corpus.stopwords.words('english') 
    print(stopwords[:10]) 

Бег это дает мне следующую ошибку:

LookupError: 
********************************************************************** 
Resource 'corpora/stopwords' not found. Please use the NLTK 
Downloader to obtain the resource: >>> nltk.download() 

Итак, поэтому я открываю питона Termin и сделал следующее:

import nltk 
nltk.download() 

Который дает мне:

showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml 

Однако это, похоже, не останавливается. И запустить его снова по-прежнему дает мне ту же ошибку. Любые мысли, где это происходит не так?

ответ

20

В данный момент вы пытаетесь загрузить каждый элемент в nltk-данных, так что это может занять много времени. Вы можете попытаться загрузить только стоп-слова, которые вам нужны:

import nltk 
nltk.download('stopwords') 
0

Просто запустите эту команду в вашем IPython ноутбук (или любой другой текстовый редактор/IDE вы используете):

import nltk 

nltk.download('stopwords') 

Он будет автоматически загружать файл stopword и разархивируйте его в требуемый каталог.

0

Некоторым, как упомянуто Kurt Bourbaki, но в командной строке:

python -m nltk.downloader stopwords 
Смежные вопросы