3
У меня есть этот код, чтобы найти существительные и глаголы в предложении.Как сделать слова NLTK pos_tag вместо символов?
# -*- coding: utf-8 -*-
from nltk.corpus import wordnet as wn
from nltk import pos_tag
import nltk
syno =[]
sentence = '''His father suggested he study to become a parson instead, but Darwin was far more inclined to study natural history.DarwinDar·win (där'wĭn),Charles Robert.1809-1882.British naturalist who revolutionized the study of biology with his theory ofevolutionbased on natural selection
Like several scientists before him, Darwin believed all the life on earth evolved (developed gradually) over millions of years from a few common ancestors.'''
sent = pos_tag(word_tokenize(sentence))
Это возвращает
[('H', 'NNP'), ('e', 'VBP'), ('l', 'NN'), ('l', 'NN'), ('o', 'NN'), (' ', ':'), ('m', 'NN'), ('y', 'NN'), (' ', ':'), ('n', 'NN'), ('a', 'DT'), ('m', 'NN'), ('e', 'NN'), (' ', ':'), ('i', 'PRP'), ('s', 'VBZ'), (' ', ':'), ('A', 'DT'), ('b', 'NN'), ('h', 'NN'), ('i', 'PRP'), ('s', 'VBZ'), ('h', 'JJ'), ('e', 'NN'), ('k', 'NN'), (' ', ':'), ('M', 'NNP'), ('i', 'PRP'), ('t', 'VBP'), ('r', 'JJ'), ('a', 'DT')]
Я хочу, чтобы оперировать словами, хотя, не символов! Как мне это сделать?
Спасибо. Я получаю предложение. Теперь, как я могу удалить только слова NN. – user2675742
@ пользователь2675742: по списку понимание? Это базовый Python, вы найдете его в [учебнике] (http://docs.python.org/tutorial/). –
Я получаю 'NameError: name' word_tokenize 'не определен'. Я редактировал свой код. – user2675742