Я хотел бы написать простую функцию, чтобы увидеть, существует ли это слово «существует» в WordNet через NLTK.Почему NLTK WordNet не находит простых слов?
def is_known(word):
"""return True if this word "exists" in WordNet
(or at least in nltk.corpus.stopwords)."""
if word.lower() in nltk.corpus.stopwords.words('english'):
return True
synset = wn.synsets(word)
if len(synset) == 0:
return False
else:
return True
Почему слова вроде could, since, without, although
return False? Разве они не появляются в WordNet? Есть ли лучший способ узнать, существует ли слово в WN (с использованием NLTK)?
Моя первая попытка состояла в том, чтобы устранить «стоп-слова», такие как to, if, when, then, I, you
, но есть еще очень распространенные слова (например, could
), которых я не могу найти.
Почему вы возвращаетесь Правда, когда это стоп-слов? – alvas
Это было всего лишь попытка проигнорировать эти слова. Но я заметил, что не все распространенные слова - это временные слова. – Sadik