Я пытаюсь использовать Лемматизатор NLTK WordNet в твитах.NLTK WordNet Lemmatizer - Как удалить неизвестные слова?
Я хотел бы удалить все слова, которые не найдены в WordNet (твиттер-ручки и т. Д.), Но нет обратной связи с WordNetLemmatizer.lemmatize(). Он просто возвращает слово без изменений, если он не может его найти.
Есть ли способ проверить, найдено ли слово в WordNet или нет?
В качестве альтернативы есть лучший способ удалить что-либо, кроме «правильных английских слов» из строки?