Я хочу знать, есть ли в любом случае, что я могу отменить их до нормальной формы?Как отменить слово в Python?
Проблема в том, что у меня есть тысячи слов в разных формах, например. едят, едят, едят, едят и так далее, и мне нужно посчитать частоту каждого слова. Все они - едят, едят, едят, едят и т. Д., Будут рассчитывать на то, чтобы есть и, следовательно, я использовал его.
Но следующая часть проблемы требует от меня поиска похожих слов в данных, и я использую synsets nltk для вычисления сходства Wu-Palmer среди слов. Проблема в том, что synsets nltk не будут работать на словах, или, по крайней мере, в этом коде они не будут. check if two words are related to each other
Как это сделать? Есть ли способ отменить слово?
Если вы реорганизуете свой рабочий процесс, вы можете работать с кортежами, в которых первым элементом является полное слово, а второе - строковое представление. Это неэффективно с точки зрения хранения, но это облегчит вам отслеживание ваших слов. – duhaime
Как насчет того, чтобы проверить, связаны ли слова до того, как они закончились? Это возможно? Тогда вам не нужно хранить оба представления. – Rcynic
@ Rcynic Да, я подумал об этом, но это сделало бы работу слишком напряженной, поскольку в ней слишком много слов, чтобы рассказать о ней. – user3667569