Я хотел бы иметь мои самые популярные слова в моем FreqDist. Или слова, которые имеют freq> p.Выполнить пороговое значение в nltk.FreqDist
Как это сделать?
После просмотра doc я ничего не нашел threshold
или cut
. Кроме того, функция freq() может быть вызвана только для каждого отдельного бина.
Конечно, я могу написать одноранговый код, как
[(x,f) for x in FreqDist.samples if FreqDist.freq(x) > p]
, но это не выглядит элегантно.
Почему это не элегантно? Я бы просто написал '[x for x в FreqDist, если FreqDist [x]> p]' или '[(x, f) для (x, f) в FreqDist.items(), если f> p]' – taleinat
As @taleinat предложенный ниже, сортировка была уже рассчитана внутренне, поэтому все, что делает это снова, считается со мной не изящным. – SolessChong