Учитывая набор текстов (может быть, книг, статей, документов и т. Д.), Как вы найдете соответствующие ключевые слова для каждого текста? здравый смысл подсказывает:Алгоритм поиска ключевых слов для текста
- расщепленных слов
- исключить общие слова (также называемые стоп-слова, как "а, к, ибо в")
- количества слов частоты
- дать оценка по каждому слову, с формулой, которая учитывает частоту каждого слова в документе и в других документах, количество слов документа и общее количество слов всех документов
Вопрос в том, что это хорошая формула для этого?
У вас есть доступ к информации о макете (названия, перерывы, размер шрифта и стили ...)? –