У меня есть файл журнала, содержащий поисковые запросы, введенные в поисковую систему моего сайта. Я хотел бы «группировать» связанные поисковые запросы вместе для отчета. Я использую Python для большей части моего webapp - поэтому решение может быть основано на Python или я могу загрузить строки в Postgres, если это проще сделать с SQL.Группировка ключевых слов поиска
Пример данных:
dog food
good dog trainer
cat food
veterinarian
группы должны включать в себя:
кошка:
cat food
собака:
dog food
good dog trainer
еды:
dog food
cat food
и т.д ...
Идеи? Может быть, какой-то «алгоритм индексирования»?
Я не уверен, что понимаю. Можете ли вы объяснить, как вы планируете решать, какие слова связаны? Или это вопрос? –