Я хочу создать список тегов для документа Lucene на основе предварительно определенного списка.Определить наличие ключевых слов в документе из списка
Так что, если у нас есть документ с текстом
ищет программиста Java с опытом работы в Lucene
и у нас есть список ключевых слов (около 1000 наименований)
Java , php, lucene, C# [...]
Я хочу определить, что ключевые слова Java и Lucene существуют в документе. Просто выполнение java OR php ИЛИ lucene не будет работать, потому что тогда я не буду знать, какое ключевое слово сгенерировало хит.
Любые предложения о том, как реализовать это в Lucene?
Похоже, что TermVectors может быть здесь. Я использую Hibernate Search, поэтому я посмотрю, могу ли я использовать эту функцию в этом контексте – Marc