Скажем, у меня есть документы со свободным текстовым полем, который собирается описать, какой тип отрасли бизнеса будет принадлежать:Solr/Lucene предложение анализировать вытаскивание предметов
примеру 1: «ИТ-консалтинг с акцентом на решения медико-санитарной помощи»
пример 2:„Финансовое консультирование для интернет-клиентов в Соединенных Штатах“
что я хотел бы должному с Solr или Lucene является вытаскивать систематику бизнес-операций, описанных в текст с учетом потенциальных синонимов. Таким образом, первый пример будет график как: информационных технологий < - [в] - Консалтинг - [на] -> HeathCare
пример 2 будет: Финансы < - [в] - Консалтинг
операций, как консультации или консультации - синонимы в зависимости от контекста.
благодарит за ответ. Подумайте, мой вопрос не должен был смешиваться в Solr/Lucene, а не в NLP (обработка естественного языка). Нужно извлекать существительные из предложения (возможно, коррелировать предложения) и даже декораторов (прилагательных), чтобы найти отношения между бизнес-операциями для формирования бизнес-намерения. –