У меня есть ряд документов, довольно равномерно распределенных между несколькими языками (6 на данный момент, возможно, 12 в ближайшем будущем). Не нужно было угадывать язык документа, поскольку эта информация доступна.Многоязычная установка Solr
Кроме того, прецеденты для поиска таковы, что один поиск всегда будет на одном языке и будет искать только документы на этом языке.
Теперь я хочу применить правильную обработку языка, например, как для индекса, так и для запросов. Каким будет предложенный способ? Из моего еще ограниченного знания Солра я могу себе представить:
- Просто используйте одно ядро для каждого языка. Сохраняет небольшие индексы, запросы соответствуют языку по основному URL-адресу, а конфигурация проста. Однако он дублирует много конфигурации.
- Используйте одно ядро и примените что-то вроде Solr: DIH for multilingual index & multiValued field?. Поиск определенного языка будет осуществляться через поле, такое как
title_de:sehen