2013-11-30 3 views
1

У меня есть ряд документов, довольно равномерно распределенных между несколькими языками (6 на данный момент, возможно, 12 в ближайшем будущем). Не нужно было угадывать язык документа, поскольку эта информация доступна.Многоязычная установка Solr

Кроме того, прецеденты для поиска таковы, что один поиск всегда будет на одном языке и будет искать только документы на этом языке.

Теперь я хочу применить правильную обработку языка, например, как для индекса, так и для запросов. Каким будет предложенный способ? Из моего еще ограниченного знания Солра я могу себе представить:

  • Просто используйте одно ядро ​​для каждого языка. Сохраняет небольшие индексы, запросы соответствуют языку по основному URL-адресу, а конфигурация проста. Однако он дублирует много конфигурации.
  • Используйте одно ядро ​​и примените что-то вроде Solr: DIH for multilingual index & multiValued field?. Поиск определенного языка будет осуществляться через поле, такое как title_de:sehen

ответ

0

я пошел с одним ядром вместо этого. Дублирование конфигурации было сложным. Теперь все в одном ядре. Немного Java-магии, и он отлично работает.

1

Я уверен, что одним ядром на каждом языке является наилучшим решением.

Вы можете разделить все конфигурации, кроме schema.xml между ядрами (используя одну папку конф) и указать местоположение schema.xml на ядро ​​(проверить http://wiki.apache.org/solr/CoreAdmin)

Смежные вопросы