2015-01-27 3 views
2

У меня есть существующая установка Solr, работающая на автономном экземпляре Solr. Меня попросили добавить к этой настройке устойчивость и высокую доступность. Итак, я хотел бы добавить репликацию в мою настройку, для которой я считаю, что SolrCloud - это способ пойти?Добавление Zookeeper в существующее Solr

Я пропустил демоверсию на вики SolrCloud. Однако я не уверен, как добавить существующий экземпляр Solr в ZooKeeper, а затем добавить еще несколько узлов для его репликации. Возможно ли это без повторного набухания?

вики состояния

ПРИМЕЧАНИЕ: Если вы не используете пример для запуска Solr, убедитесь, что вы загрузите конфигурацию, установленную на Zookeeper перед созданием коллекции.

Однако я не уверен, какие файлы он имеет в виду и как это сделать?

Cuurent информация установки:

  • Solr 4.5.1
  • 2vCPU в 24 ГБ RAM
  • 66000000 Документами индекс
  • 58Gb размер индекса
  • Bulk время индекс ~ 50 часов
  • 4000 максимальных пользователей
  • 400 в среднем одновременных пользователей
  • обновления 20k в день
  • пользователь, ищущий с помощью приложения solrJ
  • запрашивая включает в себя группировку

личный

  • Existing Index Solr реплицируются на 2-х новых узлов
  • 3 Узлы зодиака для обеспечения устойчивости

То, что я пробовал:

  • Скачать Zookeeper, запустить zkServer начать с настройками по умолчанию -OK
  • Начать существующие установки Solr с опцией -DzkHost = actualhostname: 2181

Но я получаю ошибку от solr «Не удалось загрузить конфигурацию SOLR».

Так что я думаю, мой вопрос кратко, чтобы:

  1. Для моей установки является SolrCloud путь, а не сказать ReplicationHandler?
  2. Возможно ли добавить поддержку solrCloud и ZK без повторной индексации (50 часов - это длительное время)?
  3. Какие файлы конфигурации я должен добавлять в zk и как?
  4. Я исправляю, что без дополнительных изменений в настройках sharding не является вариантом, потому что я использую группировку в своих запросах?
  5. Должен ли я обновиться с solr 4.5.1, если да, то как далеко?
  6. Самое главное, мой «список желаний» выглядит как хорошая идея/плохая идея/луна на палочке? Если это хорошо, как его достичь? Если плохо, предложения?

Я довольно новичок в Solr (~ 12 месяцев использования) и очень новичок в Zookeeper и SolrCloud (~ 2 недели чтения/экспериментирования), поэтому любые советы по достижению вышеизложенного были бы очень оценены.

ответ

0
  • Для моей установки SolrCloud - путь, а не репликация?

SolrCloud - путь вперед с Solr, поэтому я бы сказал, что да.

  • Можно ли добавить поддержку solrCloud и ZK без повторной индексации (50 часов - это долгое время)?

Если вы не используете осколки, используйте только реплики, не нужно переиндексации.

  • Какие файлы конфигураций я должен добавлять в zk и как?

Запустите свой Solist с помощью -Dbootstrap_conf = true, это загрузит ваши файлы конфигурации в ZK.

  • Я исправлю, что без дополнительных изменений конфигурации осколки не является вариантом, потому что я использую группировку в своих запросах?

В зависимости от того, что именно вы делаете с группировкой, см. https://wiki.apache.org/solr/DistributedSearch за то, что поддерживается или нет.

  • Должен ли я перейти с solr 4.5.1, если да, то как далеко?

Обновление до последней версии - хорошая идея, хотя в прошлом Solr 4.7 вам понадобится Java 7.

  • Самое главное, мой «список желаний» выглядит как хорошая идея/плохая идея/луна на палочке? Если это хорошо, как его достичь? Если плохо, предложения?

Я голосую за хорошую идею, у меня есть аналогичная.

+1

Спасибо @Yann за ваши четкие ответы на все мои вопросы. -Dbootstrap была той частью, которую я отсутствовал. У меня теперь есть простая тестовая среда, работающая с сокращенным набором данных, чтобы доказать это, и скоро переместит это, чтобы жить. еще раз спасибо – sonicscorpion

0

С помощью solrcloud вы можете разделить содержимое на разных узлах, если используете несколько осколков. Вы можете начать с одного осколка (один лидер и несколько реплик). Затем скопируйте каталоги индекса и tlog из классического solr, который вы в настоящее время используете для лидера solr cloud. Таким образом, вам не нужно переиндексации. Позже вы можете разделить осколок, если содержимое слишком велико для одного узла или если вы хотите распространить индекс на несколько узлов. Последний выпуск solr - 4.10.3. Почему бы не использовать это вместо 4.5.1?

Solr документация объясняет довольно хорошо, как создать содержание гк: https://cwiki.apache.org/confluence/display/solr/SolrCloud+Configuration+and+Parameters

По существу, когда вы начинаете свой первый узел Solr облако, вы говорите это, где гк кластер, или у вас есть выбор, чтобы начать гк на тот же узел, что и solr. Вам также нужно указать, где находятся файлы конфигурации, так как он скопирует их на zk.

Смежные вопросы