2011-12-21 3 views
1

Я запускаю несколько контентов/отдельных сайтов из одного и того же промежуточного программного обеспечения, и я хочу использовать Solr в качестве поисковой системы. Сайты отличаются в домене, но не во внутренней структуре (что означает, что фактическая база данных и структуры данных идентичны между сайтами).Хранение нескольких наборов документов на одном или нескольких ядрах

Вопрос в том, лучше ли хранить данные этого сайта в одном индексе Solr, а затем разделить его по полю «сайт» или использовать отдельное ядро ​​Solr в пределах одной JVM для каждого сайта?

Что обеспечит наилучшую производительность (нет кросс-сайтовых запросов)? Что обеспечит лучший отзыв и точность (меня беспокоит потеря точности из-за факторов IDF - различия в контентных доменах довольно велики)?

ответ

2

Я предполагаю, что вы больше беспокоитесь о том, что происходит, когда ваши сайты растут. ИМО, несколько ядер кажутся лучшим выбором.

Одиночный большой индекс: все обновления и запросы попадают в одну точку. Когда он начинает замедляться, вы должны сделать кластер путем осколки или репликации, чтобы сохранить свой большой индекс. И это единственная точка неудачи. Резервное копирование индекса будет жестким.

Несколько ядер: Если один сайт растет и затмевает других, вы можете легко перенести его на другой сервер, гарантируя, что серверы не будут перегружены. Резервное копирование отдельных сайтов будет относительно тривиально.

Несколько ядер сделают вашу жизнь проще, если у вас есть незанятые места. По мере роста ваших сайтов вы можете отложить кластеризацию и настройку производительности до конца.

+0

Точно, я беспокоюсь о том, что происходит, когда сайты становятся больше и их число увеличивается. – Mavrik

0

Я хотел бы сделать несколько ядер Solr на одном коте

Смежные вопросы