2010-12-14 3 views
2

Кто-нибудь знает какие-либо ссылки, документы, презентации или сообщения в блогах, которые описывают широкомасштабную полнотекстовую поисковую систему, основанную на распределенном хранилище ключей/значений?Архитектура для поисковой системы на основе распределенного хранилища ключей/значений?

Меня особенно интересует организация индекса. Что такое структура данных? Где и как хранятся словари и публикации? Каков рабочий процесс для обработки запросов? Как обрабатываются запросы таким образом, что нет необходимости тратить огромные объемы данных по сети?

Полагаю, что Блекко построен таким образом. Я хотел бы знать, что они, или их конкуренты, действительно сделали.

ответ

0

Мне неизвестно сообщение в блоге или статью, которая отвечает на ваш вопрос Точно. Тем не менее, вот некоторые ресурсы, которые, я думаю, имеют отношение к вашему вопросу, и я надеюсь, что они помогут вам решить вопрос.

Во-первых, лейтмотивы Джеффа Дина на эволюцию архитектуры Google,

Далее, есть с открытым исходным кодом поисковой системы на верхней части КВ магазин под названием Lucandra - как следует из названия, Lucene на вершине Кассандры, оба являются проектами Apache.

Для того, чтобы понять, как работает Lucandra, проверить реализацию и презентации, которые были сделаны, что говорить о том, как Lucene индексы данных Cassandra.

Аналогичным образом вы также можете увидеть, как сосуществуют Lucene и HBase.Вот ссылка на Apache фиксации/патч, который объединяет поиска слой, используя один на другой,

Другая подобная статья для Redis

Далее, проверьте эксплуатационные требования для масштабируемых поисковых систем

Лаборатория СНГ имеет отличные научно-исследовательские работы по данной теме, что вы должны проверить,

Для общих предположений поисковых систем, которые могут сделайте выше, вот ссылки на книги, которые помогут,

Смежные вопросы