Кто-нибудь знает какие-либо ссылки, документы, презентации или сообщения в блогах, которые описывают широкомасштабную полнотекстовую поисковую систему, основанную на распределенном хранилище ключей/значений?Архитектура для поисковой системы на основе распределенного хранилища ключей/значений?
Меня особенно интересует организация индекса. Что такое структура данных? Где и как хранятся словари и публикации? Каков рабочий процесс для обработки запросов? Как обрабатываются запросы таким образом, что нет необходимости тратить огромные объемы данных по сети?
Полагаю, что Блекко построен таким образом. Я хотел бы знать, что они, или их конкуренты, действительно сделали.