Я не знаю, что я задаю правильный вопрос или нет, но я сильно застрял. Я хочу создать свою собственную поисковую систему для моего последнего проекта. Кроме того, я провел некоторое исследование веб-движков около месяца. Я наткнулся на nutch, lucene, solr, xapian, yaCy. Но этого было недостаточно. Я также знаю, что мне понадобится синтаксический анализатор, индексор, искатель и алгоритм ранжирования страниц, но с самого начала так много, и я не знаю, с чего начать.Как сделать поисковую систему?
Все, что мне нужно, это какой-то учебник или книга, где я могу найти об этих терминах (индексерах, искателях и т. Д.) И о том, как поэтапно реализовать эти проекты apache и с каким проектом apache я должен выбрать работу.
http://www.slideshare.net/teofili/apache-solr-crash-course – encodes