2012-04-16 12 views
-2

Я не знаю, что я задаю правильный вопрос или нет, но я сильно застрял. Я хочу создать свою собственную поисковую систему для моего последнего проекта. Кроме того, я провел некоторое исследование веб-движков около месяца. Я наткнулся на nutch, lucene, solr, xapian, yaCy. Но этого было недостаточно. Я также знаю, что мне понадобится синтаксический анализатор, индексор, искатель и алгоритм ранжирования страниц, но с самого начала так много, и я не знаю, с чего начать.Как сделать поисковую систему?

Все, что мне нужно, это какой-то учебник или книга, где я могу найти об этих терминах (индексерах, искателях и т. Д.) И о том, как поэтапно реализовать эти проекты apache и с каким проектом apache я должен выбрать работу.

ответ

0

Если вам нужен поисковик взглянуть на OpenSearchServer поисковик на основе Lucene с числом features.Read документации.

Если вы хотите написать свой собственный. Вы пытаетесь изобрести колесо. Попробуйте прочитать книгу Introduction to information retrieval..

0

вам потребуется что-то вроде solr для выполнения поиска, тогда вы можете применить веса к различным полям, например. мета название. вам нужно посмотреть частичное добавление и обновление документа.

вам также потребуется что-то, чтобы обходить сайты для создания индексированных. вы могли бы следовать примерам в сообщении siva.

Если вы хотите написать свой собственный, вы можете использовать python или скручивать сайты. найти все ссылки и снять больше процессов для сбора информации.

Solr http://wiki.apache.org/solr/SolrInstall установить затем создать schema.xml http://wiki.apache.org/solr/SchemaXml - думать о том, какие поля вам нужно, и которые можно было найти и т.п. , то вы можете использовать Apache Solr для PHP или многие из альтернатив для запросов ,

+0

http://www.slideshare.net/teofili/apache-solr-crash-course – encodes

Смежные вопросы