2010-02-21 4 views
6

Я нахожусь в процессе создания корпоративного веб-сайта. Мы ищем любую открытую или платную поисковую систему на основе ASP.NET. Он должен быть способенASP.NET Поисковая система

  1. Поиск веб-содержимого всех страниц сайта.
  2. Все офисные документы. и т. д.
  3. Если у нас есть фильтрация результатов поиска, основанная на типе пользователя и стиффе.

Пожалуйста, дайте мне знать, какие инструменты или программное обеспечение нам нужно учитывать.

ответ

7

Попробуйте Lucene.NET

Apache Lucene является высокопроизводительная, полнофункциональный текстовый поисковик библиотека полностью написан на Java. It - это технология, подходящая для почти любых приложений, для которых требуется полнотекстовый поиск, особенно кроссплатформенный.

Lucene.Net является исходный код, класса в классе, API-за API и algorithmatic порт Java Lucene поисковой системы на C# и .NET платформы с использованием Microsoft .NET Framework .

Вот некоторые ссылки на учебники, чтобы вы начали:

2

Solr это еще один отличный вариант, это эффективно фасад на вершине lucene, который предоставляет вам хороший API REST/url. Для работы с ним есть доступная, зрелая библиотека .Net.

http://lucene.apache.org/solr/

http://code.google.com/p/solrnet/

Из Вашего вопроса, хотя, вы ищете для фактического основного двигателя или вы ищете что-то и ползать/траверс контента наращивая индексы выбранной поисковой системы?

-

Редактирование, чтобы ответить на комментарий от оригинального плаката.

У вас есть две половинки уравнения для решения тогда.

Сначала выбираем поисковую систему, которая отвечает на ввод (ключевые слова), а затем запрашивает его индексы и возвращает то, что, по его мнению, соответствует соответствующим совпадениям. Вторая половина уравнения - это поиск механизма заполнения индекса поиска вашего выбранного движка.

Что касается двигателя, то предложил Lucene, и я предложил вариант Lucene, который обеспечивает (возможно) улучшенный интерфейс разработчика.Что касается построения вашего поискового корпуса, это немного отличается. Здесь вы можете выбрать, чтобы написать собственное программное обеспечение, которое занимает часть контента и добавляет его в индекс. Преимущество здесь в том, что у вас есть мелкий контроль над тем, что входит в поисковую систему и когда. С другой стороны, вы пишете новый код - к счастью, современные поисковые системы, такие как Lucene/Solr, делают это довольно легко.

Ваш второй вариант - использовать что-то, чтобы автоматически сканировать ваш контент и добавлять его в индекс. Проблемы здесь связаны с определением и обучением для настройки подходящего варианта. В зависимости от вашего выбора сканеров он может или не может хорошо документировать документы, сидящие на файловой системе (например, на корпоративном сайте Sharepoint).

Nutch является искателем Apache (создателем Lucene и Solr), который потенциально может быть использован, если вы решите не писать свой собственный код. http://wiki.apache.org/nutch/

+0

Мы строим корпоративный сайт. Где любой посетитель сайта должен иметь возможность искать весь веб-контент. – user171523

Смежные вопросы