2010-10-14 5 views
0

У меня есть проект создания поисковой системы с высоким трафиком, похожей на altavista.com. Для проекта будут использованы окна .NET C#. Я ищу хорошую базу данных поисковых систем, которая может обрабатывать очень высокую нагрузку. Я взглянул на lucene и sql server 2008. Я читал, что lucene имеет тенденцию коррумпироваться, когда нагрузка очень высока. Итак, я рассматриваю SQL Server 2008, но я уверен, что сервер sql может обрабатывать очень большую нагрузку на гигабайты данных.Каковы мои возможности для базы данных поисковых систем на окнах

База данных будет предоставлена ​​часть данных и должна получать аналогичные данные в другом месте в таблице. он будет действовать только похожие вопросы область на stackoverflow. Ему нужно будет искать миллионы строк. Является ли sql server 2008 и lucene моими опциями?

+1

«Я прочитал, что Lucene имеет тенденцию к коррумпированной, когда нагрузка очень высока» - уход за квалификацию это заявление со ссылкой или двумя? –

+1

BTW, миллионы строк невелики ... –

ответ

2

Я использовал Lucene успешно с большими объемами данных, и я сталкивался с проблемами повреждения данных лица.

Но если вы беспокоитесь о автономном Lucene, вы можете попробовать apache solr вместо этого, его сервера с открытым исходным кодом поиска, основанный на Lucene

Solr является популярным, молниеносно открытой источником корпоративного поиска платформы от проект Apache Lucene. Его основные функции включают в себя мощный полнотекстовый поиск , выделение, выделение, фасет поиск, динамическая кластеризация, база данных интеграция и богатый документ (например, Word, PDF). Solr высоко масштабируемый, предоставляя распределенный поиск и индексную репликацию, и он предоставляет функции поиска и навигации самых крупных в мире интернет-сайтов .

Существует .NET, клиент Solr в Google Code solr.net .. Вы можете попробовать это

Смежные вопросы