2009-07-06 3 views
0

Я пытаюсь создать онлайн-поиск определенного набора литературы/цитат/и т. Д. Из духовной организации , а количество элементов (в основном PDF, HTML или обычный текст), которые можно найти, ограничено, Я хотел бы предоставить комплексные поисковые фильтры (стиль Kayak.com).Как создать поисковую систему с фильтрами?

Это означает, что мои данные должны быть организованы таким образом, чтобы их можно было легко фильтровать по имени автора, типу источника (будь то книга, речь, цитата и т. Д.), , когда и где и другие фильтры , Это означает, что каждый элемент литературы должен иметь эту «дополнительную информацию», связанную с ним.

Мой вопрос: как я могу построить эту поисковую систему? Я слышал о Lucerine, и также недавно обнаружил Searcharoo, библиотеку .NET для поиска, которая будет индексировать все мои файлы PDF, расположенные в локальном каталоге.

Что мне интересно, если я должен использовать Searcharoo или просто создать свою собственную базу данных, в которой хранится путь к файлу, и запросить столбец, содержащий текст PDF-файла. Или я могу использовать Searcharoo или что-то подобное, и еще иметь возможность отмечать каждый индексированный файл дополнительной информацией, хранящейся в БД? Или я должен использовать совершенно другой подход?

Я бы признателен за любую информацию по этому ...

Спасибо!

ответ

0

Я слышал, что CouchDB был предназначен для этого, но, честно говоря, я никогда не использовал его раньше.

0

Я использовал Lucene.NET для создания полнотекстовых индексов, содержащих дополнительные метаданные. Это стабильно, быстро и достаточно хорошо документировано, если вы не против использования порта Java.

Смежные вопросы