Это скорее вопрос теории, чем практика. Я работаю над проектом, который представляет собой довольно простой каталог ссылок. Вся модель похожа на каталог Dmoz или Yahoo, за исключением того, что каждая запись имеет определенные дополнительные атрибуты.Методы поиска Рекомендации
У меня есть иерархическая таксономия, работая над всеми элементами с отношениями «многие ко многим», теперь все записи отсортированы по этим категориям, и все работает нормально. Теперь, какое использование является каталогом, если нет опции поиска?
Вот несколько подробностей о моих моделях. Каждая запись имеет название, описание, URL и несколько социальных профилей: YouTube, Twitter, Flickr и еще несколько других. Каждая запись может иметь прикрепленный к ней логотип и скрытое поле для тегов. Кроме того, название и описание хранятся на трех разных языках. Поэтому в основном я хотел бы результаты поиска быть:
- Соответствующие (включая таксономию)
- Возможно те, с логотипами
- Возможно те, с 100% заполненные профили
Я попробовал Sphinx и в настоящее время работает с Lucene, но кажется, что я не получаю право поиска в теории. Надеюсь, что имеет смысл, что заполненные записи должны появляться выше, чем другие, но я не могу понять цифры. Я бы не хотел, чтобы неактуальные записи отображались сверху, если во всем описании есть только одно совпадение слов, так как заголовки более релевантны.
Так что мой вопрос - есть какие-либо книга, методы или даже другие поисковые системы (если сфинкс и Lucene не достаточно хорошо) , что вы рекомендовали бы для этого дела? Не только я хотел бы получить полный контроль над результатами поиска и их ранжированием, но также дать своим посетителям правильную и релевантную информацию.
Ссылки на интересные статьи также оценены!
И Нет, я не пытаюсь восстановить Google :)
спасибо :)
P.S. Я готов дать щедрость за лучший ответ. – kovshenin