У нас есть чрезвычайно большая база данных из 30+ миллионов продуктов, и вам нужно запросить их, чтобы результаты поиска и объявления отображались тысячи раз в секунду. Мы рассматривали Sphinx, Solr, Lucene и Elastic как опции для выполнения этих постоянных массовых поисков.Sphinx/Solr/Lucene/Elastic Relevancy
Вот что нам нужно сделать. Возьмите ключевые слова и запустите их через базу данных, чтобы найти продукты, которые соответствуют ближайшим. Мы собираемся использовать наш OWN-алгоритм, чтобы решить, какие продукты наиболее связаны с целевыми рекламными объявлениями, но мы знаем, что эти двигатели уже имеют свои собственные алгоритмы релевантности.
Итак, наш вопрос заключается в том, как эффективно использовать наши собственные алгоритмы в верхней части движка. Можно ли добавить их к самим двигателям как к некоторому модулю? Или нам придется переписать код релевантности двигателя? Я предполагаю, что мы могли бы реализовать алгоритм из приложения, выполнив несколько запросов, но это действительно убьет эффективность.
Кроме того, мы хотели бы знать, какое поисковое решение будет работать лучше всего для нас. Прямо сейчас мы склоняемся к Сфинксу, но мы действительно не уверены.
Кроме того, вы бы рекомендовали использовать эти двигатели по сравнению с MySQL, или было бы лучше запустить их над некоторым типом хранилища ключей, например Cassandra? Имейте в виду, что есть 30 миллионов записей и, вероятно, удвоится по мере продвижения.
Спасибо за ваши ответы!
Значит, у них были все условия в одном поиске, каждый с повышением? Считаете ли вы, что это будет хорошо работать для нашей ситуации? Кроме того, это было для вашей собственной компании или как фрилансер?Мы ищем какую-то внешнюю помощь, чтобы эффективно это настроить. Еще раз спасибо! –
Да, я использовал это для контекстной рекламы. Я сделал это для компании, в которой я работаю. –