Есть ли способ, как я могу сделать документы Solr вложенными mongoDB? Мы уже можем индексировать значения верхнего уровня ключей в документе mongo через mongo-коннектор, толкаем данные в Solr.Индексирование встроенных документов mongoDB (в массиве) с помощью Solr
Однако в таких ситуациях, как в этой структуре, которая представляет собой сообщение:
{
author: "someone",
post_text : "some really long text which is already indexed by solr",
comments : [
{
author:"someone else"
comment_text:"some quite long comment, which I do not
know how to index in Solr"
},
{
author:"me"
comment_text:"another quite long comment, which I do not
know how to index in Solr"
}
]
}
Это просто пример структуры. В нашем проекте мы обрабатываем более сложные структуры, и иногда текст, который мы хотим индексировать, вложен на второй или третий уровень (глубина или формальное имя).
Я считаю, что существует сообщество пользователей mongoDB + Solr, и поэтому эта проблема должна была быть адресована раньше, но мне не удалось найти хорошие материалы, которые могли бы покрыть эту проблему, если есть хороший способ, как (или, возможно, вы могли бы предоставить мне один)
Для лучшего понимания одна из наших структур имеет ключ верхнего уровня, который имеет для своей ценности массив некоторых результатов анализа, где один из них имеет массив сингулярных значений, которые являются частями результата. Нам нужно индексировать эти значения. Например. (Это не реальная структура данных, мы используем):
{...
Analysis_performed: [
{
User_tags:
[
{
tag_name: "awesome",
tag_score: 180
},
{
tag_name: "boring",
tag_score: 10
}
]
}
]
}
В этом случае мы должны были бы проиндексировать на имена тегов. Есть вероятность того, что у нас будет плохая структура для хранения данных, которые мы хотим сохранить, но мы много думали об этом, и мы думаем, что это неплохо. Однако, даже если мы переключимся на менее вложенную информацию, мы, скорее всего, столкнемся хотя бы с одной ситуацией, когда нам придется индексировать информацию, хранящуюся во встроенных документах, находящихся в массиве, и это основной вопрос. Можем ли мы индексировать такие данные с помощью SOLR?
Итак, мы думаем об использовании этого разъема в производственной среде - как вы думаете, проект в порядке и надежен? Используется ли он где-то еще в производстве? – Ev0oD