Я использую библиотеку elasticsearch-hadoop/spark для создания Spark
RDD
с запросов ElasticSearch.Как получить индекс сущностей в ElasticSearch-Spark
esRDD
метод возвращает необработанный документ (_source
, с точки зрения ElasticSearch) и идентификатор документа (_id
в ES), но также необходима дополнительная информация о возвращенных документов, таких как индекс ElasticSearch и введите каждый документ исходит от (эта информация всегда доступна в ES REST API).
Как получить индекс и тип информации о документах в RDD
, возвращаемом методом esRDD
?
EDIT
Я запрашивая несколько индексов, то есть мой вызов esRDD
выглядит следующим образом:
sparkContext.esRDD("index*/entities", query)
и фактические индексы "index1", "index2" и т.д. Итак, я хотите узнать, к какому конкретному индексу пришли каждый из объектов в полученном RDD
.
Пожалуйста, покажите нам некоторый код, как вы вызываете esRDD, вы должны указать индекс и тип в вызове esRDD, как 'sc.esRDD (« radio/artist »)'. Здесь радио является индексом, а художники - типом. –
@PranavShukla Я использую многоиндексные запросы с подстановочными знаками. Я отредактировал вопрос, чтобы сделать это ясно. В любом случае, спасибо за ответ –