У меня есть RDD, который содержит ключи строки HBase. RDD относительно велик, чтобы вписаться в память. Мне нужно получить RDD значений для каждого из предоставленных ключей. Есть ли способ сделать что-то вроде этого:Spark: сопоставление RDD ключей строки HBase с RDD значений
keys.map(key => table.get(new Get(key)))
Таким образом, вопрос, как я могу получить экземпляр HTable внутри задачи карты? Должен ли я создать экземпляр HConnection для каждого раздела, а затем получить экземпляр HTable от него или есть лучший способ?
Спасибо, но я имел в виду нечто другое: речь идет о получении экземпляра HTable внутри задачи карты. Я отредактировал свой вопрос для разъяснения. –