2016-11-16 3 views
0

Я хочу читать данные из таблицы Hbase, используя команду get, в то время как у меня есть также ключ строки. Я хочу сделать это в приложении Spark streaming, есть ли какой-либо источник код, который может поделиться?Чтение данных из Hbase с помощью команды Get в Spark

+0

Я не думаю, что вы можете использовать Спарк потокового для этого. Но вы можете прочитать таблицу Hbase, используя Spark newHadoopAPI, которая возвращает RDD или использует любой коннектор, такой как HortonWorks Hbase, который возвращает DataFrame или использует Phoenix Spark API. – Shankar

ответ

0

Вы можете использовать Spark newAPIHadoopRDD для чтения таблицы Hbase, которая возвращает и RDD.

Например:

val sparkConf = new SparkConf().setAppName("Hbase").setMaster("local") 
val sc = new SparkContext(sparkConf) 
val conf = HBaseConfiguration.create() 
val tableName = "table" 

conf.set("hbase.master", "localhost:60000") 
conf.set("hbase.zookeeper.quorum", "localhost:2181") 
conf.set("zookeeper.znode.parent", "/hbase-unsecure") 
conf.set(TableInputFormat.INPUT_TABLE, tableName) 


val rdd = sc.newAPIHadoopRDD(conf, classOf[TableInputFormat], classOf[ImmutableBytesWritable], classOf[Result]) 
println("Number of Records found : " + rdd.count()) 
sc.stop() 

Или вы можете использовать любой Спарк Hbase разъем как разъем Hortonworks Hbase.

https://github.com/hortonworks-spark/shc

Вы также можете использовать искровую Phoenix API.

https://phoenix.apache.org/phoenix_spark.html

Смежные вопросы