Я использую Scala & потребляющих данные от Кафки, используя ниже Спарк Streaming подхода:Преобразование искровым Кафка InputDStream в массив [Bytes]
val lines = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](ssc, kafkaParams, topics).map(_._2)
Над переменных возвращается InputDStream, через которые я могу видеть данные в сыре/бинарный формат, используя приведенный ниже код: println (строка)
Но мне нужно применить формат avro (доступная схема) в формате raw/binary, чтобы видеть данные в ожидаемом формате json. Чтобы применить формат avro, мне нужно преобразовать выше InputDStream в Array [Bytes], который используется avro.
Может кто-нибудь, пожалуйста, дайте мне знать, чтобы преобразовать InputDStream в Array [Bytes]?
Или
Если вы знаете, какой лучший способ применить Avro схему на InputDStream (искры Streaming), пожалуйста, поделитесь.
Удивительный, большое спасибо! Мне просто нужно значение DStream в качестве массива [Byte], поэтому я получил его, используя: val lines: DStream [(Array [Byte])] = KafkaUtils.createDirectStream [ String, Array [Byte], StringDecoder, DefaultDecoder] ( ssc , kafkaParams, темы) .map (_._ 2) –