Мне нужно сохранить значения из kafka-> spark streaming-> cassandra.Сохранение значений от искры до Кассандры
Теперь, я получаю значения от искры kafka->, и у меня есть искровое задание для сохранения значений в db cassandra. Однако я столкнулся с проблемой с datatype dstream.
В этом следующем фрагменте вы можете увидеть, как я пытаюсь преобразовать DStream в удобный объект списка python, чтобы я мог работать с ним, но он дает ошибку.
входа на производителе Кафки:
Byrne 24 San Diego [email protected] Rob
искровой работа:
map1={'spark-kafka':1}
kafkaStream = KafkaUtils.createStream(stream, 'localhost:2181', "name", map1)
lines = kafkaStream.map(lambda x: x[1])
words = lines.flatMap(lambda line: line.split(" "))
words.pprint() # outputs-> Byrne 24 SanDiego [email protected] Rob
list=[lambda word for word in words]
#gives an error -> TypeError: 'TransformedDStream' object is not iterable
Это, как я экономлю значение от искрового> Кассандры
rdd2=sc.parallelize([{
... "lastname":'Byrne',
... "age":24,
... "city":"SanDiego",
... "email":"[email protected]",
... "firstname":"Rob"}])
rdd2.saveToCassandra("keyspace2","users")
Что лучший способ преобразования объекта DStream в словарь или что лучший способ сделать то, что я пытаюсь сделать здесь?
Мне просто нужны значения, полученные от kafka (в виде DStream), которые будут сохранены в Кассандре.
Спасибо, и любая помощь будет приятной!
Версия:
Cassandra v2.1.12
Spark v1.4.1
Scala 2.10
Потому что это была моя ошибка, более связанная с проблемой $ JAVA_HOME, чем мезо. – HackCode
Хорошо человек расслабиться. Нет причин, чтобы получить здесь гипер. Не будем спамить этот пост сейчас. – HackCode