Я использую искру с Кассандрой и я уже выполнен этот скрипт:параллелизовать Resultset
import com.datastax.spark.connector.cql.CassandraConnector
val cc = CassandraConnector(sc.getConf)
val select = s"SELECT channel, ctid, cvid , WRITETIME(source) FROM "+CASSANDRA_SCHEMA+"."+table+";"
val session = cc.openSession()
val results = session.execute(select)
PS: Я обязуюсь использовать этот метод из-за WRITETIME(source)
. Но значение results
val является результатом набора данных, и мне интересно, можно ли распараллелить этот результирующий набор, чтобы получить RDD
Спасибо заранее.
Это совсем не похоже на Java. Возможно, вы работаете с Scala. –
да спасибо ^^ –
Вам это нужно в сеансе? Не могли бы вы использовать 'CassandraSQLContext'? –