В этом случаели искра потокового запускать несколько Еогеасп параллельно
val dStream : Stream[_] =
dStream.foreachRDD(a => ...)
dStream.foreachRDD(b => ...)
ли методы Foreach:
- работать параллельно?
- работать в последовательности, но без определенного порядка?
- ForeachRDD (a =>) перед foreachRDD (b =>)?
Я хочу знать это, потому что я хочу совершить смещение kafka после вставки базы данных. (А разъем дб дают только «Еогеасп» врезку)
val dStream : Stream[_] = ...().cache()
dStream.toDb // consume the stream
dStream.foreachRDD(b => //commit offset) //consume the stream but after the db insert
В свече UI это выглядеть есть порядок, но я не уверен, что это надежно.
Редактировать: если сбой foreachRDD (a =>) завершен, выполняется ли foreachRDD (b =>)?
Да, прошу прощения, но я не возражаю против RDD. Параллелизм довольно хорошо объясняет в документации, но не «DStream fork» Так что ответ 3. Если foreachRDD (a =>) делает foreachRDD (b =>), будет выполнен любым способом? (Я должен был отредактировать ma вопрос для этого) – crak
@crak Я не понял ваш последний вопрос. –
Представьте, что вставка базы данных терпит неудачу, выполнить вторую инструкцию (фиксацию смещения)? – crak