Красный в книге, искрящийся в действии:Искры для асинхронных обновлений.
«Спарк не подходит, однако, для асинхронных обновлений общих данных (например, для обработки онлайн-транзакций, например), поскольку он был создан с пакетом аналитика. (Spark streaming - это просто пакетная аналитика, применяемая к данным во временном окне.) Инструменты, специализированные для этих случаев использования, по-прежнему будут необходимы ».
Может ли кто-нибудь объяснить это под этим?
Меня интересует использование искры для выполнения некоторого процесса ETL. В качестве побочной заметки я намерен использовать кафку посередине. Хотя я не понимаю эту проблему. Потому что получение данных из Kafka и запись их в базу данных было бы одной и той же проблемой. Это будет сделано в parrallel.