Мне нужно объединить данные из Google Datastore и Google BigTable, чтобы подготовить отчет. Мне нужно каждую минуту выполнять эту операцию. Можно ли выполнить с Google Cloud Dataflow (при условии, что сама обработка не займет много времени и/или может быть разделена на независимые параллельные задания)?Выполнение задания периодического потока данных
Должен ли я иметь бесконечную петлю внутри «основного» создания и выполнения того же самого трубопровода снова и снова?
Если большинство времени в таком сценарии принимается путем создания виртуальных машин, можно ли инструктировать Dataflow использовать виртуальные машины клиентов?
Спасибо,
Сколько данных вы бы хотели добавить и где бы вы сохранили результаты? –