Я заметил, что одно из моих заданий по потоку данных создало вывод с тем, что я мог бы лучше всего описать как слишком много случайных бит-флип. Например, год «2014» (в виде текста) был написан как «0007» или «2016» или «0052» или другие текстовые значения. В некоторых случаях формат выходной строки действителен (что говорит о том, что что-то произошло в процессе обработки), но несколько строк, похоже, имеют искаженное форматирование (например, «20141215-04-25» вместо «2014-12-25»).Ошибки целостности данных в задачах потока данных Google Cloud
Я иногда повторно запускаю задания с тем же кодом и разными параметрами диапазона дат, и для этого определенного диапазона дат работа заканчивалась успешно примерно до недели назад. Я пробовал разные конфигурации машины, хотя (4 процессора и 1-процессорные экземпляры), и проблемы, похоже, происходят больше с экземплярами 4-процессор.
Кто-нибудь знает, что может привести к этому?
Спасибо, G
Привет, G B, позвольте мне следить за этим поведением. Это явно не предполагаемое поведение. –
Мы запросили дополнительную информацию конфиденциально и опубликуем ответ как можно скорее. Спасибо, G B! –