У меня есть несколько файлов, которые выгружают таблицу из 3NF-модели, загруженной в Google Cloud Storage. Каковы рекомендуемые шаги для присоединения/сглаживания в один файл для будущего использования с BigQuery?Как сгладить несколько файлов GCS (выгрузка таблиц 3NF) в один файл GCS с использованием GC Dataflow?
Можете ли вы указать мне лучший пример (ы), который соответствует моему прецеденту?
Могу ли я сначала загрузить отдельные файлы в BigQuery?
Я думал, что это может быть общим шаблоном для экспорта данных из реляционной БД в GCS и преобразование через поток данных в плоский формат для BigQuery. Вы видели другой способ или можете подумать о лучшем пути? – successhawk
Какую часть решения вы хотели бы улучшить? Если вы предоставите более подробную информацию о том, что вы пытаетесь сделать, мы сможем сделать конкретные рекомендации. Например, при чтении из базы данных общий вопрос заключается в том, следует ли читать всю базу данных и обрабатывать/фильтровать каждую запись по мере необходимости или выборочно импортировать подмножество данных, например. запустив запрос, чтобы выбрать только те записи, которые вам интересны. Решение будет зависеть от вашей проблемы. –