2016-09-15 3 views
1

У меня есть таблица с 340 ГБ данных, но мы используем только последнюю неделю данных. Таким образом, чтобы минимизировать планирование затрат, переместите эти данные в таблицу разделов или таблицы осколков.Bigquery Shard Vs Bigquery Partition

Я проделал некоторый эксперимент с таблицами и разделами осколков. Я создал таблицу разделов и загрузил данные за два дня (два раздела) и создал две таблицы осколков (отдельные таблицы). Я пытался вытащить данные за последние два дня.

Полная таблица - 27sec Partition Table - 33 сек шарда столы - 91 сек

Пожалуйста, дайте мне знать, какой путь лучше. На основе результата эксперимента быстро выполняется, когда я бегу против полной таблицы, но полная таблица будет сканировать.

Спасибо,

+2

Можете ли вы предоставить два запроса, которые вы используете для сравнения? Было бы также полезно знать два идентификатора работы. (Мне не нужен идентификатор проекта). –

ответ

0

Разница в производительности, кажется, из-за некоторые фоновые оптимизации, которые работают на однораздельную столе, но еще работать на секционированную таблице (так как данные выше).

Смежные вопросы