У нас есть таблица, разбитая по дням в BigQuery, которая обновляется потоковыми вставками.Как запросить данные в потоковом буфере ТОЛЬКО в BigQuery?
doc говорит, что: «при потоковой передаче в секционированной таблице, данные в буфере потокового имеет значение NULL для _PARTITIONTIME псевдо колонке»
Но если я запрашиваю для select count(*) from table where _PARTITIONTIME is NULL
она всегда возвращает 0, хотя bq show
говорит, что в потоковом буфере есть много строк.
Означает ли это, что псевдо-столбец вообще отсутствует для строк в потоковом буфере? В любом случае, как я могу запрашивать данные ТОЛЬКО в потоковом буфере, не становясь полным сканированием таблицы?
Заранее спасибо
, что является практическим примером использования этого? я не думаю, что вы можете запросить/прочитать потоковый буфер, но если вы объясните, почему вы считаете, что вам нужно его прочитать, мы можем выяснить, как это сделать. –
У меня есть потоковая работа, которая обновляет таблицу в BigQuery , У меня есть работа по нисходящему потоку, которая запускает каждые 15 минут и агрегирует данные за день до сих пор - так что ему нужно запросить что-то эквивалентное «где _PARTITIONTIME = сегодня ИЛИ data_in_streaming_buffer». Есть ли способ достичь этого? Благодарю. –