2016-09-13 2 views
0

Я запрашиваю просмотр страниц по страницам из BigQuery. Мой запрос:Небольшая разница в просмотрах страниц в BigQuery и GA

SELECT hits.page.pagePath, COUNT(*) as pageViews FROM `bigquery-refresh.refresh.ga_sessions_2015*`, 
UNNEST(hits) as hits 
WHERE date >= '20150101' AND date < '20150701' 
AND geoNetwork.country = "United States" 
AND hits.type="PAGE" 
GROUP BY hits.page.pagePath 
ORDER BY pageViews DESC 

я сравниваю этот запрос к общей сумме просмотров страниц сообщенных внутри GA (для одной и той же страны и диапазон дат), и нахожу, что общее количество просмотров страниц в ГА составляет ~ На 0,4% больше, чем в BigQuery. Есть ли причина для этого небольшого несоответствия?

+0

'count' является приблизительным в BigQuery, это не точно – Pentium10

+0

' COUNT' является точным, а не приблизительным. Может быть, вы думаете о 'COUNT (DISTINCT ...)' в устаревшем SQL? Однако, к первоначальному вопросу, возможно ли, что расхождение связано с метрикой в ​​GA, включая некоторые дополнительные данные с конца? Мне любопытно, есть ли еще расхождение, если вы ограничиваете диапазон, например. до только месяца июля. –

+0

@ElliottBrossard Да, они соответствуют точному месяцу июля. – Feynman27

ответ

0

Я не знаком с ГА, а вот мои случайные догадки:
(1) Как Эллиот отметил, возможно, GA включает в себя некоторые дополнительные данные (2) Или, может быть, GA использует различные правила, чем COUNT (*) (3) Я знаю, что Adwords будет корректировать данные отчета даже через несколько дней. Возможно, у GA такая же особенность.

0

Вы уверены, что вы считаете, что правильно?

В Schema documentation говорится, что каждая строка в BQ соответствует сеансу (не удалению или просмотру страницы), поэтому счетчик (*) не будет правильным и, следовательно, будет показывать другое число по сравнению с пользовательским интерфейсом GA ,

Схема также показывает, что для просмотра страниц у вас есть итоги:

  • totals.pageviews (проверьте определение here)
  • totals.hits (проверьте определение here)

Таким образом, каждый взаимодействие со страницей является хитом. Можете ли вы подтвердить, что с помощью totalals.pageviews вы получаете правильный номер?

Смежные вопросы