2016-01-12 4 views
2

Мы запускаем бесплатную версию Google Analytics, и я вижу некоторые несогласованные результаты в отношении выборки данных. Я пробовал свои запросы в Проводнике запросов Google Analytics, дополнении GA Sheets и в интерфейсе GA.Является ли API Google Analytics containsSampledData надежным?

В принципе, я сравниваю результаты с полным диапазоном дат от суммы результатов за этот диапазон дат, разбитых на более мелкие куски (чтобы уменьшить/удалить вероятность возникновения выборки). Показатели - это сеансы, транзакции и доход. У меня есть динамический сегмент на уровне сеанса: session :: condition ::! Ga: landingPagePath = @/thanks

Как и следовало ожидать, результаты по одному запросу различаются (количество меньше), чем сумма суммирования несколько меньших запросов. Например, сеансы составляют 45 311 против 51 596, а доход - отдельно. Это означает, что выборка используется для большего запроса. Беда в том, что ответ API явно говорит о том, что выборка не используется в любом случае, т. Е. «Содержит сэмплированные данные» равно «Нет», даже для полного диапазона дат, в пределах которого наше свойство должно превышать порог 500 000 сеансов для отбора проб для удара

Я почти уверен, что результаты суммирования меньших диапазонов дат верны, так как они довольно близки к тому, что мы видим в нашей аналитике CMS.

Может ли кто-нибудь объяснить механику позади этого? Является ли GA какой-то закулисной выборкой, чтобы произвести эту несогласованность?

Спасибо, Daniel

ответ

1

Похоже выборки. Проверьте все источники, чтобы убедиться, что они содержат выборку, и убедитесь, что у вас установлен уровень выборки «HIGHER_PRECISION».

1) Google Таблицы Google Analytics Add-On в ячейке B6 данных для каждой проверки запроса, чтобы увидеть, если он говорит: «Да: для "Содержит выборочные данные"

2) Google Analytics Query Explorer, в заголовке под именем вашего профиля, чтобы узнать, говорит ли он: «Содержит данные сэмплирования: да»

Вы находитесь на правильном пути, разбирая свой запрос на меньшие куски с меньшими диапазонами дат, чтобы избежать выборки. должность о том, как Avoid Google Analytics Sampling using Python

+0

Привет, Райан, спасибо за полезный ответ и совет по использованию Python. Однако в этом случае конкретная проблема, которую я вижу, заключается в том, что «содержит выборочные данные», кажется, получает значение «нет», когда данные на самом деле все еще выборочно (я проверил это по сравнению с данными CMS) –

Смежные вопросы