Мы запускаем бесплатную версию Google Analytics, и я вижу некоторые несогласованные результаты в отношении выборки данных. Я пробовал свои запросы в Проводнике запросов Google Analytics, дополнении GA Sheets и в интерфейсе GA.Является ли API Google Analytics containsSampledData надежным?
В принципе, я сравниваю результаты с полным диапазоном дат от суммы результатов за этот диапазон дат, разбитых на более мелкие куски (чтобы уменьшить/удалить вероятность возникновения выборки). Показатели - это сеансы, транзакции и доход. У меня есть динамический сегмент на уровне сеанса: session :: condition ::! Ga: landingPagePath = @/thanks
Как и следовало ожидать, результаты по одному запросу различаются (количество меньше), чем сумма суммирования несколько меньших запросов. Например, сеансы составляют 45 311 против 51 596, а доход - отдельно. Это означает, что выборка используется для большего запроса. Беда в том, что ответ API явно говорит о том, что выборка не используется в любом случае, т. Е. «Содержит сэмплированные данные» равно «Нет», даже для полного диапазона дат, в пределах которого наше свойство должно превышать порог 500 000 сеансов для отбора проб для удара
Я почти уверен, что результаты суммирования меньших диапазонов дат верны, так как они довольно близки к тому, что мы видим в нашей аналитике CMS.
Может ли кто-нибудь объяснить механику позади этого? Является ли GA какой-то закулисной выборкой, чтобы произвести эту несогласованность?
Спасибо, Daniel
Привет, Райан, спасибо за полезный ответ и совет по использованию Python. Однако в этом случае конкретная проблема, которую я вижу, заключается в том, что «содержит выборочные данные», кажется, получает значение «нет», когда данные на самом деле все еще выборочно (я проверил это по сравнению с данными CMS) –