После озадачен более ранним quesiton: SO google-analytics-domain-data-without-filteringОсновные аналитики сайта не совпадает с данными Google
Я экспериментировал с очень простой системой аналитики моей собственной.
MySQL таблицы:
hit_id, subsite_id, timestamp, ip, url
subsite_id давайте мне перейти к папке (как описано в предыдущем вопросе).
теперь я могу получить следующие показатели:
- Page Views - Группировать по subsite_id и дате
- Unique Page Views - сгруппированных по subsite_id, дата, URL, IP (не nesecarily как Google делает это!)
- Обычными «самый посещаемые страницы», «вероятно, время для посещения» и т.д. и т.п.
Я теперь по сравнению мои данные, что в Google Analytics и обнаружил, что Google га s нижние значения каждой метрики. Т.е., моя собственная настройка подсчитывает больше хитов, чем Google.
Итак, я начал дисконтировать IP-адреса от различных веб-сканеров Google, Yahoo & Dotbot пока.
Коротких вопросы:
- Стоит ли мне сопоставляя список все основного гусеничной скидки, является любого списка, вероятно, регулярно менять?
- Есть ли другие очевидные фильтры , что Google будет применять данные GA ?
- Какие еще данные вы бы получили , которые могут быть полезными далее вниз по линии?
- Какие переменные содержит Google использует для выхода ключевые слова для поиска на сайте?
Данные будут использоваться только для нашей собственной системы ранжирования подсайтов, но я хотел бы показать своим пользователям некоторые основные данные (просмотры страниц, наиболее популярные страницы и т. Д.) Для их ссылки.
Я обнаружил, что аналитика Google занимает иногда 6 часов или более, чтобы сообщить о материалах (это было пару лет назад, может быть, это было быстрее?). Может ли это объяснить ваше несоответствие? Плюс я не думаю, что они отображают вещи в моем часовом поясе. – mlsteeves
Hi mlsteeves, да, есть задержка, но я специально использовал данные с прошлой недели. Спасибо за ваш комментарий. –
Каков источник ваших данных? Журналы сервера? – doug