2012-03-07 3 views
3

Я бегу мое приложение на Google App Engine ..... Мои файлы журнала огромны из-за интенсивного движения Файл журнала выглядит следующим образомХотите обработать файл журнала большой Appengine

122.167.221.243 - - [06/Mar/2012:01:11:29 -0800] "GET /Bengali/enable HTTP/1.1" 404 0 "http://www.epicsearch.in/" - 
---Similar rows ---- below 

Я хочу обрабатывать их, чтобы получить значимые статистические данные, такие как нет. уникальных IP-адресов или нет. хитов на заданной странице .... Я новичок, поэтому не знаю, как это сделать !!!!!

ответ

1

Предполагая, что вы еще не сделали этого, то первое, что вам нужно сделать, это download your App Engine logs с помощью утилиты appcfg.py, например:

appcfg.py --num_days=5 request_logs appname/ logs.txt 

После загрузки, вы должны бросить вместе сценарий или программа до разобрать ваши журналы для любой информации вы deem полезно.

This Вопрос о переполнении стека может быть хорошим местом для начала - действительно, любой достойный язык сценариев должен уметь правильно анализировать эти журналы для вас.

+0

Спасибо большое ..... Я уже загрузил файл журнала ... Я рассмотрю какой-то скрипт для анализа данных – Dilletante