У меня есть файл с последовательностью меток времени событий, соответствующего время, в котором кто-то посещает веб-сайт:Как анализировать веб-трафик статистически корректно?
02.02.2010 09:00:00
02.02.2010 09:00:00
02.02.2010 09:00:00
02.02.2010 09:00:01
02.02.2010 09:00:03
02.02.2010 09:00:05
02.02.2010 09:00:06
02.02.2010 09:00:06
02.02.2010 09:00:09
02.02.2010 09:00:11
02.02.2010 09:00:11
02.02.2010 09:00:11
и т.д., для нескольких тысяч строк.
Я хотел бы получить представление о том, как веб-хиты распространяются со временем, в течение недели и т. Д. Мне нужно знать, как я должен масштабировать (будущие) веб-серверы, чтобы гарантировать доступность сервиса с заданным номером из девяти. В частности, мне нужно дать верхние оценки числа почти параллельных визитов.
Есть ли какие-либо ресурсы, которые объясняют, как это сделать? Я свободно владею математикой и статистикой, и я посмотрел на теорию массового обслуживания, но, похоже, эта теория предполагает, что скорость прибытия не зависит от времени суток, что явно неверно в моем случае. И НЕТ, гистограммы не являются правильным ответом, так как результат сильно зависит от ширины и размещения бункера.