У меня есть система, которая собирает данные журнала Apache в режиме реального времени из примерно 90-100 веб-серверов. Я также определил некоторые шаблоны URL.Какая лучшая база данных/хранилище для хранения статистических данных?
Теперь я хочу создать еще одну систему, которая обновляет время появления каждого шаблона на основе этих журналов.
Я думал об использовании MySQL для хранения статистических данных, обновлять их заявление: "Update table
установить count
= кол + 1, где ....",
, но я боюсь, что MySQL будет медленным для данных с такого количества серверов. Кроме того, я ищу некоторые решения для хранения данных и хранения данных, которые более масштабируемы и просты. (В качестве СУБД MySQL поддерживает слишком много вещей, которые мне не нужны в этой ситуации). Есть ли у вас какие-либо идеи ?
Redis будет идеальным решением, поскольку он обеспечивает операции атомарного инкремента для защиты от гонки условия. Cassandra и Riak не поддерживают эту функцию, которая затруднит обновление данных. –