Мне было интересно узнать о дизайне базы данных Google Analytics, о том, как они обрабатывают огромные значения ежечасно, даже в считанные минуты.Дизайн базы данных аналитики Google
Предположим, у них 100 миллионов пользователей, и почти каждый пользователь имеет по 300 счетчиков каждую минуту. Для одного пользователя 300 счетчиков имеют 18000 строк за один час. За один день это 432K строк и почти 3 миллиона строк.
я подумал, что они не используют реляционную базу данных, но не уверен в этом ...
Есть ли какие-либо предложения по этому поводу?
С уважением,
Я уверен, что Google использует специальную базу данных под названием BigTable (http://en.wikipedia.org/wiki/BigTable) – Kane
google говорит: # BigTable - это распределенный механизм хэша, созданный поверх GFS (Google Файловая система). Это не реляционная база данных. Он не поддерживает запросы на объединение или SQL-тип. # Он обеспечивает механизм поиска для доступа к структурированным данным по ключу. GFS хранит непрозрачные данные, и многие приложения нуждаются в данных со структурой. От этого комментария ключевое слово важно. Механизм lookup mechanishm обрабатывается только для одного ключа. Кажется, у него очень большой HashTable внутри ... – Melih