2010-06-30 1 views
7

Я ищу некоторые технологии для исследования. Я поражен тем, что вы можете войти в интерфейс [вставлять большой сайт здесь], обновить настройку, и в течение нескольких секунд он выталкивается, так что он живет по всем направлениям. Хорошим примером этого является adwords. Если вы перейдете в adwords и измените кампанию, эти настройки будут сохранены на сервере с уникальным идентификатором. Код объявления вызывает сервер с этим идентификатором, и информация (размер, цвета и т. Д.) Мгновенно вытягивается, чтобы показывать объявление. Как Google может так быстро вывести это на сотни тысяч серверов? Какой тип систем db они используют?Как крупные сайты (Google, Facebook и т. Д.) Распространяют информацию на все серверы в реальном времени?

ответ

6

Google опубликовал научные статьи для своих Google File System (или «BigFiles», как это когда-то было известно) и BigTable, оба из которых широко используются в своих службах. Вероятно, они будут хорошо читать, сами по себе и потому, что они, вероятно, ссылаются на предшествующий уровень техники.

0

Я знаю, что Facebook использует peer-to-peer для обновления на своем сервере.

Первый сервер получит обновление, затем он отправит его другим пользователям, которые делают то же самое ... и до тех пор, пока обновление не будет на всех их серверах!

+0

имен программного обеспечения или теорий я могу исследование? –

0

Я искал похожие фрагменты информации.

Ищите «Структурированные данные».

Спецификации: MojoDB, CouchDB. Ищите сравнения на сайте mojodb.

Facebook создал Cassandra (распределенная база данных) с открытым исходным кодом. Я думаю, что они и многие другие используют его сейчас.

Также обратите внимание на структуру Hadoop и карту/сокращение, в качестве интереса.

Смежные вопросы