2016-03-31 3 views
0

Мы назвали Greenplum, Redshift MPP или ничего не разделяем. , но я действительно не понимаю, почему? , если это означает, что во время запроса соединения на уровне мута один хост вычисляет все время, никакие хосты обмениваются данными друг с другом?, Нет перетасовки? а также иная ситуация. Каковы основные средства «ничего не делить»?Что значит «ничего общего»?

ответ

0

Ничего не означает, что ни один сервер не имеет одинаковых данных (кроме зеркал для высокой доступности). Простым примером может служить кластер с двумя узлами, где данные распределяются по гендерному коду. У Node1 было бы все мужчины, а у узла 2 были бы все женщины.

В реальном мире у вас есть больше узлов, чем только два, поэтому вы распространяете данные на что-то вроде столбца идентификатора. Это дает равномерное распределение данных по всем узлам.

Как вы можете догадаться, оптимизатор должен быть довольно умным, чтобы уменьшить объем перемещения данных, необходимый для выполнения запроса. Он также должен разрезать запрос на несколько частей, чтобы он мог выполнять сразу несколько фрагментов запроса. Greenplum существует уже более 10 лет и имеет зрелый оптимизатор, который может выполнять самые разнообразные запросы.

+0

спасибо за подробное объяснение. – user5107182

1

«Общие сведения» - это описание того, какие ресурсы распределяются между параллельными процессами. Таким образом, у вас могут быть общие подходы к памяти, работающие на одном хосте, совместное хранилище между несколькими хостами или автономными системами с собственной обработкой, оперативной памятью и хранилищем. Развертывание, основанное на некоторых из этих автономных систем, будет описываться как «ничего общего».

В системе без общего доступа каждый узел будет хранить подмножество данных. Планировщики запросов в этих системах стараются сделать как можно больше работы на одном и том же хосте, данные хранятся и перемещаются или перемещаются как можно меньше данных (в системах Greenplum эти шаги в плане запроса называются движениями).

0

Мы называем MPP «Shared Nothing» как способ сравнить Greenplum с чем-то с архитектурой «Shared Everything», такой как Oracle RAC, которая также имеет несколько серверов в кластере, но все они подключаются к одному и тому же набору файлов данных.

Смежные вопросы