Say я запускаю следующий запрос на PSQL:DISTRIBUTE уведомлений в Greenplum
> select a.c1, b.c2 into temp_table from db.A as a inner join db.B as b
> on a.x = b.x limit 10;
я получаю следующее сообщение:
ВНИМАНИЕ: Таблица не имеет «ДИСТРИБЬЮТОРА» п - Использование столбцов с именем 'c1' в качестве ключа распространения данных базы данных Greenplum для этой таблицы.
СОВЕТ: Предложение «РАСПРОСТРАНЕНИЕ» определяет распределение данных . Убедитесь, что выбранные столбцы являются оптимальным ключом распределения данных , чтобы свести к минимуму перекос.
- Что такое
DISTRIBUTED BY
колонка? - Где:
temp_table
? Он хранится на моем клиенте или на сервере?
База данных Greenplum - это вилка Postgres, а 'DISTRIBUTED BY' существует в Postgres. –
Спасибо @IgorRomanchenko - Вы знаете, где хранится 'temp_table'? Будет ли он сохранен в моем клиенте в памяти? На сервере? Требуется ли меньше места в памяти в виде таблицы, чем в файле csv? –
Я не очень хорошо знаю Greenplum, но Postgres (и все остальные базы данных, которые я знаю) хранят свои таблицы только на стороне сервера.Что касается размера стола - это зависит. Скорее всего, это займет меньше места в двоичной форме в виде таблицы Greenplum. –