Track # – Session #
Независимые системы (shared-nothing)
Сеть
Track # – Session #
Контрольный узел управляет процессом исполнения запроса и создает MPP план выполнения
Фактические данные располагаются на вычислительных узлах и этапы глобального плана выполняются на каждом узле
Сервис перемещения данных (Data Movement Service) отвечает за перемещение данных между узлами таким образом, чтобы они могли выполнить запрос, данные которого располагаются на других узлах
Результат
Ультра Shared-Nothing
Возможность создать дизайн таким образом, чтобы минимизировать перемещение данных между узлами
Распределенные таблицы (пример)
PDW Узел 1
Create Table
8 Таблиц
PDW Узел 10
Create Table
PDW Узел …
Несовместимое распределение
Запрос требует перераспределение данных между узлами для возврата корректного результата.
Простой запрос по распределенной таблице с Group By, который не включает в себя ключ распределения
Ключ распределения не используется в соединения и группировках распределенных таблиц.
Таблица репликации внешне соединяется с таблицей распределения
Item Dim
Store Sales
SELECT ss_key, Qty
FROM item_dim a
JOIN store_sales b
ON a.item_key = b.item_key
WHERE a.color = ‘Yellow’
Result Set
5,12
Результат
5,12 : 6,17
Result Set
6,17
Item Dim
Store Sales
\
REPLICATED
DISTRIBUTED
Result Set
Red,5
Результат
Red,5 : Red,3
Result Set
Red,3
Store Sales
Distributed Table
Web Sales
Web Sales
Distributed Table
Тип соединения: shared nothing
Совместимое распределение
Соединение включает в себя совместимые ключи распределения
DISTRIBUTED
DISTRIBUTED
Store Sales
SELECT vs_key, a.ord, b.qty
FROM vendor_sales a
JOIN store_sales b
ON a.vs_key = b.VID
WHERE a. color = ‘Red’
Result Set
11,15, 5
Результат
11,15,5 : 21,13,3
Result Set
21,13, 3
Store Sales
Vendor Sales
Vendor Sales
Distributed Table
Distributed Table
SHUFFLED
Store Sales
SELECT a.color, a.ord ,b.qty
FROM vendor_sales a
JOIN store_sales b
ON a.color = b.color
WHERE a.color = ‘Red’
Result Set
15, 5
13,3
Final Result Set
15,5 : 13,3
Result Set
NULL
Store Sales
Distributed Table
Vendor Sales
Vendor Sales
Distributed Table
Distributed Table
Distributed Table
SHUFFLED
SHUFFLED
Load Manager создает промежуточные таблицы такой же геометрии, что и целевая таблица
Каждая строка конвертируется для bulk insert и хэшируется
Хэшированная строка отсылается узлу, которому она принадлежит
Полученная строка поступает в очередь получателя
Строка вставляется в промежуточную таблицу методом bulk insert
x рост производительности
Полная поддержка языков
Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:
Email: Нажмите что бы посмотреть