Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВС презентация

Содержание

1. Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВС
2. Классификация вычислительных систем… Систематика Флинна (Flynn)
3. Систематика Флинна SISD SIMD
4. Систематика Флинна MISD MIMD
5. Классификация вычислительных систем… Детализация систематики Флинна…
6. Классификация ПВС Детализация систематики Флинна…
7. Классификация по взаимодействию с оперативной памятью Типы
8. Мультипроцессоры с единой общей памятью Мультипроцессоры с
9. Мультипроцессоры (UMA)
10. Мультипроцессоры (UMA) Проблемы: Доступ с разных процессоров
11. Мультипроцессоры (NUMA) C использованием физически распределенной памяти
12. Мультипроцессоры (NUMA) Мультипроцессоры с использованием физически распределенной памяти…
13. Мультипроцессоры (NUMA) Мультипроцессоры с использованием физически распределенной
14. Мультипроцессоры (NUMA) Мультипроцессоры с использованием физически распределенной
15. Классификация ПВС Мультикомпьютеры… не обеспечивают общий доступ
16. Классификация ПВС Мультикомпьютеры
17. Мультикомпьютеры Данный подход используется при
18. Мультикомпьютеры. Кластеры… Кластер - множество
19. Мультикомпьютеры. Кластеры… Преимущества: Могут быть образованы
20. Мультикомпьютеры. Кластеры Недостатки: Организация взаимодействия ->
21. Мультикомпьютеры. MPP-системы MPP – Massive Parallel Processing
22. Топологии сети передачи данных в ПВС Линейка
23. Гиперкуб - данная топология представляет собой
25. Расстояние между процессорами Архитектура кластерной системы (способ
26. Расстояние между процессорами. Какое максимальное расстояние
27. Расстояние между процессорами. Теория показывает, что
28. Гиперкуб - данная топология представляет собой
29. Расстояние между процессорами. Гиперкуб. Куб – при
30. Архитектура с топологией "толстого дерева" (fat-tree) Одна из самых эффективных. Вид «сверху» Вид «сбоку»
31. Характеристики некоторых топологий сети
32. Характеристики топологий сети Диаметр – показатель, определяемый
33. Характеристики топологий сети Ширина бинарного деления (bisection
34. Языки и системы программирования Базовые языки параллельного
35. Языки и системы параллельного программирования Многоядерные процессоры
36. Технология программирования OpenMP. OpenMP является одной из
37. Система параллельного программирования PVM. PVM (Parallel Virtual
38. Технология MPI вычислительные системы с распределённой памятью
39. Технология программирования CUDA. CUDA (Compute Unified Device

Главная
Разное
Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВС

Слайд 1Лекция 2. Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВС
Основы параллельного

программирования.
М.А. Сокольская

Слайд 2Классификация вычислительных систем…
Систематика Флинна (Flynn)
классификация по способам взаимодействия последовательностей (потоков)

выполняемых команд и обрабатываемых данных:
SISD (Single Instruction, Single Data)
SIMD (Single Instruction, Multiple Data)
MISD (Multiple Instruction, Single Data)
MIMD (Multiple Instruction, Multiple Data)
Практически все виды параллельных систем, несмотря на их существенную разнородность, относятся к одной группе MIMD

Слайд 3Систематика Флинна
SISD
SIMD

Слайд 4Систематика Флинна
MISD
MIMD

Слайд 5Классификация вычислительных систем…
Детализация систематики Флинна…
дальнейшее разделение типов многопроцессорных систем основывается

на используемых способах организации оперативной памяти,
позволяет различать два важных типа многопроцессорных систем:
multiprocessors (мультипроцессоры или системы с общей разделяемой памятью),
multicomputers (мультикомпьютеры или системы с распределенной памятью).

Слайд 6Классификация ПВС
Детализация систематики Флинна…

Слайд 7Классификация по взаимодействию с оперативной памятью
Типы многопроцессорных систем:
multiprocessors (мультипроцессоры или

системы с общей разделяемой памятью),
multicomputers (мультикомпьютеры или системы с распределенной памятью).

Слайд 8Мультипроцессоры с единой общей памятью
Мультипроцессоры с использованием единой общей памяти (shared

memory)…
обеспечивается однородный доступ к памяти (uniform memory access or UMA),
являются основой для построения:
векторных параллельных процессоров (parallel vector processor or PVP). Примеры: Cray T90,
симметричных мультипроцессоров (symmetric multiprocessor or SMP). Примеры: IBM eServer, Sun StarFire, HP Superdome, SGI Origin.

Слайд 9Мультипроцессоры (UMA)

Слайд 10Мультипроцессоры (UMA)
Проблемы:
Доступ с разных процессоров к общим данным и обеспечение, в

этой связи, однозначности (когерентности) содержимого разных кэшей (cache coherence problem),
Необходимость синхронизации взаимодействия одновременно выполняемых потоков команд

Слайд 11Мультипроцессоры (NUMA)
C использованием физически распределенной памяти (distributed shared memory or DSM):
неоднородный

доступ к памяти (non-uniform memory access or NUMA),
Среди систем такого типа выделяют:
Сache-only memory architecture or COMA (системы KSR-1 и DDM),
cache-coherent NUMA or CC-NUMA (системы SGI Origin 2000, Sun HPC 10000, IBM/Sequent NUMA-Q 2000),
non-cache coherent NUMA or NCC-NUMA (система Cray T3E).

Слайд 12Мультипроцессоры (NUMA)
Мультипроцессоры с использованием физически распределенной памяти…

Слайд 13Мультипроцессоры (NUMA)
Мультипроцессоры с использованием физически распределенной памяти:
упрощаются проблемы создания мультипроцессоров (известны

примеры систем с несколькими тысячами процессоров),
возникают проблемы эффективного использования распределенной памяти (время доступа к локальной и удаленной памяти может различаться на несколько порядков).

Слайд 14Мультипроцессоры (NUMA)
Мультипроцессоры с использованием физически распределенной памяти:
упрощаются проблемы создания мультипроцессоров (известны

Слайд 15Классификация ПВС
Мультикомпьютеры…
не обеспечивают общий доступ ко всей имеющейся в системах памяти

(no-remote memory access or NORMA),
каждый процессор системы может использовать только свою локальную память,
для доступа к данным, располагаемых на других процессорах, необходимо явно выполнить операции передачи сообщений (message passing operations).

Слайд 16Классификация ПВС Мультикомпьютеры

Слайд 17
Мультикомпьютеры
Данный подход используется при построении двух важных типов многопроцессорных вычислительных

систем:
массивно-параллельных систем (massively parallel processor or MPP), например: IBM RS/6000 SP2, Intel PARAGON, ASCI Red, транспьютерные системы Parsytec,
кластеров (clusters), например: AC3 Velocity и NCSA NT Supercluster.

Слайд 18
Мультикомпьютеры. Кластеры…
Кластер - множество отдельных компьютеров, объединенных в сеть, для

которых при помощи специальных аппаратно-программных средств обеспечивается возможность унифицированного управления (single system image), надежного функционирования (availability) и эффективного использования (performance)

Слайд 19
Мультикомпьютеры. Кластеры…
Преимущества:
Могут быть образованы на базе уже существующих у потребителей отдельных

компьютеров, либо же сконструированы из типовых компьютерных элементов;
Повышение вычислительной мощности отдельных процессоров позволяет строить кластеры из сравнительно небольшого количества отдельных компьютеров (lowly parallel processing),
Для параллельного выполнения в алгоритмах достаточно выделять только крупные независимые части расчетов (coarse granularity).

Слайд 20
Мультикомпьютеры. Кластеры
Недостатки:
Организация взаимодействия -> к значительным временным задержкам,
Дополнительные ограничения на

тип разрабатываемых параллельных алгоритмов и программ (низкая интенсивность потоков передачи данных)

Слайд 21Мультикомпьютеры. MPP-системы
MPP – Massive Parallel Processing или массивно-параллельные системы.
Система строится из

отдельных модулей, содержащих процессор, локальный банк операционной памяти (ОП), коммуникационные процессоры (роутеры) или сетевые адаптеры, иногда – жесткие диски и/или другие устройства ввода/вывода. По сути, такие модули представляют собой полнофункциональные компьютеры

Слайд 22Топологии сети передачи данных в ПВС
Линейка - система, в которой все

процессоры перенумерованы по порядку и каждый процессор, кроме первого и последнего, имеет линии связи только с двумя соседними процессорами.
Кольцо - данная топология получается из линейки процессоров соединением первого и последнего процессоров линейки
Звезда - система, в которой все процессоры имеют линии связи с некоторым управляющим процессором.
Решетка - система, в которой граф линий связи образует прямоугольную сетку (обычно двух- или трехмерную).
Полный граф - система, в которой между любой парой процессоров существует прямая линия связи.

Слайд 23
Гиперкуб - данная топология представляет собой частный случай структуры решетки, когда

по каждой размерности сетки имеется только два процессора (т.е. гиперкуб содержит 2N процессоров при размерности N ). Характеризуется следующим рядом отличительных признаков:
- два процессора имеют соединение, если двоичные представления их номеров имеют только одну различающуюся позицию;
- в N -мерном гиперкубе каждый процессор связан ровно с N соседями;
- N -мерный гиперкуб может быть разделен на два ( N–1 )-мерных гиперкуба;
- кратчайший путь между двумя любыми процессорами имеет длину, совпадающую с количеством различающихся битовых значений в номерах процессоров (данная величина известна как расстояние Хэмминга ).

Слайд 24

Слайд 25Расстояние между процессорами
Архитектура кластерной системы (способ соединения процессоров друг с другом)

в большей степени определяет ее производительность, чем тип используемых в ней процессоров.

Критическим параметром, влияющим на величину производительности такой системы, является расстояние между процессорами.

Слайд 26Расстояние между процессорами.
Какое максимальное расстояние между двумя процессорами?
Соединение 16 процессоров

– плоская решетка

Слайд 27Расстояние между процессорами.
Теория показывает, что если в системе максимальное расстояние

между процессорами больше 4, то такая система не может работать эффективно.

Для получения более компактной конфигурации необходимо решить задачу о нахождении фигуры, имеющей максимальный объем при минимальной площади поверхности.

Слайд 28
Гиперкуб - данная топология представляет собой частный случай структуры решетки, когда

Слайд 29Расстояние между процессорами. Гиперкуб.
Куб – при 8-ми процессорах.
Больше восьми процессоров -

гиперкуб

Гиперкуб – схема вторая по эффективности, но самая наглядная
На картинке –
3-мерный гиперкуб

Слайд 30Архитектура с топологией "толстого дерева" (fat-tree)
Одна из самых эффективных.
Вид «сверху»
Вид «сбоку»

Слайд 31Характеристики некоторых топологий сети

Слайд 32Характеристики топологий сети
Диаметр – показатель, определяемый как максимальное расстояние между двумя

процессорами сети (под расстоянием обычно понимается величина кратчайшего пути между процессорами
Связность ( connectivity ) – показатель, характеризующий наличие разных маршрутов передачи данных между процессорами сети. Показатель может быть определен, например, как минимальное количество дуг, которое надо удалить для разделения сети передачи данных на две несвязные области.

Слайд 33Характеристики топологий сети
Ширина бинарного деления (bisection width) – показатель, определяемый как

минимальное количество дуг, которое надо удалить для разделения сети передачи данных на две несвязные области одинакового размера;
Стоимость – показатель, который может быть определен, например, как общее количество линий передачи данных в многопроцессорной вычислительной системе.

Слайд 34Языки и системы программирования
Базовые языки параллельного программирования: C, Fortran, Lisp, Erlang

и их производные (расширения, библиотеки, диалекты).

Слайд 35Языки и системы параллельного программирования
Многоядерные процессоры
Многопоточное программирование (OpenMP, средства Intel)

Видеокарты
CUDA, API

Direct Compute 5.0, OpenCL, OpenACC

Мультикопьютеры

MPI, PVM, DVM, Linda и др.

Слайд 36Технология программирования OpenMP.
OpenMP является одной из популярных технологий программирования систем с

общей памятью.
Стандарт OpenMP был разработан для языков Fortran, C и C++.

Main Thread

Child Threads

Слайд 37Система параллельного программирования PVM.
PVM (Parallel Virtual Machine) позволяет объединить набор разных

компьютеров, связанных сетью, в общую вычислительную систему, называемую параллельной виртуальной машиной.
Компьютеры сети могут быть многопроцессорными машинами любого типа.
PVM поддерживает языки Fortran, C, C++, а также имеются средства сопряжения с языками Perl, Java.

Слайд 38Технология MPI
вычислительные системы с распределённой памятью

Программа
Процессор
Процессор
Процессор
копия
копия
копия

Слайд 39Технология программирования CUDA.
CUDA (Compute Unified Device Architecture) - программно аппаратное решение,

позволяющее использовать видеопроцессоры для вычислений общего назначения.

Скачать презентацию

Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВС презентация

Содержание

Слайд 1Лекция 2. Архитектура параллельных вычислительных систем. Часть 2. Классификация ПВСОсновы параллельного

Слайд 2Классификация вычислительных систем…Систематика Флинна (Flynn) классификация по способам взаимодействия последовательностей (потоков)

Слайд 3Систематика ФлиннаSISDSIMD

Слайд 4Систематика ФлиннаMISDMIMD

Слайд 5Классификация вычислительных систем…Детализация систематики Флинна… дальнейшее разделение типов многопроцессорных систем основывается

Слайд 6Классификация ПВСДетализация систематики Флинна…

Слайд 7Классификация по взаимодействию с оперативной памятьюТипы многопроцессорных систем: multiprocessors (мультипроцессоры или

Слайд 8Мультипроцессоры с единой общей памятьюМультипроцессоры с использованием единой общей памяти (shared

Слайд 9Мультипроцессоры (UMA)

Слайд 10Мультипроцессоры (UMA)Проблемы:Доступ с разных процессоров к общим данным и обеспечение, в

Слайд 11Мультипроцессоры (NUMA)C использованием физически распределенной памяти (distributed shared memory or DSM):неоднородный

Слайд 12Мультипроцессоры (NUMA)Мультипроцессоры с использованием физически распределенной памяти…

Слайд 13Мультипроцессоры (NUMA)Мультипроцессоры с использованием физически распределенной памяти:упрощаются проблемы создания мультипроцессоров (известны

Слайд 14Мультипроцессоры (NUMA)Мультипроцессоры с использованием физически распределенной памяти:упрощаются проблемы создания мультипроцессоров (известны

Слайд 15Классификация ПВСМультикомпьютеры…не обеспечивают общий доступ ко всей имеющейся в системах памяти

Слайд 16Классификация ПВС Мультикомпьютеры

Слайд 17Мультикомпьютеры Данный подход используется при построении двух важных типов многопроцессорных вычислительных

Слайд 18Мультикомпьютеры. Кластеры… Кластер - множество отдельных компьютеров, объединенных в сеть, для

Слайд 19Мультикомпьютеры. Кластеры… Преимущества:Могут быть образованы на базе уже существующих у потребителей отдельных

Слайд 20Мультикомпьютеры. Кластеры Недостатки:Организация взаимодействия -> к значительным временным задержкам, Дополнительные ограничения на

Слайд 21Мультикомпьютеры. MPP-системыMPP – Massive Parallel Processing или массивно-параллельные системы.Система строится из

Слайд 22Топологии сети передачи данных в ПВСЛинейка - система, в которой все

Слайд 23Гиперкуб - данная топология представляет собой частный случай структуры решетки, когда

Слайд 24

Слайд 25Расстояние между процессорамиАрхитектура кластерной системы (способ соединения процессоров друг с другом)

Слайд 26Расстояние между процессорами. Какое максимальное расстояние между двумя процессорами?Соединение 16 процессоров

Слайд 27Расстояние между процессорами. Теория показывает, что если в системе максимальное расстояние

Слайд 28Гиперкуб - данная топология представляет собой частный случай структуры решетки, когда

Слайд 29Расстояние между процессорами. Гиперкуб.Куб – при 8-ми процессорах.Больше восьми процессоров -

Слайд 30Архитектура с топологией "толстого дерева" (fat-tree)Одна из самых эффективных.Вид «сверху»Вид «сбоку»