Введение презентация

Содержание

1. Введение
2. Москва, 2008 г. Параллельное программирование с OpenMP:
3. В течение нескольких десятилетий развитие ЭВМ сопровождалось
4. Время Тенденции развития современных процессоров В П
5. Тенденции развития современных процессоров Суперкомпьютер СКИФ МГУ
6. Тенденции развития современных процессоров Quad-Core AMD Opteron
7. Тенденции развития современных процессоров Intel Core i7
8. Тенденции развития современных процессоров SUN UltraSPARC T2
9. из 32 Тенденции развития современных процессоров
10. Существующие подходы для создания параллельных программ Автоматическое
11. Вычисление числа π Москва, 2008 г.
12. из 32 #include int main
13. Автоматическое распараллеливание Polaris, CAPO, WPP, SUIF, VAST/Parallel,
14. из 32 #include "mpi.h" #include
15. из 32 for (i = myid + 1; i
16. из 32 #include #include
17. из 32 void Pi (void *arg)
18. из 32 #include int main
19. Достоинства использования OpenMP вместо MPI для многоядерных
20. Достоинства использования OpenMP вместо MPI для многоядерных
21. Достоинства использования OpenMP вместо MPI для многоядерных
22. Достоинства использования OpenMP вместо MPI для многоядерных
23. История OpenMP OpenMP Fortran 1.1 OpenMP C/C++
24. OpenMP Architecture Review Board AMD Cray Fujitsu
25. Компиляторы, поддеживающие OpenMP OpenMP 3.0: Intel 11.0:
26. Обзор основных возможностей OpenMP omp_set_lock(lck) #pragma omp
27. из 32 Литература… http://www.openmp.org http://www.compunity.org
28. из 32 Литература… Гергель В.П.
29. из 32 Литература… Учебные курсы
30. из 32 Вопросы? Вопросы?
31. из 32 OpenMP – модель параллелизма
32. из 32 Бахтин В.А., кандидат

Слайд 1Введение
Учебный курс
Параллельное программирование с OpenMP
Бахтин В.А., кандидат физ.-мат. наук,
заведующий сектором,
Институт

прикладной математики им. М.В.Келдыша РАН

Слайд 2Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.
из

Содержание

Тенденции развития современных процессоров
Существующие подходы для создания параллельных программ
Основные возможности OpenMP
Литература

Слайд 3В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые

1.5-2 года. Это обеспечивалось и повышением тактовой частоты и совершенствованием архитектуры (параллельное и конвейерное выполнение команд).
Узким местом стала оперативная память. Знаменитый закон Мура, так хорошо работающий для процессоров, совершенно не применим для памяти, где скорости доступа удваиваются в лучшем случае каждые 6 лет.
Совершенствовались системы кэш-памяти, увеличивался объем, усложнялись алгоритмы ее использования.
Для процессора Intel Itanium:
Latency to L1: 1-2 cycles
Latency to L2: 5 - 7 cycles
Latency to L3: 12 - 21 cycles
Latency to memory: 180 – 225 cycles
Важным параметром становится - GUPS (Giga Updates Per Second)

Тенденции развития современных процессоров

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 4Время
Тенденции развития современных процессоров
В
П
В
П
В
П
В
П
В
П
В
П

Поток
Поток
Время
В
П
В
П
В
П
Поток 1
В
П
В
П
В
П
В
П
В
П
В
П
В
П
В
П
В
П
Поток 2
Поток 3
Поток 4
В
- вычисления
П
- доступ к

памяти

Chip
MultiThreading

увеличили производительность процессора в 2 раза

Поток или нить (по-английски “thread”) – это легковесный процесс, имеющий с другими потоками общие ресурсы, включая общую оперативную память.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 5Тенденции развития современных процессоров
Суперкомпьютер СКИФ МГУ «Чебышев»
Пиковая производительность - 60 TFlop/s

Число процессоров/ядер в системе - 1250 / 5000
Производительность на Linpack - 47.04 TFlop/s (78.4% от пиковой)
Номинальное энергопотребление компьютера - 330 кВт
Энергопотребление комплекса - 720 кВт

Важным параметром становится – Power Efficency (Megaflops/watt)

Как добиться максимальной производительности на Ватт => Chip MultiProcessing, многоядерность.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 6Тенденции развития современных процессоров
Quad-Core AMD Opteron
4 ядра
встроенный контроллер памяти (2

канала памяти DDR2 800 МГц )
3 канала «точка-точка» с использованием HyperTransort

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 7Тенденции развития современных процессоров
Intel Core i7 (архитектура Nehalem )
4 ядра
8 потоков

с технологией Intel Hyper-Threading
8 МБ кэш-памяти Intel Smart Cache
встроенный контроллер памяти (3 канала памяти DDR3 1066 МГц )
технология Intel QuickPath Interconnect

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 8Тенденции развития современных процессоров
SUN UltraSPARC T2 Processor (Niagara 2)
8 ядер
64 потоков
4

контроллера памяти
потребляемая мощность – 60-123Ватт
встроенный котроллер 2x10 Gigabit Ethernet

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 9 из 32
Тенденции развития современных процессоров
Темпы уменьшения латентности памяти гораздо ниже

темпов ускорения процессоров + прогресс в технологии изготовления кристаллов => CMT (Chip MultiThreading)
Опережающий рост потребления энергии при росте тактовой частоты + прогресс в технологии изготовления кристаллов => CMP (Chip MultiProcessing, многоядерность)
И то и другое требует более глубокого распараллеливания для эффективного использования аппаратуры

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 10Существующие подходы для создания параллельных программ
Автоматическое распараллеливание
Библиотеки нитей
Win32 API
POSIX
Библиотеки передачи сообщений
MPI

OpenMP

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 11Вычисление числа π

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

В.А.

из 32

Слайд 12 из 32
#include
int main ()
{
int n =100000, i;

double pi, h, sum, x;
h = 1.0 / (double) n;
sum = 0.0;
for (i = 1; i <= n; i ++)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
pi = h * sum;
printf("pi is approximately %.16f”, pi);
return 0;
}

Вычисление числа π. Последовательная программа.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 13Автоматическое распараллеливание
Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР

icc -parallel pi.c
pi.c(8): (col. 5) remark: LOOP WAS AUTO-PARALLELIZED.
pi.c(8): (col. 5) remark: LOOP WAS VECTORIZED.
pi.c(8): (col. 5) remark: LOOP WAS VECTORIZED.

В общем случае, автоматическое распараллеливание затруднено:
косвенная индексация (A[B[i]]);
указатели (ассоциация по памяти);
сложный межпроцедурный анализ;
циклы с зависимостью по данным, как правило не распараллеливаются.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 14 из 32
#include "mpi.h"
#include
int main (int argc, char *argv[])
{

int n =100000, myid, numprocs, i;
double mypi, pi, h, sum, x;
MPI_Init(&argc,&argv);
MPI_Comm_size(MPI_COMM_WORLD,&numprocs);
MPI_Comm_rank(MPI_COMM_WORLD,&myid);
MPI_Bcast(&n, 1, MPI_INT, 0, MPI_COMM_WORLD);
h = 1.0 / (double) n;
sum = 0.0;

Вычисление числа π с использованием MPI

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 15 из 32
for (i = myid + 1;

i <= n; i += numprocs)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
mypi = h * sum;
MPI_Reduce(&mypi, &pi, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);
if (myid == 0) printf("pi is approximately %.16f”, pi);
MPI_Finalize();
return 0;
}

Вычисление числа π с использованием MPI

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 16 из 32
#include
#include
#define NUM_THREADS 2
CRITICAL_SECTION hCriticalSection;
double pi = 0.0;
int

n =100000;
void main ()
{
int i, threadArg[NUM_THREADS];
DWORD threadID;
HANDLE threadHandles[NUM_THREADS];
for(i=0; i InitializeCriticalSection(&hCriticalSection);
for (i=0; i CreateThread(0,0,(LPTHREAD_START_ROUTINE) Pi,&threadArg[i], 0, &threadID);
WaitForMultipleObjects(NUM_THREADS, threadHandles, TRUE,INFINITE);
printf("pi is approximately %.16f”, pi);
}

Вычисление числа π с использованием Win32 API

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

$из 32#include #include #define NUM_THREADS 2CRITICAL_SECTION hCriticalSection;double pi = 0.0;int n =100000;void main (){$

Слайд 17 из 32
void Pi (void *arg)
{
int i, start;

double h, sum, x;
h = 1.0 / (double) n;
sum = 0.0;
start = *(int *) arg;
for (i=start; i<= n; i=i+NUM_THREADS)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
EnterCriticalSection(&hCriticalSection);
pi += h * sum;
LeaveCriticalSection(&hCriticalSection);
}

Вычисление числа π с использованием Win32 API

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 18 из 32
#include
int main ()
{
int n =100000, i;

double pi, h, sum, x;
h = 1.0 / (double) n;
sum = 0.0;
#pragma omp parallel for reduction(+:sum) private(x)
for (i = 1; i <= n; i ++)
{
x = h * ((double)i - 0.5);
sum += (4.0 / (1.0 + x*x));
}
pi = h * sum;
printf("pi is approximately %.16f”, pi);
return 0;
}

Вычисление числа π c использованием OpenMP

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

Слайд 19Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Возможность инкрементального распараллеливания
Упрощение программирования и

эффективность на нерегулярных вычислениях, проводимых над общими данными
Ликвидация дублирования данных в памяти, свойственного MPI-программам
Объем памяти пропорционален быстродействию процессора. В последние годы увеличение производительности процессора достигается удвоением числа ядер, при этом частота каждого ядра снижается. Наблюдается тенденция к сокращению объема оперативной памяти, приходящейся на одно ядро. Присущая OpenMP экономия памяти становится очень важна.
Наличие локальных и/или разделяемых ядрами КЭШей будут учитываться при оптимизации OpenMP-программ компиляторами, что не могут делать компиляторы с последовательных языков для MPI-процессов.

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 20Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Процессоры Intel® Xeon® серии 5000
Процессоры

Intel® Xeon® серии 7000

Процессоры AMD Opteron

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 21Достоинства использования OpenMP вместо MPI для многоядерных процессоров
#define Max(a,b) ((a)>(b)?(a):(b))
#define L 8
#define

ITMAX 20
int i,j,it,k;
double eps, MAXEPS = 0.5;
double A[L][L], B[L][L];
int main(int an, char **as)
{
for (it=1; it < ITMAX; it++) {
eps= 0.;
for(i=1; j<=L-2; j++)
for(j=1; j<=L-2; j++) {eps = Max(fabs(B[i][j]-A[i][j]),eps); A[i][j] = B[i][j]; }
for(i=1; j<=L-2; j++)
for(j=1; j<=L-2; j++) B[i][j] = (A[i-1][j]+A[i+1][j]+A[i][j-1]+A[i][j+1])/4.;
printf( "it=%4i eps=%f\n", it,eps);
if (eps < MAXEPS) break;
}
}

Москва, 2008 г.

Параллельное программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 22Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Москва, 2008 г.
Параллельное программирование с

OpenMP: Введение © Бахтин В.А.

Для получения программы, способной работать на кластере, необходимо распределить данные и вычисления между процессорами.
После распределения данных требуется организовать межпроцессорные взаимодействия.
В данном случае - для доступа к удаленным данным используются “теневые” грани, которые являются источником дублирования данных.

из 32

Слайд 23История OpenMP
OpenMP Fortran 1.1
OpenMP C/C++ 1.0
OpenMP
Fortran 2.0
OpenMP
C/C++ 2.0
1998
2000
1999
2002
OpenMP Fortran 1.0
1997
OpenMP
F/C/C++ 2.5
2005
OpenMP
F/C/C++ 3.0
2008
Москва, 2008 г.
Параллельное

программирование с OpenMP: Введение © Бахтин В.А.

из 32

Слайд 24OpenMP Architecture Review Board
AMD
Cray
Fujitsu
HP
IBM
Intel
NEC
The Portland Group, Inc.
SGI
Sun
Microsoft
ASC/LLNL
cOMPunity
EPCC
NASA
RWTH Aachen University

Москва,

2008 г.

из 32

Слайд 25Компиляторы, поддеживающие OpenMP
OpenMP 3.0:
Intel 11.0: Linux, Windows and MacOS
Sun Studio Express

11/08: Linux and Solaris
PGI 8.0: Linux and Windows
IBM 10.1: Linux and AIX

Предыдущие версии OpenMP:
GNU gcc (4.3.2)
Absoft Pro FortranMP
Lahey/Fujitsu Fortran 95
PathScale
HP
Microsoft Visual Studio 2008 C++

Москва, 2008 г.

из 32

Слайд 26Обзор основных возможностей OpenMP
omp_set_lock(lck)
#pragma omp parallel for private(a, b)
#pragma omp critical
C$OMP

PARALLEL DO SHARED(A,B,C)

C$OMP PARALLEL REDUCTION (+: A, B)

CALL OMP_INIT_LOCK (LCK)

CALL OMP_TEST_LOCK(LCK)

SETENV OMP_SCHEDULE “STATIC,4”

CALL CALL OMP_SET_NUM_THREADS(10)

C$OMP DO LASTPRIVATE(XX)

C$OMP ORDERED

C$OMP SINGLE PRIVATE(X)

C$OMP SECTIONS

C$OMP MASTER

C$OMP ATOMIC

C$OMP FLUSH

C$OMP PARALLEL DO ORDERED PRIVATE (A, B, C)

C$OMP THREADPRIVATE(/ABC/)

C$OMP PARALLEL COPYIN(/blk/)

nthrds = OMP_GET_NUM_PROCS()

C$OMP BARRIER

OpenMP: API для написания многонитевых приложений
Множество директив компилятора, набор функции библиотеки системы поддержки, переменные окружения
Облегчает создание многонитиевых программ на Фортране, C и C++
Обобщение опыта создания параллельных программ для SMP и DSM систем за последние 20 лет

Москва, 2008 г.

из 32

Слайд 27 из 32
Литература…
http://www.openmp.org
http://www.compunity.org
http://www.parallel.ru/tech/tech_dev/openmp.html

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение ©

Бахтин В.А.

Слайд 28 из 32
Литература…
Гергель В.П. Теория и практика параллельных вычислений. -

М.: Интернет-Университет, БИНОМ. Лаборатория знаний, 2007.
Богачев К.Ю. Основы параллельного программирования. - М.: БИНОМ. Лаборатория знаний, 2003.
Воеводин В.В., Воеводин Вл.В. Параллельные вычисления. - СПб.: БХВ-Петербург, 2002.
Немнюгин С., Стесик О. Параллельное программирование для многопроцессорных вычислительных систем — СПб.: БХВ-Петербург, 2002.

Москва, 2008 г.

Слайд 29 из 32
Литература…
Учебные курсы Интернет Университета Информационных технологий
Гергель В.П. Теория

и практика параллельных вычислений. — http://www.intuit.ru/department/calculate/paralltp/
Левин М.П. Параллельное программирование с OpenMP
http://www.intuit.ru/department/se/openmp/
Дополнительные учебные курсы:
Богданов А.В. и др. Архитектуры и топологии многопроцессорных вычислительных систем. — http://www.intuit.ru/department/hardware/atmcs/
Барский А.Б. Архитектура параллельных вычислительных систем. — http://www.intuit.ru/department/hardware/paralltech/
Барский А.Б. Параллельное программирование. — http://www.intuit.ru/department/se/parallprog/

Москва, 2008 г.

В.А.

Слайд 31 из 32
OpenMP – модель параллелизма по управлению
Следующая тема
Москва, 2008

г.

Слайд 32 из 32
Бахтин В.А., кандидат физ.-мат. наук, заведующий сектором, Институт

прикладной математики им. М.В.Келдыша РАН
bakhtin@keldysh.ru

Контакты

Москва, 2008 г.

Скачать презентацию

Введение презентация

Содержание

Слайд 1Введение
Учебный курс
Параллельное программирование с OpenMP
Бахтин В.А., кандидат физ.-мат. наук,
заведующий сектором,
Институт

Слайд 2Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.
из

Слайд 3В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые

Слайд 5Тенденции развития современных процессоров
Суперкомпьютер СКИФ МГУ «Чебышев»
Пиковая производительность - 60 TFlop/s

Слайд 6Тенденции развития современных процессоров
Quad-Core AMD Opteron
4 ядра
встроенный контроллер памяти (2

Слайд 7Тенденции развития современных процессоров
Intel Core i7 (архитектура Nehalem )
4 ядра
8 потоков

Слайд 8Тенденции развития современных процессоров
SUN UltraSPARC T2 Processor (Niagara 2)
8 ядер
64 потоков
4

Слайд 9 из 32
Тенденции развития современных процессоров
Темпы уменьшения латентности памяти гораздо ниже

Слайд 10Существующие подходы для создания параллельных программ
Автоматическое распараллеливание
Библиотеки нитей
Win32 API
POSIX
Библиотеки передачи сообщений
MPI

Слайд 11Вычисление числа π

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 12 из 32
#include
int main ()
{
int n =100000, i;

Слайд 13Автоматическое распараллеливание
Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР

Слайд 14 из 32
#include "mpi.h"
#include
int main (int argc, char *argv[])
{

Слайд 15 из 32
for (i = myid + 1;

Слайд 16 из 32
#include
#include
#define NUM_THREADS 2
CRITICAL_SECTION hCriticalSection;
double pi = 0.0;
int

Слайд 17 из 32
void Pi (void *arg)
{
int i, start;

Слайд 18 из 32
#include
int main ()
{
int n =100000, i;

Слайд 19Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Возможность инкрементального распараллеливания
Упрощение программирования и

Слайд 20Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Процессоры Intel® Xeon® серии 5000
Процессоры

Слайд 21Достоинства использования OpenMP вместо MPI для многоядерных процессоров
#define Max(a,b) ((a)>(b)?(a):(b))
#define L 8
#define

Слайд 22Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Москва, 2008 г.
Параллельное программирование с

Слайд 23История OpenMP
OpenMP Fortran 1.1
OpenMP C/C++ 1.0
OpenMP
Fortran 2.0
OpenMP
C/C++ 2.0
1998
2000
1999
2002
OpenMP Fortran 1.0
1997
OpenMP
F/C/C++ 2.5
2005
OpenMP
F/C/C++ 3.0
2008
Москва, 2008 г.
Параллельное

Слайд 24OpenMP Architecture Review Board
AMD
Cray
Fujitsu
HP
IBM
Intel
NEC
The Portland Group, Inc.
SGI
Sun
Microsoft
ASC/LLNL
cOMPunity
EPCC
NASA
RWTH Aachen University

Москва,

Слайд 25Компиляторы, поддеживающие OpenMP
OpenMP 3.0:
Intel 11.0: Linux, Windows and MacOS
Sun Studio Express

Слайд 26Обзор основных возможностей OpenMP
omp_set_lock(lck)
#pragma omp parallel for private(a, b)
#pragma omp critical
C$OMP

Слайд 27 из 32
Литература…
http://www.openmp.org
http://www.compunity.org
http://www.parallel.ru/tech/tech_dev/openmp.html

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение ©

Слайд 28 из 32
Литература…
Гергель В.П. Теория и практика параллельных вычислений. -

Слайд 29 из 32
Литература…
Учебные курсы Интернет Университета Информационных технологий
Гергель В.П. Теория

Слайд 30 из 32
Вопросы?

Вопросы?
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 31 из 32
OpenMP – модель параллелизма по управлению
Следующая тема
Москва, 2008

Слайд 32 из 32
Бахтин В.А., кандидат физ.-мат. наук, заведующий сектором, Институт

Обратная связь

Что такое ThePresentation.ru?

Введение презентация

Содержание

Слайд 1ВведениеУчебный курсПараллельное программирование с OpenMP Бахтин В.А., кандидат физ.-мат. наук,заведующий сектором,Институт

Слайд 2Москва, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин В.А. из

Слайд 3В течение нескольких десятилетий развитие ЭВМ сопровождалось удвоением их быстродействия каждые

Слайд 4ВремяТенденции развития современных процессоровВПВПВПВПВПВП ПотокПотокВремяВПВПВППоток 1ВПВПВПВПВПВПВПВПВППоток 2Поток 3Поток 4В- вычисленияП- доступ к

Слайд 5Тенденции развития современных процессоровСуперкомпьютер СКИФ МГУ «Чебышев»Пиковая производительность - 60 TFlop/s

Слайд 6Тенденции развития современных процессоровQuad-Core AMD Opteron 4 ядравстроенный контроллер памяти (2

Слайд 7Тенденции развития современных процессоровIntel Core i7 (архитектура Nehalem )4 ядра8 потоков

Слайд 8Тенденции развития современных процессоровSUN UltraSPARC T2 Processor (Niagara 2)8 ядер64 потоков4

Слайд 9 из 32Тенденции развития современных процессоровТемпы уменьшения латентности памяти гораздо ниже

Слайд 10Существующие подходы для создания параллельных программАвтоматическое распараллеливаниеБиблиотеки нитейWin32 APIPOSIXБиблиотеки передачи сообщенийMPI

Слайд 11Вычисление числа πМосква, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 12 из 32#include int main (){ int n =100000, i;

Слайд 13Автоматическое распараллеливаниеPolaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР

Слайд 14 из 32#include "mpi.h"#include int main (int argc, char *argv[]){

Слайд 15 из 32 for (i = myid + 1;

Слайд 16 из 32#include #include #define NUM_THREADS 2CRITICAL_SECTION hCriticalSection;double pi = 0.0;int

Слайд 17 из 32void Pi (void *arg){ int i, start;

Слайд 18 из 32#include int main (){ int n =100000, i;

Слайд 19Достоинства использования OpenMP вместо MPI для многоядерных процессоровВозможность инкрементального распараллеливанияУпрощение программирования и

Слайд 20Достоинства использования OpenMP вместо MPI для многоядерных процессоровПроцессоры Intel® Xeon® серии 5000Процессоры

Слайд 21Достоинства использования OpenMP вместо MPI для многоядерных процессоров#define Max(a,b) ((a)>(b)?(a):(b))#define L 8#define

Слайд 22Достоинства использования OpenMP вместо MPI для многоядерных процессоровМосква, 2008 г.Параллельное программирование с

Слайд 23История OpenMPOpenMP Fortran 1.1OpenMP C/C++ 1.0OpenMPFortran 2.0OpenMPC/C++ 2.01998200019992002OpenMP Fortran 1.01997OpenMPF/C/C++ 2.52005OpenMPF/C/C++ 3.02008Москва, 2008 г.Параллельное

Слайд 24OpenMP Architecture Review BoardAMDCrayFujitsuHPIBMIntelNECThe Portland Group, Inc. SGISunMicrosoft ASC/LLNLcOMPunityEPCCNASARWTH Aachen UniversityМосква,

Слайд 25Компиляторы, поддеживающие OpenMPOpenMP 3.0:Intel 11.0: Linux, Windows and MacOSSun Studio Express

Слайд 26Обзор основных возможностей OpenMPomp_set_lock(lck)#pragma omp parallel for private(a, b)#pragma omp criticalC$OMP

Слайд 27 из 32Литература… http://www.openmp.orghttp://www.compunity.orghttp://www.parallel.ru/tech/tech_dev/openmp.htmlМосква, 2008 г.Параллельное программирование с OpenMP: Введение ©

Слайд 28 из 32Литература… Гергель В.П. Теория и практика параллельных вычислений. -

Слайд 29 из 32Литература… Учебные курсы Интернет Университета Информационных технологийГергель В.П. Теория

Слайд 30 из 32Вопросы?Вопросы?Москва, 2008 г.Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 31 из 32OpenMP – модель параллелизма по управлению Следующая темаМосква, 2008

Слайд 32 из 32 Бахтин В.А., кандидат физ.-мат. наук, заведующий сектором, Институт

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1Введение
Учебный курс
Параллельное программирование с OpenMP
Бахтин В.А., кандидат физ.-мат. наук,
заведующий сектором,
Институт

Слайд 2Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин В.А.
из

Слайд 5Тенденции развития современных процессоров
Суперкомпьютер СКИФ МГУ «Чебышев»
Пиковая производительность - 60 TFlop/s

Слайд 6Тенденции развития современных процессоров
Quad-Core AMD Opteron
4 ядра
встроенный контроллер памяти (2

Слайд 7Тенденции развития современных процессоров
Intel Core i7 (архитектура Nehalem )
4 ядра
8 потоков

Слайд 8Тенденции развития современных процессоров
SUN UltraSPARC T2 Processor (Niagara 2)
8 ядер
64 потоков
4

Слайд 9 из 32
Тенденции развития современных процессоров
Темпы уменьшения латентности памяти гораздо ниже

Слайд 10Существующие подходы для создания параллельных программ
Автоматическое распараллеливание
Библиотеки нитей
Win32 API
POSIX
Библиотеки передачи сообщений
MPI

Слайд 11Вычисление числа π

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 12 из 32
#include
int main ()
{
int n =100000, i;

Слайд 13Автоматическое распараллеливание
Polaris, CAPO, WPP, SUIF, VAST/Parallel, OSCAR, Intel/OpenMP, ParaWise, ОРС, САПФОР

Слайд 14 из 32
#include "mpi.h"
#include
int main (int argc, char *argv[])
{

Слайд 15 из 32
for (i = myid + 1;

Слайд 16 из 32
#include
#include
#define NUM_THREADS 2
CRITICAL_SECTION hCriticalSection;
double pi = 0.0;
int

Слайд 17 из 32
void Pi (void *arg)
{
int i, start;

Слайд 18 из 32
#include
int main ()
{
int n =100000, i;

Слайд 19Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Возможность инкрементального распараллеливания
Упрощение программирования и

Слайд 20Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Процессоры Intel® Xeon® серии 5000
Процессоры

Слайд 21Достоинства использования OpenMP вместо MPI для многоядерных процессоров
#define Max(a,b) ((a)>(b)?(a):(b))
#define L 8
#define

Слайд 22Достоинства использования OpenMP вместо MPI для многоядерных процессоров
Москва, 2008 г.
Параллельное программирование с

Слайд 23История OpenMP
OpenMP Fortran 1.1
OpenMP C/C++ 1.0
OpenMP
Fortran 2.0
OpenMP
C/C++ 2.0
1998
2000
1999
2002
OpenMP Fortran 1.0
1997
OpenMP
F/C/C++ 2.5
2005
OpenMP
F/C/C++ 3.0
2008
Москва, 2008 г.
Параллельное

Слайд 24OpenMP Architecture Review Board
AMD
Cray
Fujitsu
HP
IBM
Intel
NEC
The Portland Group, Inc.
SGI
Sun
Microsoft
ASC/LLNL
cOMPunity
EPCC
NASA
RWTH Aachen University

Москва,

Слайд 25Компиляторы, поддеживающие OpenMP
OpenMP 3.0:
Intel 11.0: Linux, Windows and MacOS
Sun Studio Express

Слайд 26Обзор основных возможностей OpenMP
omp_set_lock(lck)
#pragma omp parallel for private(a, b)
#pragma omp critical
C$OMP

Слайд 27 из 32
Литература…
http://www.openmp.org
http://www.compunity.org
http://www.parallel.ru/tech/tech_dev/openmp.html

Москва, 2008 г.
Параллельное программирование с OpenMP: Введение ©

Слайд 28 из 32
Литература…
Гергель В.П. Теория и практика параллельных вычислений. -

Слайд 29 из 32
Литература…
Учебные курсы Интернет Университета Информационных технологий
Гергель В.П. Теория

Слайд 30 из 32
Вопросы?

Вопросы?
Москва, 2008 г.
Параллельное программирование с OpenMP: Введение © Бахтин

Слайд 31 из 32
OpenMP – модель параллелизма по управлению
Следующая тема
Москва, 2008

Слайд 32 из 32
Бахтин В.А., кандидат физ.-мат. наук, заведующий сектором, Институт