Команды mmx/xmm презентация

Содержание

1. Команды mmx/xmm
2. К теме: Технология MMX. Технология SSE. Регистры
3. Основы MMX-технологии MMX (Multimedia Extensions - мультимедийное
4. Основы MMX-технологии SIMD (Single Instruction, Multiple Data)
5. Синтаксис MMX-команд instruction dest, src instruction - имя
6. MMX-расширение Численные регистры 8 (mm0..mm7) * 8 байт mm0
7. MMX-расширение mm0 Типы данных: B - упакованные
8. MMX-регистры Физически совмещены со стеком регистров математического
9. MMX-регистры Такая реализация позволила избежать проблем совместимости
10. MMX-регистры С другой стороны, переход между режимами
11. SSE-команды SSE (англ. Streaming SIMD Extensions). Для
12. Задание Создать консольное приложение, которое выполняет вычисления
13. Пример Найти скалярное произведение векторов a и
14. Пример Найти скалярное произведение векторов a и
15. Пример Найти скалярное произведение векторов a и
16. Пример Найти скалярное произведение векторов a и
17. Пример Найти скалярное произведение векторов a и
18. Пример Найти скалярное произведение векторов a и
19. Пример Найти скалярное произведение векторов a и
20. Пример Найти скалярное произведение векторов a и
21. Пример Найти скалярное произведение векторов a и

Слайд 1КОМАНДЫ MMX/XMM
Лабораторная работа №2
АРХИТЕКТУРА ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВ
Подготовила Остроухова С.А.

Слайд 2К теме: Технология MMX. Технология SSE. Регистры MMX/XMM, типы данных и команды

MMX/ХММ.

ЦЕЛЬ РАБОТЫ
Изучить расширение системы команд MMX процессоров Intel.

Продолжительность работы - 4 часа.

Слайд 3Основы MMX-технологии
MMX (Multimedia Extensions - мультимедийное расширение) - коммерческое название дополнительного

набора инструкций, выполняющих характерные для процессов кодирования и декодирования потоковых аудио/видео данных действия за одну машинную инструкцию.

Разработан в лаборатории Intel, в первой половине 1990-х.

Слайд 4Основы MMX-технологии
SIMD
(Single Instruction, Multiple Data)
принцип компьютерных вычислений, позволяющий обеспечить параллелизм на

уровне данных.

Основная цель – достижение более высокой производительности мультимедийных приложений и систем обработки и передачи данных.

Слайд 5Синтаксис MMX-команд
instruction dest, src
instruction - имя команды,
dest - выходной операнд,
src - входной операнд.
+суффикс,

который определяет тип данных: B, W, D, Q. Если в суффиксе есть две из этих букв, первая соответствует входному операнду, а вторая - выходному.

Слайд 6MMX-расширение
Численные регистры
8 (mm0..mm7) * 8 байт
mm0

Слайд 7MMX-расширение
mm0
Типы данных:
B - упакованные байты (packed byte);
W - упакованные слова (16-разрядные)

(packed word);
D - упакованные двойные слова (packed double word);
Q - 64-разрядные слова (quadword).

Слайд 8MMX-регистры
Физически совмещены со стеком регистров математического сопроцессора.
При выполнении любой из MMX-команд

происходит установка «режима MMX», стек регистров сопроцессора рассматривается как набор MMX-регистров.
Завершает работу в режиме MMX команда EMMS (End MultiMedia State).

Слайд 9MMX-регистры
Такая реализация позволила избежать проблем совместимости с переключением контекста, поскольку число

регистров процессора, и, следовательно, код, выполняющий их сохранение и восстановление, не изменились.

Слайд 10MMX-регистры
С другой стороны, переход между режимами занимает значительное время.
Поэтому при необходимости

работы в обоих режимах для достижения наилучших результатов рекомендуется группировать эти команды отдельно друг от друга.

Слайд 11SSE-команды
SSE (англ. Streaming SIMD Extensions).
Для преодоления проблемы одновременного использования c сопроцессором.
SSE

включает в архитектуру процессора 8 128-битных регистров (xmm0 до xmm7), каждый из которых трактуется как 4 последовательных значения с плавающей точкой одинарной точности.

Слайд 12Задание
Создать консольное приложение, которое выполняет вычисления (в соответствии с вариантом) :
1)

на языке Си,
2) на ассемблере, без команд MMX,
3) с использованием команд MMX.
После вычислений должны быть выведены время выполнения и результат для каждого случая.
Значения элементов матриц генерируются приложением (не вводятся с клавиатуры). Вычисления производятся много (1 млн) раз. Размер матриц (векторов) кратен количеству элементов в регистре ММХ.

Слайд 13Пример Найти скалярное произведение векторов a и b

int i;
short a_vect[16], b_vect[16];
short cnt

= 16;
int res = 0, res1 = 0;
double r;
int j, temp, sum = 0;

...//инициализация переменных

Слайд 14Пример Найти скалярное произведение векторов a и b
Си:

for(j = 0; j

16; j++)
{
temp = a_vect[j] * b_vect[j];
sum+=temp;
}

Слайд 15Пример Найти скалярное произведение векторов a и b
Ассемблер без MMX:
cnt = 16;
_asm
{
pusha

; сохранить в стек все регистры
xor esi, esi
xor ecx, ecx
loop1:
mov ax, a_vect[esi] ; чтение из памяти
mov bx, b_vect[esi]

imul ax, bx
add cx, ax

add esi, 2 ; short → шаг по 2 байта
sub cnt, 1 ; по 1 числу за итерацию
jnz loop1

mov res1, ecx ; сохранить результат
popa ; восстановить из стека сохранённые регистры
}

$Пример Найти скалярное произведение векторов a и bАссемблер без MMX:cnt = 16;_asm{ pusha ; сохранить в$

Слайд 16Пример Найти скалярное произведение векторов a и b
loop1:
mov ax, a_vect[esi]

; чтение из памяти
mov bx, b_vect[esi]

imul ax, bx
add cx, ax

add esi, 2 ; short → шаг по 2 байта
sub cnt, 1 ; по 1 числу за итерацию
jnz loop1

mov res1, ecx ; сохранить результат

Слайд 17Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:
cnt = 16;
_asm
{
pusha

; сохранить в стек все регистры
xor esi, esi
pxor MM7, MM7
loop1:
movq MM0, a_vect[esi] ; чтение из памяти
movq MM1, b_vect[esi]

pmaddwd MM0, MM1
paddd MM7, MM0
add esi, 8
sub cnt, 4
jnz loop1

movq MM0, MM7
psrlq MM7, 32
paddd MM7, MM0
movd res, MM7
emms
popa
}

$Пример Найти скалярное произведение векторов a и bАссемблер с MMX:cnt = 16;_asm{ pusha ; сохранить в$

Слайд 18Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

pusha ;

сохранить в стек все регистры
xor esi, esi
pxor MM7, MM7

;MM7 – накопитель произведений координат

Слайд 19Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

; чтение из памяти
movq MM1, b_vect[esi]

pmaddwd MM0, MM1

Слайд 20Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

; чтение из памяти
movq MM1, b_vect[esi]

pmaddwd MM0, MM1
paddd MM7, MM0 ;накопление в ММ7
add esi, 8 ; short → шаг по 2 байта * 4
sub cnt, 4 ; по 4 элемента за операцию
jnz loop1

Слайд 21Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

!!! В ММ7

сумма разбита на 2 части

movq MM0, MM7 ;для сложения
psrlq MM7, 32 ;обеих частей
paddd MM7, MM0 ;суммы
movd res, MM7 ; сохранить результат
emms ; вернуть режим сопроцессора
popa ; восстановить регистры

Скачать презентацию

Команды mmx/xmm презентация

Содержание

Слайд 1КОМАНДЫ MMX/XMM
Лабораторная работа №2
АРХИТЕКТУРА ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВ
Подготовила Остроухова С.А.

Слайд 2К теме: Технология MMX. Технология SSE. Регистры MMX/XMM, типы данных и команды

Слайд 3Основы MMX-технологии
MMX (Multimedia Extensions - мультимедийное расширение) - коммерческое название дополнительного

Слайд 4Основы MMX-технологии
SIMD
(Single Instruction, Multiple Data)
принцип компьютерных вычислений, позволяющий обеспечить параллелизм на

Слайд 5Синтаксис MMX-команд
instruction dest, src
instruction - имя команды,
dest - выходной операнд,
src - входной операнд.
+суффикс,

Слайд 6MMX-расширение
Численные регистры
8 (mm0..mm7) * 8 байт
mm0

Слайд 7MMX-расширение
mm0
Типы данных:
B - упакованные байты (packed byte);
W - упакованные слова (16-разрядные)

Слайд 8MMX-регистры
Физически совмещены со стеком регистров математического сопроцессора.
При выполнении любой из MMX-команд

Слайд 9MMX-регистры
Такая реализация позволила избежать проблем совместимости с переключением контекста, поскольку число

Слайд 10MMX-регистры
С другой стороны, переход между режимами занимает значительное время.
Поэтому при необходимости

Слайд 11SSE-команды
SSE (англ. Streaming SIMD Extensions).
Для преодоления проблемы одновременного использования c сопроцессором.
SSE

Слайд 12Задание
Создать консольное приложение, которое выполняет вычисления (в соответствии с вариантом) :
1)

Слайд 13Пример Найти скалярное произведение векторов a и b

int i;
short a_vect[16], b_vect[16];
short cnt

Слайд 14Пример Найти скалярное произведение векторов a и b
Си:

for(j = 0; j

Слайд 15Пример Найти скалярное произведение векторов a и b
Ассемблер без MMX:
cnt = 16;
_asm
{
pusha

Слайд 16Пример Найти скалярное произведение векторов a и b
loop1:
mov ax, a_vect[esi]

Слайд 17Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:
cnt = 16;
_asm
{
pusha

Слайд 18Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

pusha ;

Слайд 19Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

Слайд 20Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

Слайд 21Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

!!! В ММ7

Обратная связь

Что такое ThePresentation.ru?

Команды mmx/xmm презентация

Содержание

Слайд 1КОМАНДЫ MMX/XMMЛабораторная работа №2АРХИТЕКТУРА ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВПодготовила Остроухова С.А.

Слайд 2К теме: Технология MMX. Технология SSE. Регистры MMX/XMM, типы данных и команды

Слайд 3Основы MMX-технологииMMX (Multimedia Extensions - мультимедийное расширение) - коммерческое название дополнительного

Слайд 4Основы MMX-технологииSIMD(Single Instruction, Multiple Data)принцип компьютерных вычислений, позволяющий обеспечить параллелизм на

Слайд 5Синтаксис MMX-командinstruction dest, srcinstruction - имя команды,dest - выходной операнд,src - входной операнд.+суффикс,

Слайд 6MMX-расширениеЧисленные регистры 8 (mm0..mm7) * 8 байтmm0

Слайд 7MMX-расширениеmm0Типы данных:B - упакованные байты (packed byte);W - упакованные слова (16-разрядные)

Слайд 8MMX-регистрыФизически совмещены со стеком регистров математического сопроцессора.При выполнении любой из MMX-команд

Слайд 9MMX-регистрыТакая реализация позволила избежать проблем совместимости с переключением контекста, поскольку число

Слайд 10MMX-регистрыС другой стороны, переход между режимами занимает значительное время.Поэтому при необходимости

Слайд 11SSE-командыSSE (англ. Streaming SIMD Extensions).Для преодоления проблемы одновременного использования c сопроцессором.SSE

Слайд 12ЗаданиеСоздать консольное приложение, которое выполняет вычисления (в соответствии с вариантом) :1)

Слайд 13Пример Найти скалярное произведение векторов a и bint i;short a_vect[16], b_vect[16];short cnt

Слайд 14Пример Найти скалярное произведение векторов a и bСи: for(j = 0; j

Слайд 15Пример Найти скалярное произведение векторов a и bАссемблер без MMX:cnt = 16;_asm{ pusha

Слайд 16Пример Найти скалярное произведение векторов a и bloop1: mov ax, a_vect[esi]

Слайд 17Пример Найти скалярное произведение векторов a и bАссемблер с MMX:cnt = 16;_asm{ pusha

Слайд 18Пример Найти скалярное произведение векторов a и bАссемблер с MMX: pusha ;

Слайд 19Пример Найти скалярное произведение векторов a и bАссемблер с MMX:loop1: movq MM0, a_vect[esi]

Слайд 20Пример Найти скалярное произведение векторов a и bАссемблер с MMX:loop1: movq MM0, a_vect[esi]

Слайд 21Пример Найти скалярное произведение векторов a и bАссемблер с MMX:!!! В ММ7

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1КОМАНДЫ MMX/XMM
Лабораторная работа №2
АРХИТЕКТУРА ПЕРСОНАЛЬНЫХ КОМПЬЮТЕРОВ
Подготовила Остроухова С.А.

Слайд 3Основы MMX-технологии
MMX (Multimedia Extensions - мультимедийное расширение) - коммерческое название дополнительного

Слайд 4Основы MMX-технологии
SIMD
(Single Instruction, Multiple Data)
принцип компьютерных вычислений, позволяющий обеспечить параллелизм на

Слайд 5Синтаксис MMX-команд
instruction dest, src
instruction - имя команды,
dest - выходной операнд,
src - входной операнд.
+суффикс,

Слайд 6MMX-расширение
Численные регистры
8 (mm0..mm7) * 8 байт
mm0

Слайд 7MMX-расширение
mm0
Типы данных:
B - упакованные байты (packed byte);
W - упакованные слова (16-разрядные)

Слайд 8MMX-регистры
Физически совмещены со стеком регистров математического сопроцессора.
При выполнении любой из MMX-команд

Слайд 9MMX-регистры
Такая реализация позволила избежать проблем совместимости с переключением контекста, поскольку число

Слайд 10MMX-регистры
С другой стороны, переход между режимами занимает значительное время.
Поэтому при необходимости

Слайд 11SSE-команды
SSE (англ. Streaming SIMD Extensions).
Для преодоления проблемы одновременного использования c сопроцессором.
SSE

Слайд 12Задание
Создать консольное приложение, которое выполняет вычисления (в соответствии с вариантом) :
1)

Слайд 13Пример Найти скалярное произведение векторов a и b

int i;
short a_vect[16], b_vect[16];
short cnt

Слайд 14Пример Найти скалярное произведение векторов a и b
Си:

for(j = 0; j

Слайд 15Пример Найти скалярное произведение векторов a и b
Ассемблер без MMX:
cnt = 16;
_asm
{
pusha

Слайд 16Пример Найти скалярное произведение векторов a и b
loop1:
mov ax, a_vect[esi]

Слайд 17Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:
cnt = 16;
_asm
{
pusha

Слайд 18Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

pusha ;

Слайд 19Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

Слайд 20Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

loop1:
movq MM0, a_vect[esi]

Слайд 21Пример Найти скалярное произведение векторов a и b
Ассемблер с MMX:

!!! В ММ7