Исследование аппаратной предвыборки данных в кэш второго уровня микропроцессора Студент: Гребенкин А.П., 816 гр. Научный руководитель: Черепанов С.А. презентация

Содержание

Слайд 1Выпускная квалификационная работа
Исследование аппаратной предвыборки данных в кэш второго уровня микропроцессора

Студент:

Гребенкин А.П., 816 гр.
Научный руководитель: Черепанов С.А.

Слайд 2Основные классы алгоритмов аппаратной предвыборки
Использующие принцип локальности данных
Применение: исходный код

с динамическими структурами данных.
Использующие корреляционный анализ адресов последовательных обращений
Применение: крупные линейные участки кода; циклы, не зависящие явно от итератора.
Использующие корреляционный анализ адресов обращений для отдельно взятых инструкций
Применение: циклы, зависящие явно от итератора.

Слайд 3Цель исследования



Разработка методологии и оценка эффективности основных методов аппаратной предвыборки данных в кэш второго уровня


Слайд 4Выделение постоянного шага (Stride)
Класс инструкций ”с постоянным шагом”:
CurrentAddress – PreviousAddress =

Stride = const != 0

Reference Prediction Table (RPT)

Диаграмма состояний записей RPT

Исследуемые методы:


Слайд 5 Исследуемые методы:


Построение и анализ цепей Маркова


Слайд 6Проблема хранения истории обращений.
Исследуемые методы:


Построение и анализ цепей Маркова


Слайд 7 Исследуемые методы:


Хранение истории в Global History Buffer (GHB)

Нотация алгоритмов на основе GHB: <Тип Index Table>/<Метод анализа истории>


Слайд 8 Исследуемые методы:


Алгоритм PC/DC: Program Counter / Delta Correlation


Слайд 9 Исследуемые методы:


Алгоритм G/DC: Global address / Delta Correlation


Слайд 10 Методология


Выбор инструмента для исследования


Исследование на ПЛИС
+ Высокая скорость тестирования
- Сложность реализации алгоритмов
Потактовый симулятор
+ Тестирование на любом ПК
- Крайне низкая скорость тестирования
- Сложность реализации алгоритмов
Симулятор подсистемы памяти
+ Достаточно быстрое тестирование
+ Тестирование на любом ПК
+ Простота реализации алгоритмов в терминах симулятора
+ Простота реализации инструмента
- Погрешность результатов


Слайд 11 Методология


Получение трасс обращений


Слайд 12 Методология


Обработка трасс на событийной модели


Слайд 13 Методология


Параметры симуляции

Для симуляции были спользованы следующие параметры:
Тайминги: tAL = 2, BL = 8, tCL = 5, tCAS = 5, tFAW = 20, tRAS = 18, tRCD = 5, tRTP = 2, tRRD = 4, tRP = 4, tWTR = 3, tWR = 6
Отношение частоты памяти к частоте ядра = 2.5
Размер L1 — 32Кб, ассоциативность - 4
Размер L2 — 2Мб, ассоциативность — 8
Время поиска по L2 — 15 тактов, по L1 — 2 такта.
Размер слова — 64 бита,
Количество miss registers в кэшах — 4
Размер очереди обращений в память — 16
Стратегия вытеснения - Pseudo-LRU


Слайд 14 Полученные данные


Метод выделения постоянного шага (Stride)


Слайд 15 Полученные данные


Метод цепей Маркова на структуре GHB (G/AC: Global address / Address Correlation)

Для алгоритма с параметром ширины предвыборки = 4


Слайд 16 Полученные данные


Метод G/DC

Для алгоритма с параметром ширины предвыборки = 4


Слайд 17 Полученные данные


Метод PC/DC

Для алгоритма с параметром ширины предвыборки = 2


Слайд 18 Полученные данные


Сравнение методов


Слайд 19 Полученные данные


Сравнение методов: случай эффективного программного кода

Опасность использования метода G/DC


Слайд 20 Полученные данные


Сравнение методов: случай эффективного программного кода


Слайд 21 Выводы


Stride и PC/DC
+ хорошая точность обнаружения целевого кода
+ малое количество неиспользованных предвыборок
– проектирование дополнительной логики ядра для получения PC
G/AC
+ малое количество неиспользованных предвыборок
+ возможность использовать алгоритм обособленно от ядра
– узкая направленность метода
G/DC
+ возможность использовать алгоритм обособленно от ядра
+ широкая направленность метода
– генерация большого числа ненужных предвыборок


Слайд 22Разработана методология исследования: создана система автоматизации получения исходных данных для симуляции

и обработки результатов, симулятор подсистемы памяти.
Исследованы 4 класса алгоритмов на симуляционной модели

Результаты



Слайд 23 Направления дальнейшей работы



Осуществление корреляции симулятора с различными реализациями процессоров путем использования в симуляторе соответствующих параметров и аппаратных решений
Разработка эффективных методов предвыборки, оценивая их по разработанной методологии.


Слайд 24Спасибо за внимание


Слайд 25
Приложение



Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика