Курсовая работа по темеАлгоритмы и технологии сжатия цифрового видео презентация

Содержание

Основные проблемы с несжатым видео: -Большой видео поток -Несжатые данные занимают очень много места -Каналы передачи и возможности хранения ограничены Пример: Видео 720х576 пикселов 25 кадров в

Слайд 1Курсовая работа по теме Алгоритмы и технологии сжатия цифрового видео
Выполнил:
студент гр с-54

Куликов В.А

Слайд 2 Основные проблемы с несжатым видео: -Большой видео поток -Несжатые данные занимают очень

много места -Каналы передачи и возможности хранения ограничены Пример: Видео 720х576 пикселов 25 кадров в секунду в системе RGB и прогрессивной развертке потребует потока данных примерно в 240 Мбит/сек (т.е. 1.8 Гб в минуту). На DVD-ROM диск размером 4.7Гб войдет всего 2.5 минуты. => Нужно сжатие в 35 раз для записи фильма.

Причины сжатия видео


Слайд 3Не существует метода оценки кадра полностью адекватному человеческому восприятию Не существует метода

оценки пропущенных кадров, полностью адекватного человеческому восприятию Разные кодеки "затачиваются" под разные типы фильмов. Качество сжатия конкретного фильма может сильно зависеть от параметров кодирования.

Любой кодек дает разное качество по кадрам одного и того же фильма






Слайд 4Технологии сжатия

Без потерь качества С потерями качества Без потерь с точки зрения восприятия

С естественной потерей качества С неестественными потерями качества

Без потерь качества С потерями качества Без потерь с точки зрения восприятия С естественной потерей качества С неестественными потерями качества







Слайд 5Что используется при сжатии
Используется избыточность:
Пространственная (

используется DCT или Wavelet преобразования)
Временная (между кадрами, сжимается межкадровая разница)
Цветового пространства ( RGB переводится в YUV и цветовые компоненты прореживаются)




Когерентность областей изображения —
малое локальное изменение цвета
Избыточность в цветовых плоскостях —
используется большая важность яркости для восприятия
Подобие между кадрами —
на скорости 25 кадров в секунду соседние кадры, как правило, изменяются незначительно


Слайд 6Просторанственная и временная избыточность
Пространственная
избыточность – цвет
большинства соседних
точек одинаков.


Временная
избыточность –
кадры весьма похожи

Пространственная
избыточность

– цвет
большинства соседних
точек одинаков.


Временная
избыточность –
кадры весьма похожи

Слайд 7Межкадровая разница
Именно такие кадры (с учетом поправки на компенсацию движения) и

сжимает кодек. Их больше 99% в потоке. (Амплитуды – малы, изображение практически однородно)


Именно такие кадры (с учетом поправки на компенсацию движения) и сжимает кодек. Их больше 99% в потоке. (Амплитуды – малы, изображение практически однородно)


Слайд 8Последовательное кодирование длины
ПКД
Особенности: 1)Хорошо подходит для черно-белых или 8 разрядных графических

изображений, таких как кадры анимации. 2)Не подходит для естественных изображений с высоким разрешением.

Кодек, использующий ПКД - Microsoft RLE (MRLE)

КРАТКОЕ ОПИСАНИЕ

ПКД кодирует последовательность пикселей одинакового цвета (например, черного или белого) как одиночное ключевое слово. Так, например, последовательность пикселей:

77 77 77 77 77 77 77

может быть закодирована как

7 77 (семь 77).


Слайд 9Векторная квантизация
VQ
Особенности: 1)Процесс кодирования в вычислительном отношении интенсивен и не

может быть выполнен в реальном времени без специализированных аппаратных средств. 2)Быстрый процесс декодирования. 3)Появление блочных артефактов при высоком сжатии.

Кодеки, использующие VQ - Indeo, Cinepak

КРАТКОЕ ОПИСАНИЕ

При векторной квантизации изображение делится на блоки. Кодер идентифицирует класс подобных блоков и заменяет их на "универсальный" блочный представитель, составляет поисковую таблицу коротких двоичных кодов к "универсальным" блокам. Декодер использует поисковую таблицу, чтобы транслировать приблизительное изображение, составленное из "универсальных" блоков согласно поисковой таблице.


Слайд 10Дискретное косинус преобразование
ДКП
Особенности: 1)Появление блочных артефактов при высоком сжатии. 2)Излом

острых граней. Случайное размытие в острых граней. 3)Большие требования к вычислительным мощностям.

Кодеки, использующие ДКП - Motion JPEG, MPEG-1,MPEG-2, MPEG-4, H.261, H.263, H.266

КРАТКОЕ ОПИСАНИЕ

ДКП - широко используемое преобразование при сжатии изображения. Данные о яркости и цвете сохраняются в виде коэффициента частоты.


Слайд 11Дискретное преобразование элементарной волны
DWT
Особенности: 1)большинство DWT кодеков осуществляют преобразование без блочных

артефактов. 2)Алгоритмы сжатия, основанные на DWT, часто превосходят по быстродействию ДКП. 3)Субъективное качество видеоизображений, сжатых с DWT, может быть лучше, чем при ДКП с таким же коэффициентом сжатия.

Кодеки, использующие DWT - - VxTremem, Intel Indeo 5.x, Intel Indeo 4.x


Слайд 12Кодирование разности кадров
Особенности: 1)Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров.

2)Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр.

Особенности: 1)Может достигать лучшего сжатия, чем независимое кодирование отдельных кадров. 2)Ошибки накапливаются в кадрах после ключевого кадра, в конечном счете, требуя следующий ключевой кадр.

КРАТКОЕ ОПИСАНИЕ

Обычно изменения между соседними кадрами незначительны (например, в случае шара, летящего перед статическим фоном, большая часть изображения не меняется между кадрами). На этом основан алгоритм кодирования разности кадров.


Слайд 13Компенсация движения
КД
Особенности: 1) Cжатия видео выше, чем при кодировании разности кадров.

2)Стадия кодирования алгоритма КД в вычислительном отношении интенсивна. 3)Схема КД, используемая в международных стандартах MPEG, H.261, и H.263 работает лучше всего для сцен с ограниченным движением.

Кодеки, использующие КД: VxTreme, MPEG-1,2, и 4, H.261, H.263, H.264

КРАТКОЕ ОПИСАНИЕ

При сжатии, изображение делится на блоки. Для каждого блока кодируется вектор движения, указывающий на блок в предыдущем или следующем кадре, который схож с кодируемым блоком. Блок ссылки может совпадать с исходным или отличаться от него. Кодеку не требуется распознавать присутствие шара или другого объекта. Он лишь сравнивает блоки пикселей в декодированном кадре и кадре ссылки.


Слайд 14Типы кадров в потоке
I-тип - кодирования данных на основе только текущего

изображения;
Р-тип - кодирование на основе текущего и предыдущего кадров;
В-тип - кодирование с учетом текущего предыдущего и последующего кадров;


I-тип - кодирования данных на основе только текущего изображения;
Р-тип - кодирование на основе текущего и предыдущего кадров;
В-тип - кодирование с учетом текущего предыдущего и последующего кадров;


Слайд 15Форматы файлов
AVI (Audio Video Interlive)

MPEG (Motion Picture Experts Group)

- ASF

(Advanced Streaming Format)


AVI (Audio Video Interlive)

MPEG (Motion Picture Experts Group)

- ASF (Advanced Streaming Format)


Слайд 16
AVI

Формат с перемежающимися блоками аудио- и видеоинформации
«Чанковый» формат
Неприспособленность к стримингу
Ограничение на

размер файла в 2Гб


Слайд 17
MPEG-1


Битрейт порядка 1-2 Мбит/с
-Произвольный доступ к фрагментам
-Обратное воспроизведение
-Быстрый поиск вперед/назад
-Синхронизация видео

и аудио потоков
-Основная сфера применения MPEG-1 - формат VideoCD
-Средний размер фильма 700mb








Слайд 18Свойства MPEG – 2

Совместимостьс MPEG-1
Поддержка множества форматов
Видеопоследовательностей
Кадровая/блочная структура картинки
Кадровая/блочная двунаправленная

адаптивная компенсация движения
Кадровое/блочное адаптивное DCT
Альтернативное сканирование DCT коэффициентов
Формат картинки: (4:2:0),(4:2:2),(4:4:4)
Нелинейная таблица квантования


Отличия от MPEG-1

Кодирование последовательностей с интерлейсингом

Масштабируемость–позволяет декодировать видеопотокс меньшим качеством, разрешением и частотой кадров, чем он был закодирован



Слайд 19
MPEG-4


Технология фрактального сжатия
Wavelet
MC
спрайты
обьекты с прозрачным фоном
3d-рендеринг
Встроенный

язык описания BIFS








Слайд 21H.264








Кодирование


Слайд 22Метрики









Слайд 23Где

x, y – пиксели изображений;

n,m – размеры по горизонтали и вертикали.
PSNR

Метрика,

которую часто используют на практике, называется мерой отношения сигнала к шуму (peak-to-peak signal-to-noise ratio — PSNR).






Слайд 24Blocking measure

Значение метрики пропорционально визуальной степени "блочности” изображения.

В контрастных областях

кадра границы блоков почти незаметны, а в однородных та же граница будет хорошо видна





Слайд 25Bluring measure

Данная метрика позволяет сравнить степень размытия двух изображений, относительно друг

друга. Чем ближе её значение к 0, тем больше размыто изображение.



Исходное Обработанное Bluring Measure

Красный цвет - первое изображение чётче второго, зелёный цвет - второе изображение чётче первого.


Слайд 26Конец









Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика