Распознавание изображений. Выделение признаков презентация

Содержание

~ 90% информации человек получает через зрение Это очень информативный источник Множество рутинной работы людей связано с распознаванием изображений Гаишник высматривает нарушителей Работник завода ищет бракованные детали Охранник сверяет фото на

Слайд 1 Распознавание изображений: Выделение признаков
подготовил: аспирант 1 года
Чуманкин Юрий Евгеньевич
 
Нижегородский государственный университет им.

Н.И. Лобачевского Физический факультет
Кафедра информационных технологий в физических исследованиях

Слайд 2~ 90% информации человек получает через зрение
Это очень информативный источник
Множество рутинной

работы людей связано с распознаванием изображений
Гаишник высматривает нарушителей
Работник завода ищет бракованные детали
Охранник сверяет фото на пропуске с лицом человека
Было бы здорово автоматизировать эту работу

Распознавание изображений


Слайд 3Распознавание изображений
В XXI веке появились большие вычислительные мощности
Получать цифровые изображения стало

очень просто


Слайд 4За последние 10 лет произошел огромный толчок
КЗ нашло свое применение:
Распознавание людей (отпечаток

пальца, лицо, сетчатка)
Контроль подлинности (банкнот, документов)
Распознавание текста (ABBY)
Интеллектуальное видеонаблюдение (системы безопасности, письма счастья)
Контроль качества (подсчет длины очереди, поиск течи в трубе)

Распознавание изображений


Слайд 5Сужаем класс задач
Наши условия:
Есть изображение
На нем есть объект
Необходимо отнести его к

одному из известных классов, т.е. решить задачу классификации

Пример:
Распознать букву
Распознать чей отпечаток

Задача распознавания


Слайд 6Общий алгоритм


Слайд 7Фильтрация от шума
На всех реальных изображениях присутствует шум

Шум распределен в широкой

полосе частот

Не понятно как отделить его от изображения

Слайд 8Фильтр низких частот
Свертка с прямоугольным окном
Свертка с гауссовым окном
Фильтры низких частот


Слайд 9Выбор окрестности
Сортировка
Выбор значения из середины
Медианный фильтр


Слайд 10Фильтрация от шума


Слайд 11Метод наращивания и соединения областей
Исходное изображение
Наращивание
Промежуточных областей
Смежные области объединяются
Сегментированное изображение


Слайд 12Результат сегментации


Слайд 13Есть картинка, и что?
Компьютер понимает только формальное описание
Например классификацию точек на плоскости

он бы провести смог

Слайд 14Очень много информации
На обычном hd снимке 1280 * 720 ~ 1

млн. пикселей
Сложно обрабатывать такие большие массивы данных
Не вся информация является полезной для распознавания
Есть информация которая сбивает с толку

Что отличает изображение от точки в пространстве?


Слайд 15Проблемы освещенности


Слайд 16Искажения перспективы


Слайд 17Аберрации линзы (рыбий глаз)


Слайд 18Вариация формы


Слайд 19Встречаются почти всегда
Эталон
Сдвиг
Масштабное преобразование
Поворот


Слайд 20Выделение признаков для изображений символов
Предположения:
Изображение полутоновое
Символ на картинке один
Задача:
Сопоставить изображению набор

чисел, достаточный для классификации
Учесть смещение символа
Учесть символы разных масштабов
Учесть символы повернутые на разный угол

Слайд 21Математическое представление изображения
Это функция двух переменных (непрерывный случай)
Это матрица (дискретный случай)


Слайд 22Математическое представление изображения
Справедливы:
Сложение
Вычитание
Умножение
Деление
Возведение в степень
И т.д.
 


Слайд 23Физическое представление изображения
Это плоская фигура (непрерывный случай)
Это система материальных точек (дискретный

случай)
Чем светлее фрагмент, тем больше он весит
Интенсивность (I) выступает в роли плотности
Здесь и далее рассматриваем буквы

Слайд 24Инвариантность относительно сдвига
Буква – это твердое тело
С каждой точкой ТТ можно

связать систему координат

 


Слайд 25Выбор начала отсчета
Нормальный выбор – центр буквы
Очень просто вычислить
Но что происходит

при слабом изменении формы?

 


Слайд 26Центр масс изображения
 








Слайд 27Центр масс изображения
 







 
 


Слайд 28Инвариантность относительно масштаба
Надо изменить масштаб распознаваемого изображения
Какую область масштабировать?
Во сколько раз?



Слайд 29Какую область масштабировать?


Слайд 30Какую область масштабировать?
Она должна быть связана с размерами символа
Можно выбрать описанный

квадрат или круг
Недостатки все те же, что и раньше
Выгоднее опираться на статистические характеристики

Слайд 31Статистические характеристики
Удобно рассмотреть распределение пикселей по удаленности от центра масс
Это функция

ρ(r)
По горизонтальной оси – удаление от центра масс
По вертикальной оси количество пикселей, которые находятся на таком расстоянии от центра масс

 

 


Слайд 32Статистические характеристики
Область точно не надо брать уже, чем математическое ожидание расстояния
Насколько

велик разброс пикселей вокруг среднего показывает дисперсия

 

 

 

 


Слайд 33Статистические характеристики
 


Слайд 34Во сколько раз масштабировать?
Под размер шаблона с которым будет делаться сравнение

Шаблон

должен быть
не слишком маленьким
Теряются детали
Не слишком большим
Долго обрабатывать
Исследования показали что оптимальный размер 30 пикселей



Слайд 35Не случится ли беды?
Делаем масштабирование в прямом пространстве
Растяжение переходит в сжатие,

сжатие в растяжение
a < 1 – все хорошо
a > 1 – появились новые высокие частоты

 


Слайд 36Не случится ли беды?
Появление высоких частот при фиксированной частоте дискретизации может

привести к невыполнению теоремы Котельникова
Это означает потерю информации
Чтобы этого не произошло надо убрать высокие частоты из исходной картинки


Слайд 37Этапы масштабной нормализации
Исходный символ
Свертка с Гауссовым фильтром
Отмасштабированный символ


Слайд 38Линейная алгебра
Функция это элемент гильбертова пространства. Как вектор.
Скалярное произведение:

Ортонормированный базис:









Слайд 39Разложение векторов
Если размерность базиса (кол-во векторов в нем) совпадает с размерностью

пространства, то по такому базису можно делать разложение
В общем случае:


Для ортонормированного базиса












Слайд 40Моменты
В функциональном пространстве скалярное произведение f(x) на g(x) назвали:
Момент f(x) относительно

g(x)
Базисы есть разные, еще момент называют по имени базиса
Какие базисы используются?












Слайд 41Базисы
Не ортогональный:
Регулярный базис
Регулярные моменты
Ортогональные
Базис Цернике
Моменты Цернике
Базис Уолша
Моменты Уолша













Слайд 42Полиномы Цернике
Ортогональность
Легко восстановить изображение
Коэффициенты слабо коррелированы
Модуль коэффициентов
инвариантен к

повороту

Слайд 43Восстановление изображения
Чтобы восстановить изображение надо найти коэффициенты



Формула для восстановления















Слайд 44А если изображение повернуто?
Выбираем признаки
Либо надо исключить информацию о повороте
Либо надо

все изображения развернуть в исходное положение
















Слайд 45Поворот в исходное положение
Вспомним физическую интерпретацию изображения
Как у любого твердого тела, у

буквы есть собственная система координат
















Слайд 46Определение поворота по собственной системе координат
Рассчитывается тензор инерции
Определяются собственные направления
Сравниваются направления

шаблона и изображения

Слайд 47Модуль моментов
Возьмем модуль от моментов Цернике



Сделаем сдвиг


Очень удобно



Слайд 48Выбор признаков
Коэффициент с n=0 вносит большую ошибку
Коэффициент с n=1 пропорционален rc
nmax

= 12
Всего 48 признаков
Они будут инвариантны к повороту

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика