Презентация на тему Распознавание текста на изображениях. Tesseract

Презентация на тему Презентация на тему Распознавание текста на изображениях. Tesseract, предмет презентации: Информатика. Этот материал содержит 36 слайдов. Красочные слайды и илюстрации помогут Вам заинтересовать свою аудиторию. Для просмотра воспользуйтесь проигрывателем, если материал оказался полезным для Вас - поделитесь им с друзьями с помощью социальных кнопок и добавьте наш сайт презентаций ThePresentation.ru в закладки!

Слайды и текст этой презентации

Слайд 1
Текст слайда:

Распознавание текста на изображениях. Tesseract.


Слайд 2
Текст слайда:

Использованные статьи

Документация Tesseract:https://github.com/tesseract-ocr/docs
Вейвлет-преобразование: http://www2.isye.gatech.edu/~brani/wp/kidsA.pdf
Приложение вейвлет-преобразования:
http://www.sciencedirect.com/science/article/pii/S0262885605000107
http://link.springer.com/article/10.1007/s13042-011-0049-5


Слайд 3
Текст слайда:

1985 – Hewlett-Packard, C, проприетарность
1996 – порт на Windows
1998 – переход от C к C++
2005 – открытый исходный код
2006 – Google


Слайд 4
Текст слайда:

Pipeline

Анализ макета
страницы

Поиск блобов

Сборка строк и слов

Распознавание слов
(первый проход)

Распознавание слов
(второй проход)

Бинарное изображение

Текст


Слайд 5
Текст слайда:

Анализ макета страницы


Слайд 6

Слайд 7

Слайд 8

Слайд 9

Слайд 10

Слайд 11
Текст слайда:

Поиск блобов


Слайд 12
Текст слайда:

Поиск строк


Слайд 13
Текст слайда:

Поиск слов: случай моноширинного шрифта


Слайд 14
Текст слайда:

Поиск слов: случай пропорционального шрифта


Слайд 15
Текст слайда:

Поиск слов: случай пропорционального шрифта

Нет пробела

Лишний
пробел


Слайд 16
Текст слайда:

Поиск слов: случай пропорционального шрифта

“Fuzzy”
space


Слайд 17
Текст слайда:

Разрезание и объединение символов


Слайд 18
Текст слайда:

Статическая классификация символов

Features of prototype

Features of unknown


Слайд 19
Текст слайда:

И что, это работает?


Слайд 20

Слайд 21

Слайд 22
Текст слайда:

Как сделать, чтобы заработало?

Текст упорядочен в один или несколько столбцов
Нет посторонних изображений
Нет сильных искажений и шума
Высота символов >= 20 пикселей
Бинарное изображение на входе
(иначе тессеракт сам его бинаризует)


Слайд 23
Текст слайда:

Использованные пакеты

Tesseract для Python: pytesseract
Обработка изображений: scikit-image
Вейвлеты: PyWavelets
Нейронные сети: PyBrain


Слайд 24

Слайд 25

Слайд 26

Слайд 27

Слайд 28

Слайд 29

Слайд 30

Слайд 31

Слайд 32

Слайд 33

Слайд 34

Слайд 35

Слайд 36

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика