Семантическая сегментация презентация

Содержание

1. Семантическая сегментация
2. Наивная классификация Нужно классифицировать каждый пиксель
3. Наивная классификация Сегментируем картинку, затем классифицируем сегменты Классифицируем каждый пиксель по окрестности
4. Пространственная поддержка 50x50 Patch 50x50 Patch
5. Построение решения Задача / Данные Элемент
6. Цель: 7 геометрических классов Земля Вертикальные стены
7. Размеченные данные 300 изображений из гугла
8. Признаки Положение
9. Сегментация изображений Использование нескольких вариантов сегментации (с
10. Что мы хотим узнать: Хороший ли это
11. Классификация … … Для каждого сегмента
12. Разметка изображений … Размеченные сегментации Размеченные пиксели
13. Вероятностная разметка Support Vertical Sky V-Left V-Center V-Right V-Porous V-Solid
14. Результат Вход Ручная разметка Результат алгоритма
15. Изображения из помещений Вход Ручная разметка Результат
16. Рисунки Вход Результат
17. Приложение: Automatic Photo Pop-up (SIGGRAPH’05) Изображение Метки
18. Automatic Photo Pop-up
19. TextonBoost J. Shotton, J. Winn, C. Rother,
20. Data and Classes Goal: assign every pixel
21. Марковские Случайные Поля Независимая классификация Применяем обычный
22. Условные случайные поля МСП для совместной оценки
23. Вывод (Inference) Вывод = поиск наилучшей совместной
24. Обзор метода Модель TextonBoost на основе CRF
25. Форма и текстура (Shape & Texture) Первая
26. Моделирование формы Шаг 1: получили карту
27. Фильтры формы Пара: Отклики
28. feature response image v(i, r1, t1) feature
29. summed response images v(i, r1,
30. Обучение Используется бустинг Обычный бустинг Для каждого
31. Первый результат Только форма и текстура: 69.6% shape-texture
32. Уточняем разметку Добавляем границы Потенциал
33. Точность Форма-текстура: 69.6% +
34. Положение объектов Положение Нормализуем координаты по всем
35. Моделирование цвета Цвет Обучаем модель цвета только
36. Общий результат Форма и текстура:
37. Результаты Successes
38. Ошибки
39. Завтра Сказ о том, как Алеша Ефрос

Главная
Разное
Семантическая сегментация

Слайд 1Семантическая сегментация
Many slides adapted from Alexei Efros and Daniel Munoz
CSEDays-2010

Слайд 2Наивная классификация
Нужно классифицировать каждый пиксель
1 МП на картинку!
Что можно сказать

про 1 пиксел?
Классификация окрестности пиксела

Слайд 3Наивная классификация
Сегментируем картинку, затем классифицируем сегменты

Классифицируем каждый пиксель по окрестности

Слайд 4Пространственная поддержка
50x50 Patch
50x50 Patch

По небольшой окрестности зачастую невозможно правильно определить метку
Пространственная

поддержка
Необходимо каким-то образом задавать метки для всех пикселов в совокупности

Слайд 5Построение решения
Задача / Данные
Элемент
Пиксель
Сегмент
Классификация пикселов / регионов
Признаки для классификации
Метод классификации

(бустинг, лес, SVM)
Расширение пространственной поддержки
Множественные сегментации
Случайные поля

Слайд 6Цель: 7 геометрических классов
Земля
Вертикальные стены
Плоскости: смотрящие влево (←), Прямо ( ),

Направо (→)
Другоеr: Твердые (X), Дырявые (O)
Небо

←

Уличные изображения

Hoiem et al 2005

Слайд 7Размеченные данные
300 изображений из гугла

Слайд 8Признаки

Положение

Слайд 9Сегментация изображений
Использование нескольких вариантов сегментации (с разными параметрами)
Решение, какие сегменты хорошие,

откладывается на потом

…

Слайд 10Что мы хотим узнать:
Хороший ли это сегмент?

Если сегмент хороший, то какая

у него метка?

Обучаем модель по размеченным данным
Бустинг на решающих деревьях

Классификация областей

P(good segment | data)

P(label | good segment, data)

Слайд 11Классификация
…

…
Для каждого сегмента вычисляется:
- P(good segment | data) P(label |

good segment, data)

Слайд 12Разметка изображений

…
Размеченные сегментации
Размеченные пиксели

Слайд 13Вероятностная разметка
Support
Vertical
Sky
V-Left
V-Center
V-Right
V-Porous
V-Solid

Слайд 14Результат
Вход
Ручная разметка
Результат алгоритма

Слайд 15Изображения из помещений
Вход

Ручная разметка
Результат

Слайд 16Рисунки
Вход
Результат

Слайд 17Приложение: Automatic Photo Pop-up (SIGGRAPH’05)
Изображение
Метки

Слайд 18Automatic Photo Pop-up

Слайд 19TextonBoost
J. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance,

Shape and Context Modeling for Multi-Class Object Recognition and Segmentation, ECCV 2006

Слайд 20Data and Classes
Goal: assign every pixel to a label

MSRC-21 database (“void”

label ignored for training and testing)

Слайд 21Марковские Случайные Поля
Независимая классификация
Применяем обычный метод классификации (SVM, бустинг и т.д.)

Схема

Марковских Случайных Полей (MRF) для совместной классификации
Каждый пиксел – вершина неориентированного графа
Связи между пикселами задаются ребрами графа

Why?

Слайд 22Условные случайные поля
МСП для совместной оценки разметки случайных переменных (c), при

условии всех данных (x)

Модель совместного распределения

Ψ(1) – модель локальной оценки качества метки
Ψ(2)- - модель попарной оценки качества разметки

Images from Szummer DAR’05

Слайд 23Вывод (Inference)
Вывод = поиск наилучшей совместной разметки
NP-полная задача в общем случае
Argmax-разметка

Попарные потенциалы должны удовлетворять условию субмодулярности
Разрезы графов (GraphCuts)
Не-субмодулярные потенциалы
Quadratic Pseudo-Boolean Optimization (QPBO)
Разметка с оценкой достоверности
Belief Propagation, TRW
Приближенное решение при наличии циклов
Сложность экспоненциально зависит от размера клики
Поэтому в основном рассматриваются модели с кликой не выше 2 (попарные)

Слайд 24Обзор метода
Модель TextonBoost на основе CRF

4-х связанные окрестности
Параметры обучаются независимо
Вывод GraphCut
VS

Слайд 25Форма и текстура (Shape & Texture)
Первая и главная компонента модели

Текстоны

Фильтруем изображение

банком фильтров (17 фильтров)
Каждый фильтр – вычисление определенной характеристики/статистики окрестности точки
Получаем 17 признаков для каждого пиксела (вектор-признаки)
Кластеризуем список всех вектор-признаков (400 кластеров)
Каждые кластер – «текстон»
Квантуем каждый пиксель к ближайшему текстону (карта текстонов)

Слайд 26Моделирование формы

Шаг 1: получили карту текстонов

Шаг 2: Фильтры формы (Shape Filters)
Для

каждого текстона t
Вход
Карта текстонов
(Прямоугольная маска r, текстон t)
Положение пикселя i
Выход
Площадь в маске r, отвечающая t
Результат – гистограмма откликов по окрестностям

Слайд 27Фильтры формы
Пара:

Отклики v(i, r, t)

Большие области обеспечивают большую пространственную поддержку

Рассчет через

интегральные изображения

rectangle r

texton t

(

)

v(i1, r, t) = a

v(i2, r, t) = 0

v(i3, r, t) = a/2

appearance context

up to 200 pixels

Slides from Shotton’s ECCV talk

Слайд 28feature response image
v(i, r1, t1)
feature response image
v(i, r2, t2)
Форма задается положением

текстонов

texton map

ground truth

texton map

Slides from Shotton’s ECCV talk

Слайд 29

summed response images
v(i, r1, t1) + v(i, r2, t2)
Форма задается положением

текстонов

(

)

(r1, t1) =

(

)

(r2, t2) =

texton map

ground truth

texton map

summed response images
v(i, r1, t1) + v(i, r2, t2)

texton map

Слайд 30Обучение
Используется бустинг
Обычный бустинг
Для каждого пикселя
Для каждой возможной маски
Для каждого текстона
Считаем признак

Ускоренная

версия
Для каждого пикселя в уменьшенном изображении
Для 10 случайных масок
Для каждого текстона (K=400)
Считаем признаки
42 часа на 276 изображениях

Слайд 31Первый результат
Только форма и текстура: 69.6%
shape-texture
Точность
попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 32Уточняем разметку
Добавляем границы

Потенциал границ
Используем попарные потенциалы для определения и подчеркивания границ

Идея:
Если

метки одинаковые, разница пикселей должна быть маленькой
Если метки разные, разница пикселей должна быть большой

Модель Поттса, допускает разрезы графов

Слайд 33Точность
Форма-текстура: 69.6%
+ границы: 70.3%

shape-texture
+ edge
Точность
Попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 34Положение объектов
Положение
Нормализуем координаты по всем изображениям
Посчитываем частоту появления объектов в данной

точке изображения

Ncow, = 1, N = 3

Think Naïve Bayes

Prevent overfit (tuned)

Слайд 35Моделирование цвета
Цвет
Обучаем модель цвета только по изображению
Идея
Используем классификацию по другим признакам

как исходные параметры
Обучаем модель смеси гауссиан (кластеризация цветов)
Каждый класс – свои веса смеси
Обучаем веса итеративным EM-алгоритмом

Слайд 36Общий результат
Форма и текстура:

69.6%
+ границ: 70.3%
+ цвет: 72.0%
+ положение: 72.2%

shape-texture

+ edge

+ colour & location

Точность
Попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 37Результаты
Successes

Слайд 38Ошибки

Слайд 39Завтра
Сказ о том, как Алеша Ефрос жульничал и грубил
в компьютерном

зрении за счет Гугла, Яндекса и их пользователей, и на этом прославился

Скачать презентацию

Семантическая сегментация презентация

Содержание

Слайд 1Семантическая сегментацияMany slides adapted from Alexei Efros and Daniel MunozCSEDays-2010

Слайд 2Наивная классификацияНужно классифицировать каждый пиксель 1 МП на картинку!Что можно сказать

Слайд 3Наивная классификацияСегментируем картинку, затем классифицируем сегментыКлассифицируем каждый пиксель по окрестности

Слайд 4Пространственная поддержка50x50 Patch50x50 PatchПо небольшой окрестности зачастую невозможно правильно определить меткуПространственная

Слайд 5Построение решенияЗадача / ДанныеЭлемент ПиксельСегментКлассификация пикселов / регионовПризнаки для классификацииМетод классификации

Слайд 6Цель: 7 геометрических классовЗемляВертикальные стеныПлоскости: смотрящие влево (←), Прямо ( ),

Слайд 7Размеченные данные 300 изображений из гугла

Слайд 8ПризнакиПоложение

Слайд 9Сегментация изображенийИспользование нескольких вариантов сегментации (с разными параметрами)Решение, какие сегменты хорошие,

Слайд 10Что мы хотим узнать:Хороший ли это сегмент?Если сегмент хороший, то какая

Слайд 11Классификация……Для каждого сегмента вычисляется: - P(good segment | data) P(label |

Слайд 12Разметка изображений…Размеченные сегментацииРазмеченные пиксели

Слайд 13Вероятностная разметкаSupportVerticalSkyV-LeftV-CenterV-RightV-PorousV-Solid

Слайд 14РезультатВходРучная разметкаРезультат алгоритма

Слайд 15Изображения из помещенийВходРучная разметкаРезультат

Слайд 16РисункиВходРезультат

Слайд 17Приложение: Automatic Photo Pop-up (SIGGRAPH’05)ИзображениеМетки

Слайд 18Automatic Photo Pop-up

Слайд 19TextonBoostJ. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance,

Слайд 20Data and ClassesGoal: assign every pixel to a labelMSRC-21 database (“void”

Слайд 21Марковские Случайные ПоляНезависимая классификацияПрименяем обычный метод классификации (SVM, бустинг и т.д.)Схема

Слайд 22Условные случайные поляМСП для совместной оценки разметки случайных переменных (c), при

Слайд 23Вывод (Inference)Вывод = поиск наилучшей совместной разметкиNP-полная задача в общем случаеArgmax-разметка

Слайд 24Обзор методаМодель TextonBoost на основе CRF4-х связанные окрестностиПараметры обучаются независимоВывод GraphCutVS

Слайд 25Форма и текстура (Shape & Texture)Первая и главная компонента моделиТекстоныФильтруем изображение

Слайд 26Моделирование формыШаг 1: получили карту текстоновШаг 2: Фильтры формы (Shape Filters)Для

Слайд 27Фильтры формы Пара:Отклики v(i, r, t)Большие области обеспечивают большую пространственную поддержкуРассчет через

Слайд 28feature response imagev(i, r1, t1)feature response imagev(i, r2, t2)Форма задается положением

Слайд 29summed response imagesv(i, r1, t1) + v(i, r2, t2)Форма задается положением

Слайд 30ОбучениеИспользуется бустингОбычный бустингДля каждого пикселяДля каждой возможной маскиДля каждого текстонаСчитаем признакУскоренная

Слайд 31Первый результатТолько форма и текстура: 69.6%shape-textureТочность попиксельнойсегментацииSlides from Shotton’s ECCV talk

Слайд 32Уточняем разметкуДобавляем границыПотенциал границИспользуем попарные потенциалы для определения и подчеркивания границИдея:Если

Слайд 33ТочностьФорма-текстура: 69.6% + границы: 70.3% shape-texture+ edgeТочностьПопиксельнойсегментацииSlides from Shotton’s ECCV talk

Слайд 34Положение объектовПоложениеНормализуем координаты по всем изображениямПосчитываем частоту появления объектов в данной

Слайд 35Моделирование цветаЦветОбучаем модель цвета только по изображениюИдеяИспользуем классификацию по другим признакам

Слайд 36Общий результатФорма и текстура:

Слайд 37РезультатыSuccesses

Слайд 38Ошибки

Слайд 39ЗавтраСказ о том, как Алеша Ефрос жульничал и грубил в компьютерном

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1Семантическая сегментация
Many slides adapted from Alexei Efros and Daniel Munoz
CSEDays-2010

Слайд 2Наивная классификация
Нужно классифицировать каждый пиксель
1 МП на картинку!
Что можно сказать

Слайд 3Наивная классификация
Сегментируем картинку, затем классифицируем сегменты

Классифицируем каждый пиксель по окрестности

Слайд 4Пространственная поддержка
50x50 Patch
50x50 Patch

По небольшой окрестности зачастую невозможно правильно определить метку
Пространственная

Слайд 5Построение решения
Задача / Данные
Элемент
Пиксель
Сегмент
Классификация пикселов / регионов
Признаки для классификации
Метод классификации

Слайд 6Цель: 7 геометрических классов
Земля
Вертикальные стены
Плоскости: смотрящие влево (←), Прямо ( ),

Слайд 7Размеченные данные
300 изображений из гугла

Слайд 8Признаки

Положение

Слайд 9Сегментация изображений
Использование нескольких вариантов сегментации (с разными параметрами)
Решение, какие сегменты хорошие,

Слайд 10Что мы хотим узнать:
Хороший ли это сегмент?

Если сегмент хороший, то какая

Слайд 11Классификация
…

…
Для каждого сегмента вычисляется:
- P(good segment | data) P(label |

Слайд 12Разметка изображений

…
Размеченные сегментации
Размеченные пиксели

Слайд 13Вероятностная разметка
Support
Vertical
Sky
V-Left
V-Center
V-Right
V-Porous
V-Solid

Слайд 14Результат
Вход
Ручная разметка
Результат алгоритма

Слайд 15Изображения из помещений
Вход

Ручная разметка
Результат

Слайд 16Рисунки
Вход
Результат

Слайд 17Приложение: Automatic Photo Pop-up (SIGGRAPH’05)
Изображение
Метки

Слайд 19TextonBoost
J. Shotton, J. Winn, C. Rother, A. Criminisi, TextonBoost: Joint Appearance,

Слайд 20Data and Classes
Goal: assign every pixel to a label

MSRC-21 database (“void”

Слайд 21Марковские Случайные Поля
Независимая классификация
Применяем обычный метод классификации (SVM, бустинг и т.д.)

Схема

Слайд 22Условные случайные поля
МСП для совместной оценки разметки случайных переменных (c), при

Слайд 23Вывод (Inference)
Вывод = поиск наилучшей совместной разметки
NP-полная задача в общем случае
Argmax-разметка

Слайд 24Обзор метода
Модель TextonBoost на основе CRF

4-х связанные окрестности
Параметры обучаются независимо
Вывод GraphCut
VS

Слайд 25Форма и текстура (Shape & Texture)
Первая и главная компонента модели

Текстоны

Фильтруем изображение

Слайд 26Моделирование формы

Шаг 1: получили карту текстонов

Шаг 2: Фильтры формы (Shape Filters)
Для

Слайд 27Фильтры формы
Пара:

Отклики v(i, r, t)

Большие области обеспечивают большую пространственную поддержку

Рассчет через

Слайд 28feature response image
v(i, r1, t1)
feature response image
v(i, r2, t2)
Форма задается положением

Слайд 29

summed response images
v(i, r1, t1) + v(i, r2, t2)
Форма задается положением

Слайд 30Обучение
Используется бустинг
Обычный бустинг
Для каждого пикселя
Для каждой возможной маски
Для каждого текстона
Считаем признак

Ускоренная

Слайд 31Первый результат
Только форма и текстура: 69.6%
shape-texture
Точность
попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 32Уточняем разметку
Добавляем границы

Потенциал границ
Используем попарные потенциалы для определения и подчеркивания границ

Идея:
Если

Слайд 33Точность
Форма-текстура: 69.6%
+ границы: 70.3%

shape-texture
+ edge
Точность
Попиксельной
сегментации

Slides from Shotton’s ECCV talk

Слайд 34Положение объектов
Положение
Нормализуем координаты по всем изображениям
Посчитываем частоту появления объектов в данной

Слайд 35Моделирование цвета
Цвет
Обучаем модель цвета только по изображению
Идея
Используем классификацию по другим признакам

Слайд 36Общий результат
Форма и текстура:

Слайд 37Результаты
Successes

Слайд 39Завтра
Сказ о том, как Алеша Ефрос жульничал и грубил
в компьютерном