Слайд 1Естественно-интуитивное взаимодействие с компьютером
Лекция 5
Разработка пользовательских мультимедийных приложений
с использованием возможностей
Intel Perceptual Computing SDK
Слайд 2Содержание лекции
Краткое понятие мультимедиа и мультимедийных приложений
Преимущества от использования Intel Perceptual
Computing SDK при разработке мультимедиа приложений
Принципы управления мультимедиа приложением с использованием Intel Perceptual Computing SDK
Разработка графического редактора с жестовым управлением
Голосовое управление в стандартных сервисных приложениях (браузер, проигрыватель, слайдшоу)
Контрольные вопросы
Лекция № 5.
Слайд 3 Краткое понятие мультимедиа
Мультимедиа (multimedia) - это совокупность компьютерных технологий, одновременно
использующих несколько информационных сред: графику, текст, видео, фотографию, анимацию, звуковые эффекты, звуковое сопровождение, человеческую речь.
Мультимедийные технологии - это совокупность современных цифровых средств, которые позволяют вводить, сохранять, перерабатывать и воспроизводить мультимедиа.
Пользовательский интерфейс - результаты представления элементов мультимедиа на экране и средства управления ими.
Слайд 4Разновидности мультимедиа
Линейное мультимедиа - пассивный просмотр элементов мультимедиа по сценарию
Нелинейное (интерактивное)
мультимедиа - управления элементами мультимедиа в режиме диалога.
Гипермедиа – интерактивная структура связанных элементов мультимедиа, которые пользователь может последовательно выбирать.
Реальное видео – трансляция потока данных с одного устройства на другое в режиме реального времени.
Слайд 5Применение мультимедиа
Процессы производства, хранения и распространения информации
Электронный бизнес
Рекламная деятельность, управление маркетингом
Индустрия развлечений, создание компьютерных игр, киноиндустрия
Современное цифровое искусство
Обучение и образование
Глобальный обмен информацией и культурными ценностями, коммуникации
Слайд 6 Классификация мультимедиа приложений
Средства создания и обработки изображения
Средства создания и обработки
2D и 3D – графики
Средства создания и обработки видео и анимации
Средства создания и обработки звука
Средства создания презентации
Слайд 7 Прежде чем начинать разработку…
Приложение будет полезно пользователю только в том
случае, если оно корректно обрабатывает мультимедиа.
Чтобы реализовывать эффектные и полезные мультимедиа приложения с использованием Intel Perceptual Computing, необходимо четко определить, какие именно мультимедиа форматы и в какой степени будут задействованы в конкретном приложении и какие технологии нужны для работы с этими форматами.
Слайд 8Intel Perceptual Computing SDK в мультимедиа
Можно говорить о появлении нового
поколения мультимедийных приложений, имеющих гораздо более широкий спектр возможностей по обработке различных типов файлов и потоков данных
Увеличивается степень интерактивности мультимедиа приложений
Повышение эффективности в образовательной и развлекательной сферах человеческой деятельности
Реализация в коммерческих и рекламных целях, на различных презентациях и демонстрациях.
Слайд 9Intel Perceptual Computing SDK в мультимедиа
При продуманной агрегации нескольких мультимедиа
технологий в одном приложении пользователю предоставляется больше возможностей для работы с цифровой информацией, что только усиливается при использовании жестового или голосового управления.
Позволяет решать простые пользовательские задачи
Выступает в качестве гибкого и сложного инструмента в различных сферах
Облегчает управление сложными мультимедиа комплексами
Слайд 10 Примеры использования (1)
Процесс работы с музыкальным симулятором
Слайд 11 Примеры использования (2)
Дирижер виртуального оркестра
Слайд 12 Примеры использования (3)
Воспроизведение композиции в приложении-синтезаторе
Слайд 13 Примеры использования (4)
Моделирование трехмерного видеопотока в реальном времени
Слайд 14 Примеры использования (5)
Трехмерное моделирование в простейшем редакторе
Слайд 15 Примеры использования (6)
3D-модель, созданная с помощью жестового редактора CubeFlow
Слайд 16 Примеры использования (7)
Управление трехмерной анимацией с помощью жестового интерфейса
Слайд 17 Примеры использования (8)
Трехмерное сканирование объектов реального мира
Слайд 18 Примеры использования (9)
Редактирование презентации, управляемой жестами
Слайд 19 Intel Perceptual Computing SDK в мультимедиа
Различные комбинации мультимедиа и
Perceptual Computing позволяют решать пользовательские задачи разных уровней.
Количество вариантов совместного использования мультимедиа и Intel Perceptual Computing стремительно возрастает, что увеличивает спектр возможностей
по обработке и взаимодействию с мультимедиа.
Слайд 20 Управление мультимедиа с IPC SDK
С одной стороны, процесс управления должен
быть максимально понятен пользователю, с другой - необходимо обеспечить функциональную полноту приложения. Баланс функциональности и удобства в использовании особенно важен для мультимедиа приложений, которые носят развлекательный, информативный или обучающий характер.
Поэтому при разработке мультимедиа приложения,
в котором будет использоваться Intel Perceptual Computing, этому аспекту следует уделять особое внимание.
Слайд 21Управление мультимедиа с IPC SDK
На начальном этапе разработки необходимо провести декомпозицию
задачи пользователя, которую будет решать приложение.
Главная задача разбивается на несколько более узких, эти задачи также подвергаются декомпозиции.
Этот процесс стоит осуществлять до тех пор, пока задачи не будут представлять собой элементарно реализуемые операции.
Это позволит однозначно определить список функций мультимедиа приложения.
Слайд 22Управление мультимедиа с IPC SDK
На этапе проектирования интерфейса список конечных функций
приложения следует соотнести с элементами управления программой - кнопки, checkbox’ы, radiobutton’ы, выпадающие списки и др., их вариации,
и голосовые команды и жесты.
При разработке жестовых и голосовых интерфейсов для мультимедиа приложений следует учитывать наиболее общие правила проектирования стандартных пользовательских интерфейсов.
Слайд 23 Принципы проектирования User Interface
в одном функциональном блоке не больше 5-7
элементов
все важные элементы интерфейса должны быть заметны
использовать готовые паттерны управления для решения стандартных задач (принцип “умного заимствования”)
взаимодействие с подобными по виду элементами и объектами должно происходить всегда единообразно
обеспечение обратимости команд везде
информировать пользователя о состоянии системы
применять модель «объект-действие»
защищать от случайных действий
Слайд 24Управление мультимедиа с IPC SDK
В отношении Perceptual Computing на данный момент
нельзя выделить устоявшихся интерфейсных шаблонов в силу новизны и низкой распространенности технологии, но в дальнейшем необходимо их учитывать.
На данном этапе ориентироваться следует в первую очередь на то, что пользователю должно быть интуитивно понятно, какой жест или голосовую команду ждет от него приложение, чтобы выполнить его задачу.
Слайд 25Управление мультимедиа с IPC SDK
Пользователь ожидает, что противоположные действия вызывают соответственно
противоположные реакции приложения.
Если жест “большой палец вверх” запускает запись сигнала с видеокамеры в файл, то жест “большой палец вниз” должен эту запись останавливать.
Аналогичным образом следует поступать
и с голосовыми командами.
Слайд 26Управление мультимедиа с IPC SDK
Для мультимедиа приложений характерно дублирование конечных простейших
функций на несколько способов управления.
Например, в большинстве проигрывателей воспроизведение можно начать не только щелчком по кнопке, но и нажатием клавиши “пробел”, а перемотать запись на определенный момент можно клавишами “вперед” и “назад”, такими же кнопками, или передвинув ползунок progress bar’а.
Слайд 27Управление мультимедиа с IPC SDK
Используя технологию Intel Perceptual Computing при разработке
любых мультимедиа приложений, следует учитывать эту особенность и предоставлять пользователю возможность выбора наиболее удобного для него способа управления мультимедиа в той или иной ситуации. Поэтому целесообразно дублировать жестовое управление для наиболее часто используемых функций программы голосовыми командами.
Слайд 28 Функционал проф. графических редакторов
устранение различных дефекты изображений
ретуширование, подавление шума
корректировка яркости
и контрастности, цветокоррекция
настройка цветового фона и фокусировки
кадрирование изображения
изменение композиции, фотомонтаж и коллажирование
применение спецэффектов и фильтров
расширение динамического диапазона
перевод изображение из одного цветового пространства в другое.
Слайд 29 Жестовый графический редактор
Функционал простейшего редактора растровой графики реализует базовые инструменты
для работы с изображениями, такие как:
дорисовка изображения
выборочное редактирование и кадрирование
коллажирование и фотомонтаж
Именно такой набор функций лучше всего подходит для реализации графического редактора, использующего технологию Intel Perceptual Computing.
Слайд 30 Жестовый графический редактор
Во избежание путаницы в интерфейсе редактора необходимо использовать
минимальный набор жестовых команд, для управления однотипными функциями рекомендуется использовать одинаковые жесты.
Также для удобства пользователя возможно предусмотреть дублирование управляющих жестов голосовыми командами.
Слайд 31 Жестовый графический редактор
Запустив приложение, пользователь должен выбрать изображение для редактирования
из галереи, которая перелистывается движением кистей рук вправо и влево. Выбор изображения для редактирования осуществляется с помощью любой позы, например “большой палец вверх” или “победа”.
Слайд 32Жестовый графический редактор
Процесс редактирования изображения
Слайд 33 Альтернативный вариант
Реализация в качестве надстройки над любым популярным программным пакетом
для растровой графики. Предпочтительнее предоставлять жестовое управление для тех функций, где оно будет способствовать увеличению производительности и не приведет к снижению удобства использования графического редактора:
рисование с помощью различных кистей
изменение форм объектов
навигация по слоям проекта и т.д.
Слайд 34 Голосовое управление мультимедиа
Частью функциональности любого мультимедийного приложения можно управлять с
помощью голосовых команд.
Такой тип управления подходит, прежде всего, для стандартных сервисных приложений, набор функций в которых, как правило, ограничен и реализует базовые потребности пользователя при работе с мультимедиа.
Слайд 35 Голосовое управление слайдшоу
Базовый функционал
“Go” - старт показа изображений
“Pause” -
пауза и
“Stop” - остановка показа
“Previous” - переход к предыдущему изображению
“Next” - переход следующему изображению
Дополнительно:
“desktop” - установка текущего изображения в качестве фона
рабочего стола
Слайд 36 Голосовое управление слайдшоу
Управление скоростью показа изображений
постепенное изменение скорости на определенную
долю командами “faster” и “slower”
переключение между тремя режимами “быстро”, “умеренно”, “медленно” соответственно командами “fast”, “medium”, “slow”.
Слайд 37 Голосовое управление проигрывателем
управление громкостью проигрываемой записи. Рекомендуется изменять уровень громкости
командами “louder” и “quieter” на определенный процент.
возможность поиска композиции в мультимедиа библиотеке с помощью команд “search” или “find”.
возможность голосового управления плейлистами: создание нового плейлиста, добавление и удаление композиции из плейлиста, проигрывание плейлиста.
Слайд 38 Голосовое управление браузером
Управление с помощью голосовых команд в данном случае
должно быть реализована как дополнительный функциональный модуль приложения.
Перечень функций для голосового управления
голосовой поиск интернет-страниц, изображений и видео
прямой переход по задаваемой пользователем ссылке
добавление страницы в закладки
управление вкладками и т.д.
Слайд 39Контрольные вопросы
1. Что подразумевается под понятиями “мультимедиа” и “мультимедиа технологии”?
2. Какие
существуют типы распространенных мультимедиа приложений?
3. В чем основные преимущества от совместного использования мультимеиа и технологии Perceptual Computing?
4. В чем заключаются основные подходы к жестовому и голосовому управлению мультимедиа приложениями?
5. Какой набор функций по обработке растровой графики можно реализовать через жестовый интерфейс?
6. Какие функции стандартных сервисных приложений можно реализовать с помощью голосового управления?