Генерация вероятностных автоматов методами Reinforcement Learning презентация

Стимулирующее обучение

Слайд 1Генерация вероятностных автоматов методами Reinforcement Learning
Выполнил: Иринёв

А. В.



Руководитель: Шалыто А. А.


Слайд 2
Стимулирующее обучение


Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов


Слайд 4Обучение автомата
Действие

Проверка «слабого условия»

Перераспределение вероятностей



Слайд 5Применение стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели


Слайд 6Q-learning: статические задачи

Обучение Q-функции

Порождение оптимальной стратегии


Слайд 7Q-learning: стохастические системы
Обучение Q-функции

Подсчёт вероятностей переходов

Сжатие вероятностной модели


Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре

доступных действия
Выделенные клетки
Задача – максимизировать общую прибыль для нескольких мобильных роботов

Слайд 9Тестовый пример


Слайд 10Сжатие автоматной модели


Слайд 11Выводы
Непосредственное обучение вероятностной модели непрактично
Предложенный подход позволяет решать задачи оптимизации для

стохастических систем
В зависимости от специфики задачи возможно эффективное сжатие автоматной модели

Обратная связь

Если не удалось найти и скачать презентацию, Вы можете заказать его на нашем сайте. Мы постараемся найти нужный Вам материал и отправим по электронной почте. Не стесняйтесь обращаться к нам, если у вас возникли вопросы или пожелания:

Email: Нажмите что бы посмотреть 

Что такое ThePresentation.ru?

Это сайт презентаций, докладов, проектов, шаблонов в формате PowerPoint. Мы помогаем школьникам, студентам, учителям, преподавателям хранить и обмениваться учебными материалами с другими пользователями.


Для правообладателей

Яндекс.Метрика