Генерация вероятностных автоматов методами Reinforcement Learning презентация

Содержание

1. Генерация вероятностных автоматов методами Reinforcement Learning
2. Стимулирующее обучение
3. Вероятностные автоматы Моделирование сложных систем, имеющих стохастическую природу Построение мобильных агентов
4. Обучение автомата Действие Проверка «слабого условия» Перераспределение вероятностей
5. Применение стимулирующего обучения Работать непосредственно с вероятностной моделью непрактично Генерация автоматной модели
6. Q-learning: статические задачи Обучение Q-функции Порождение оптимальной стратегии
7. Q-learning: стохастические системы Обучение Q-функции Подсчёт вероятностей переходов Сжатие вероятностной модели
8. Пример задачи на двумерном поле Клетка поля
9. Тестовый пример
10. Сжатие автоматной модели
11. Выводы Непосредственное обучение вероятностной модели непрактично Предложенный

Главная
Разное
Генерация вероятностных автоматов методами Reinforcement Learning

Слайд 1Генерация вероятностных автоматов методами Reinforcement Learning
Выполнил: Иринёв

А. В.

Руководитель: Шалыто А. А.

Слайд 2
Стимулирующее обучение

Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов

Слайд 4Обучение автомата
Действие

Проверка «слабого условия»

Перераспределение вероятностей

Слайд 5Применение стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели

Слайд 6Q-learning: статические задачи

Обучение Q-функции

Порождение оптимальной стратегии

Слайд 7Q-learning: стохастические системы
Обучение Q-функции

Подсчёт вероятностей переходов

Сжатие вероятностной модели

Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре

доступных действия
Выделенные клетки
Задача – максимизировать общую прибыль для нескольких мобильных роботов

Слайд 9Тестовый пример

Слайд 10Сжатие автоматной модели

Слайд 11Выводы
Непосредственное обучение вероятностной модели непрактично
Предложенный подход позволяет решать задачи оптимизации для

стохастических систем
В зависимости от специфики задачи возможно эффективное сжатие автоматной модели

Скачать презентацию

Генерация вероятностных автоматов методами Reinforcement Learning презентация

Содержание

Слайд 1Генерация вероятностных автоматов методами Reinforcement Learning
Выполнил: Иринёв

Слайд 2
Стимулирующее обучение

Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов

Слайд 4Обучение автомата
Действие

Проверка «слабого условия»

Перераспределение вероятностей

Слайд 5Применение стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели

Слайд 6Q-learning: статические задачи

Обучение Q-функции

Порождение оптимальной стратегии

Слайд 7Q-learning: стохастические системы
Обучение Q-функции

Подсчёт вероятностей переходов

Сжатие вероятностной модели

Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре

Слайд 9Тестовый пример

Слайд 10Сжатие автоматной модели

Слайд 11Выводы
Непосредственное обучение вероятностной модели непрактично
Предложенный подход позволяет решать задачи оптимизации для

Обратная связь

Что такое ThePresentation.ru?

Генерация вероятностных автоматов методами Reinforcement Learning презентация

Содержание

Слайд 1Генерация вероятностных автоматов методами Reinforcement LearningВыполнил: Иринёв

Слайд 2Стимулирующее обучение

Слайд 3Вероятностные автоматыМоделирование сложных систем, имеющих стохастическую природуПостроение мобильных агентов

Слайд 4Обучение автоматаДействиеПроверка «слабого условия»Перераспределение вероятностей

Слайд 5Применение стимулирующего обученияРаботать непосредственно с вероятностной моделью непрактичноГенерация автоматной модели

Слайд 6Q-learning: статические задачиОбучение Q-функцииПорождение оптимальной стратегии

Слайд 7Q-learning: стохастические системыОбучение Q-функцииПодсчёт вероятностей переходовСжатие вероятностной модели

Слайд 8Пример задачи на двумерном полеКлетка поля определяет текущее состояние мобильного роботаЧетыре

Слайд 9Тестовый пример

Слайд 10Сжатие автоматной модели

Слайд 11ВыводыНепосредственное обучение вероятностной модели непрактичноПредложенный подход позволяет решать задачи оптимизации для

Похожие презентации

Обратная связь

Что такое ThePresentation.ru?

Слайд 1Генерация вероятностных автоматов методами Reinforcement Learning
Выполнил: Иринёв

Слайд 2
Стимулирующее обучение

Слайд 3Вероятностные автоматы
Моделирование сложных систем, имеющих стохастическую природу
Построение мобильных агентов

Слайд 4Обучение автомата
Действие

Проверка «слабого условия»

Перераспределение вероятностей

Слайд 5Применение стимулирующего обучения
Работать непосредственно с вероятностной моделью непрактично
Генерация автоматной модели

Слайд 6Q-learning: статические задачи

Обучение Q-функции

Порождение оптимальной стратегии

Слайд 7Q-learning: стохастические системы
Обучение Q-функции

Подсчёт вероятностей переходов

Сжатие вероятностной модели

Слайд 8Пример задачи на двумерном поле
Клетка поля определяет текущее состояние мобильного робота
Четыре

Слайд 11Выводы
Непосредственное обучение вероятностной модели непрактично
Предложенный подход позволяет решать задачи оптимизации для