17857 В контрольная

Отменен
Заказ
6335725
Раздел
Программирование
Предмет
Python
Антиплагиат
Не указан
Срок сдачи
7 Ноя 2024 в 23:55
Цена
Договорная
Блокировка
15 дней
Размещен
5 Ноя 2024 в 11:13
Просмотров
59
Описание работы

Python язык

работы:

После лекции 4 и практического занятия 4 требуется выполнить три домашних задания:

Срок:

07-11-2024

Примечание:

После лекции 4 и практического занятия 4 требуется выполнить три домашних задания: Реализовать Q-Learning и сравнить его результаты с реализованными ранее алгоритмами: Cross-Entropy, Monte Carlo, SARSA в задаче Taxi-v3. Для сравнения как минимум нужно использовать графики обучения. Причем графики лучше делать относительно количества сгенерированных траекторий. Дискретизировать (можно использовать numpy.round()) пространство состояний и обучить Агента решать CartPole-v1, Acrobot-v1, MountainCar-v0, или LunarLander-v2 (одну на выбор) методами Monte Carlo, SARSA и Q-Learning. 

Сравнить результаты этих алгоритмов и реализованного ранее алгоритма Deep Cross-Entropy на графиках. Придумать стратегию для выбора epsilon позволяющую агенту наилучшим образом решать Taxi-v3 алгоритмом Monte Carlo. Оформление Код каждого задания следует выполнить в отдельном .py файле с названием "(фамилия)_practice4_(номер задания).py". Результаты всех исследований по заданиям 1-3 следует оформить в отчет в виде одного .pdf файла с названием "(фамилия)_practice4.pdf". Отчеты оформляются в произвольной форме, однако должны содержать оглавление, описание экспериментов, результаты экспериментов проиллюстрированные в виде графиков обучения (ось x - количество итераций обучения, ось y - результаты обучения), вывод. Все файлы кладутся в папку с названием "(фамилия)_practice4" и предоставляется возможность скачать эту папке по ссылке (google.drive, yandex.disk и пр.). Задания отправляются в форме ниже в формате: Фамилия Имя Отчество Домашняя работа 4 - (ссылка на папку (фамилия)_practice4) НУЖЕН И отчет и все, о чем просит учитель

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир