Интеллектуальная система выбора действий противника в пошаговой настольной игре

Главная

Магазин

Дипломная работа

Web-программирование

Интеллектуальная система выбора действий противника в пошаговой настольной игре

ksfei121

Был(а) на сайте 8 часов назад

Раздел

Программирование

Предмет

Web-программирование

Тип

Дипломная работа

Просмотров

Покупок

Антиплагиат

Не указан

Размещена

11 Сен 2024 в 00:34

ВУЗ

Не указан

Курс

4 курс

Стоимость

1 000 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

Интеллектуальная система выбора действий противника в пошаговой настольной игре

1.7 Мбайт 1 000 ₽

Описание

Актуальность выпускной квалификационной работы заключается в том, что до сих пор не существует универсальной интеллектуальной системы, способной принимать решения в любых пошаговых играх с полной информацией. Наиболее способной интеллектуальной системой на данный момент является MuZero, разработанная компанией Google DeepMind [1]. Универсальность этой системы заключается в том, что в ее основе лежат нейронные сети, которые принимают на вход изображение с экрана. Однако, в силу того, что в экземпляре системы MuZero существует только один агент, она тестировалась и демонстрировала хорошие результаты только на однопользовательских (Atari) и симметричных (шашки, шахматы, го) играх. Внимание в данной работе сфокусировано на универсальном подходе к взаимодействию с любыми пошаговыми играми с полной информацией, независимо от характера игровых методик.

Практическая значимость работы заключается в том, что пошаговые игры в контексте работы - конкретная область применения интеллектуальной системы, которую, в случае успеха разработки, можно расширить. К примеру, вышеупомянутая MuZero после успешного окончания разработки была внедрена в работу команды DeepMind, разрабатывающей алгоритмы сжатия видео. Поскольку разработанная интеллектуальная система имеет структуру, отличную от структуры MuZero, и использует в работе другие алгоритмы, есть возможность использовать ее для решения других задач, которые можно описать как математическую модель с механикой пошагового принятия решений.

Целью выпускной квалификационной работы является разработка и реализация интеллектуальной системы, способной принимать решения в любых пошаговых играх (однопользовательских и многопользовательских, симметричных и асимметричных) с полной информацией. Система должна уметь обучаться на предоставленных играх, за счет этого увеличивая свою эффективность.

Поставленная цель определяет следующие задачи:

1) разработать универсальный подход к представлению пошаговой игры как математической модели;

2) реализовать несколько разных игр на основе разработанного

подхода;

3) разработать прототип интеллектуальной системы, способный

корректно взаимодействовать с любой игрой, соответствующей разработанной математической модели;

4) разработать несколько вариантов структуры алгоритма принятия решений для прототипа интеллектуальной системы;

5) протестировать интеллектуальные системы с разными структурами на разных играх;

6) проанализировать и сравнить результаты тестирования;

7) при необходимости произвести улучшения наиболее эффективных вариантов структуры для большего улучшения эффективности.

Для разработки игр и интеллектуальной системы, а также для их тестирования использовался язык программирования Python и его модули:

— numpy,

— random,

— copy,

— pygame,

— torch,

— matplotlib [2].

Оглавление

ВВЕДЕНИЕ 3

1. Реализация игр 5

2. Реализация прототипа интеллектуальной системы 7

3. Алгоритмы вспомогательных функций агента 10

3.1. Выбор действия 10

3.2. Заполнение памяти 11

3.3. Обучение 13

3.4. Тестирование 14

3.5. Тестирование в процессе обучения 14

4. Выбор архитектуры 16

5. Actor-Critic 17

6. Advantage Actor-Critic 20

7. Proximal Policy Optimization 23

8. Взаимодействие агентов друг с другом 25

ЗАКЛЮЧЕНИЕ 28

СПИСОК ЛИТЕРАТУРЫ 33

ПРИЛОЖЕНИЕ 34

Список литературы

1) Schrittwieser, J. Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model [Текст] / J. Schrittwieser, I. Antonoglou, T. Hubert, K. Simonyan, L. Sifre, S. Schmitt, A. Guez, E. Lockhart, D. Hassabis, T. Graepel, T. Lillicrap, D. Silver - Лондон: DeepMind, 2020. - 21 с.

2) Python 3.12.2 Documentation : сайт. - Харлем, 2001. - URL: https://docs.python.org (дата обращения: 28.02.2024).

3) Данилов В.И. Лекции по теории игр : учебное пособие / В.И. Данилов. - Москва : Российская экономическая школа, 2002. - 140 с.

4) Miller J. Complex Adaptive Systems: учебное пособие / J. Miller, S. Page. - Princeton : Princeton University Press, 2007. - 288 с.

5) Минский М.Л. Персептроны : учебное пособие / М.Л. Минский, С. Пейперт. - Москва : Мир, 1971. - 261 с.

6) Nielsen M. Neural Networks and Deep Learning : учебное пособие / M. Nielsen. - Berkeley : Astera Institute, 2017. - 224 с.

7) Francois-Lavet V. An Introduction to Deep Reinforcement Learning / V. Francois-Lavet, P. Henderson, R. Islam, M.G. Bellemare, J. Pineau. - Boston : Delft, 2018. 140 c.

8) Konda V.R. Actor-Critic Algorithms / V.R. Konda, J.N. Tsitsiklis.

Cambridge : Massachusetts Institute of Technology, 2001. - 9 c.

9) Introduction to Advantage Actor-Critic method (A2C) : сайт. -

Вильнюс, 2020. - URL: https://pylessons.com/A2C-reinforcement-learning (дата обращения: 2.05.2024).

10) Schulman J. Proximal Policy Optimization Algorithms / J. Schulman, F. Wolski, P. Dhariwal, A. Radford, O. Klimov. - San Francisco: OpenAI, 2017. - 12 c.

11) Lowe R. Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments / R. Lowe, Y. Wu, A. Tamar, J. Harb, P. Abbeel, I. Mordatch. - Monreal : McGill University, 2020. - 16 c.

Вам подходит эта работа?

Похожие работы

Web-программирование

Производственная практика (практика в ИТ-сфере)

2 200 ₽

user757966

Задача Задача

30 Янв в 11:56

19 +4

0 покупок

Web-программирование

Моделирование и анализ программного обеспечения (Итоговый тест)

198 ₽

ИнфоСтрим

Тест Тест

27 Янв в 14:21

22 +1

0 покупок

Web-программирование

Практическая работа. Функциональное программирование

1 500 ₽

user757966

Контрольная работа Контрольная

25 Янв в 23:25

0 покупок

Web-программирование

Практическая работа. Введение в программную инженерию

516 ₽

user757966

Контрольная работа Контрольная

25 Янв в 23:04

0 покупок

Web-программирование

Разработка распределенных приложений на .Net (ДотНет)

1 000 ₽

user636925

Тест Тест

1 Янв в 14:55

49 +1

0 покупок

Другие работы автора

Web-программирование

Веб-приложение для итальянского винного дома «Poggio Amorelli» с помощью SaaS-приложения Webflow

1 000 ₽

ksfei121

Дипломная работа Дипломная

20 Сен 2024 в 10:40

138 +1

0 покупок

Web-программирование

Разработка web-приложения для изучения английского языка на платформе ASP.NET Core

1 000 ₽

ksfei121

Дипломная работа Дипломная

20 Сен 2024 в 10:27

118

0 покупок

Web-программирование

Приложение для распознавания и интерпретации жестовых коммуникаций и их перевод в текстовую форму

1 000 ₽

ksfei121

Дипломная работа Дипломная

20 Сен 2024 в 10:19

81 +3

0 покупок

Web-программирование

Разработка веб-сайта «Цифровой гид по достопримечательностям Казани»

1 000 ₽

ksfei121

Дипломная работа Дипломная

20 Сен 2024 в 09:47

0 покупок

Web-программирование

Улучшение качества изображения на языке Python

1 000 ₽

ksfei121

Дипломная работа Дипломная

19 Сен 2024 в 19:29

0 покупок

Web-программирование

Разработка веб-приложения Quiz с помощью ASP.NET Core MVC

1 000 ₽

ksfei121

Дипломная работа Дипломная

17 Сен 2024 в 22:46

0 покупок

Web-программирование

Разработка и реализация сайта новостей в сфере информационных технологий

1 000 ₽

ksfei121

Дипломная работа Дипломная

17 Сен 2024 в 21:15

83 +1

1 покупка

Web-программирование

Разработка системы для анализа и оптимизации торговых стратегий на фондовом рынке

1 000 ₽

ksfei121

Дипломная работа Дипломная

17 Сен 2024 в 20:58

85 +1

0 покупок

Web-программирование

Исследование методов атак на алгоритм RSA

1 000 ₽

ksfei121

Дипломная работа Дипломная

14 Сен 2024 в 22:41

0 покупок

Web-программирование

Методы защиты от атак уклонением на алгоритмы машинного обучения

1 000 ₽

ksfei121

Дипломная работа Дипломная

14 Сен 2024 в 21:50

82 +1

0 покупок

Web-программирование

Разработка веб-приложения менеджера проектов

1 200 ₽

ksfei121

Дипломная работа Дипломная

14 Сен 2024 в 21:48

0 покупок

Web-программирование

Метод регуляризации нейронной сети Vision Transformer

1 000 ₽

ksfei121

Дипломная работа Дипломная

14 Сен 2024 в 21:08

0 покупок

Web-программирование

Разработка приложения для расчета гидродинамики газопроводов

1 000 ₽

ksfei121

Дипломная работа Дипломная

13 Сен 2024 в 23:51

0 покупок

Web-программирование

Разработка аудиостока для продажи звуковых файлов

1 000 ₽

ksfei121

Дипломная работа Дипломная

13 Сен 2024 в 22:49

0 покупок

Web-программирование

Разработка мобильного приложения "диктофон" для OS Android

1 000 ₽

ksfei121

Дипломная работа Дипломная

13 Сен 2024 в 11:21

106 +1

0 покупок

Web-программирование

Приложение аутентификации на основе распознавания голоса в дошкольных учреждениях

1 000 ₽

ksfei121

Дипломная работа Дипломная

13 Сен 2024 в 00:29

128

0 покупок

Web-программирование

Мобильное приложение с элементами дополненной реальности для сказки "Су анасы"

1 000 ₽

ksfei121

Дипломная работа Дипломная

12 Сен 2024 в 00:40

73 +1

0 покупок

Web-программирование

Разработка мобильного приложения для распознавания текста с помощью сверточно-рекуррентной нейронной сети

1 000 ₽

ksfei121

Дипломная работа Дипломная

12 Сен 2024 в 00:12

73 +1

0 покупок

Web-программирование

Разработка обучающей игры для студентов юристов

1 000 ₽

ksfei121

Дипломная работа Дипломная

11 Сен 2024 в 23:24

0 покупок

Web-программирование

Разработка программного обеспечения по обработке изображений методами машинного зрения

1 000 ₽

ksfei121

Дипломная работа Дипломная

11 Сен 2024 в 10:31

131 +1

0 покупок

Предыдущая работа

Веб-приложение на основе Blazor для организаторов мероприятий в студенческих общежитиях

Следующая работа

3Д модель ADEM

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир