Интеллектуальная система выбора действий противника в пошаговой настольной игре

Раздел
Программирование
Просмотров
32
Покупок
0
Антиплагиат
Не указан
Размещена
11 Сен в 00:34
ВУЗ
Не указан
Курс
4 курс
Стоимость
1 000 ₽
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
docx
Интеллектуальная система выбора действий противника в пошаговой настольной игре
1.7 Мбайт 1 000 ₽
Описание

Актуальность выпускной квалификационной работы заключается в том, что до сих пор не существует универсальной интеллектуальной системы, способной принимать решения в любых пошаговых играх с полной информацией. Наиболее способной интеллектуальной системой на данный момент является MuZero, разработанная компанией Google DeepMind [1]. Универсальность этой системы заключается в том, что в ее основе лежат нейронные сети, которые принимают на вход изображение с экрана. Однако, в силу того, что в экземпляре системы MuZero существует только один агент, она тестировалась и демонстрировала хорошие результаты только на однопользовательских (Atari) и симметричных (шашки, шахматы, го) играх. Внимание в данной работе сфокусировано на универсальном подходе к взаимодействию с любыми пошаговыми играми с полной информацией, независимо от характера игровых методик.

Практическая значимость работы заключается в том, что пошаговые игры в контексте работы - конкретная область применения интеллектуальной системы, которую, в случае успеха разработки, можно расширить. К примеру, вышеупомянутая MuZero после успешного окончания разработки была внедрена в работу команды DeepMind, разрабатывающей алгоритмы сжатия видео. Поскольку разработанная интеллектуальная система имеет структуру, отличную от структуры MuZero, и использует в работе другие алгоритмы, есть возможность использовать ее для решения других задач, которые можно описать как математическую модель с механикой пошагового принятия решений.

Целью выпускной квалификационной работы является разработка и реализация интеллектуальной системы, способной принимать решения в любых пошаговых играх (однопользовательских и многопользовательских, симметричных и асимметричных) с полной информацией. Система должна уметь обучаться на предоставленных играх, за счет этого увеличивая свою эффективность.

Поставленная цель определяет следующие задачи:

1)              разработать универсальный подход к представлению пошаговой игры как математической модели;

2)              реализовать несколько разных игр на основе разработанного

подхода;

3)              разработать прототип интеллектуальной системы, способный

корректно взаимодействовать с любой игрой, соответствующей разработанной математической модели;

4)              разработать несколько вариантов структуры алгоритма принятия решений для прототипа интеллектуальной системы;

5)              протестировать интеллектуальные системы с разными структурами на разных играх;

6)                                      проанализировать и сравнить результаты тестирования;

7)              при необходимости произвести улучшения наиболее эффективных вариантов структуры для большего улучшения эффективности.

Для разработки игр и интеллектуальной системы, а также для их тестирования использовался язык программирования Python и его модули:

—         numpy,

—         random,

—         copy,

—         pygame,

—         torch,

—         matplotlib [2].

Оглавление

ВВЕДЕНИЕ 3

1. Реализация игр 5

2. Реализация прототипа интеллектуальной системы 7

3. Алгоритмы вспомогательных функций агента 10

3.1. Выбор действия 10

3.2. Заполнение памяти 11

3.3. Обучение 13

3.4. Тестирование 14

3.5. Тестирование в процессе обучения 14

4. Выбор архитектуры 16

5. Actor-Critic 17

6. Advantage Actor-Critic 20

7. Proximal Policy Optimization 23

8. Взаимодействие агентов друг с другом 25

ЗАКЛЮЧЕНИЕ 28

СПИСОК ЛИТЕРАТУРЫ 33

ПРИЛОЖЕНИЕ 34

Список литературы

1)               Schrittwieser, J. Mastering Atari, Go, Chess and Shogi by Planning with a Learned Model [Текст] / J. Schrittwieser, I. Antonoglou, T. Hubert, K. Simonyan, L. Sifre, S. Schmitt, A. Guez, E. Lockhart, D. Hassabis, T. Graepel, T. Lillicrap, D. Silver - Лондон: DeepMind, 2020. - 21 с.

2)               Python 3.12.2 Documentation : сайт. - Харлем, 2001. - URL: https://docs.python.org (дата обращения: 28.02.2024).

3)               Данилов В.И. Лекции по теории игр : учебное пособие / В.И. Данилов. - Москва : Российская экономическая школа, 2002. - 140 с.

4)               Miller J. Complex Adaptive Systems: учебное пособие / J. Miller, S. Page. - Princeton : Princeton University Press, 2007. - 288 с.

5)               Минский М.Л. Персептроны : учебное пособие / М.Л. Минский, С. Пейперт. - Москва : Мир, 1971. - 261 с.

6)               Nielsen M. Neural Networks and Deep Learning : учебное пособие / M. Nielsen. - Berkeley : Astera Institute, 2017. - 224 с.

7)               Francois-Lavet V. An Introduction to Deep Reinforcement Learning / V. Francois-Lavet, P. Henderson, R. Islam, M.G. Bellemare, J. Pineau. - Boston : Delft, 2018. 140 c.

8)               Konda V.R. Actor-Critic Algorithms / V.R. Konda, J.N. Tsitsiklis.

Cambridge : Massachusetts Institute of Technology, 2001. - 9 c.

9)               Introduction to Advantage Actor-Critic method (A2C) : сайт. -

Вильнюс, 2020. - URL: https://pylessons.com/A2C-reinforcement-learning (дата обращения: 2.05.2024).

10)          Schulman J. Proximal Policy Optimization Algorithms / J. Schulman, F. Wolski, P. Dhariwal, A. Radford, O. Klimov. - San Francisco: OpenAI, 2017. - 12 c.

11)          Lowe R. Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments / R. Lowe, Y. Wu, A. Tamar, J. Harb, P. Abbeel, I. Mordatch. - Monreal : McGill University, 2020. - 16 c.

Вам подходит эта работа?
Похожие работы
Web-программирование
Контрольная работа Контрольная
18 Ноя в 01:11
12
0 покупок
Web-программирование
Контрольная работа Контрольная
17 Ноя в 09:15
12
0 покупок
Web-программирование
Задача Задача
4 Ноя в 15:20
22
0 покупок
Web-программирование
Тест Тест
31 Окт в 23:24
34
0 покупок
Другие работы автора
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:40
63
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:27
59
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:19
38
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 09:47
43
0 покупок
Web-программирование
Дипломная работа Дипломная
19 Сен в 19:29
49
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 22:46
49
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 21:15
44
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 20:58
50
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 22:41
43
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:50
42
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:48
32
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:08
43
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 23:51
37
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 22:49
33
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 11:21
58
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 00:29
63
0 покупок
Web-программирование
Дипломная работа Дипломная
12 Сен в 00:40
42
0 покупок
Web-программирование
Дипломная работа Дипломная
11 Сен в 23:24
42
0 покупок
Web-программирование
Дипломная работа Дипломная
11 Сен в 10:31
62
0 покупок
Темы журнала
Показать ещё
Прямой эфир