Оригинальность по АП.Вуз на 26 февраля 2023 года более 70%.
Оригинал документа в pdf, конвертация в Word автоматическая (в word могут быть недочеты, которые вы легко исправите самостоятельно).
Настоящее исследование затрагивает вопросы разработки
информационной системы онлайн-курсов, а также возможности применения в
ней современных методов анализа активности пользователей, в частности для
расчёта успеваемости студентов. В данной работе описывается техническое
задание по разработке модели информационной системы на основе UML.
Также проводится обзор выскоуровневого языка графического описания UML:
изучается то, какие строительные блоки в нём присутствуют, и как их следует
применять; анализируются общие механизмы действия. Далее выполняется
практическая часть диплома в виде построения одиннадцати диаграмм и
архитектуры информационной системы интернет-портала онлайн-
образования: 4 диаграммы вариантов использования, 4 диаграммы классов и 3
диаграммы последовательности действий для отдельно взятых вариантов
использования. Во второй части работы разбираются методы машинного
обучения и способы их применения для решения практических задач.
Проводятся исследования с применением разведочного анализа данных
(exploratory data analysis) и методов машинного обучения.
В настоящее время, с развитием IT сферы, многие рутинные и
организационные процессы плавно модернизируются. Это касается и системы
образования, где с каждым годом начинают применять более новые подходы к
способам преподнесения знаний, а также их проверки. В высших учебных
заведениях уже применяют телекоммуникационные учебно-информационные
системы (ТУИС) для размещения материалов и сбора лабораторных работ. Однако в
ближайшей перспективе возможен частичны или даже полный переход обучения в
онлайн-формат. Для осуществления этого процесса придётся разрабатывать
множество информационных систем (ИС), построение которых невозможно без
системного подхода к проектированию. Для этих целей хорошо подходит UML
(Unified Modeling Language).
UML – это унифицированный графический язык моделирования для
описания, визуализации, проектирования и документирования ОО (объектно-
ориентированных) систем [1]. ULM служит для поддержки процессов
моделирования ПС (программных систем) на основе ОО подхода, организовывать
взаимосвязь концептуальных и программных понятий, отражать проблемы
масштабирования сложных систем. Модели на UML используются на всех этапах
жизненного цикла ПС, начиная с бизнес-анализа и заканчивая сопровождением
системы. Разные организации могут применять UML по своему усмотрению в
зависимости от своих проблемных областей и используемых технологий.
Одним из дополнительных и информативных компонентов онлайн-систем
является модуль по анализу активности пользователей с применением машинного
обучения для последующего использования полученной информации при
оптимизации различных процессов.
Актуальность темы
Актуальность задачи заключается в возросшей необходимости разработки
средств онлайн-образования в связи со сложившейся в мире сложной
эпидемиологической обстановкой, из-за которой достаточно внушительная часть студентов утратила возможность проходить очное обучение непосредственно в
учебном заведении.
Также увеличились интерес и спрос на прохождении курсов по освоению
современных профессий от коммерческих организаций, предоставляющих услуги в
сфере онлайн-образования, по типу Coursera, Skill Box, Geek Brains, Нетология и т.п.
Цель работы
Данная дипломная работа посвящена решению современной задачи по
разработке ИС интернет-портала онлайн-образования и анализу активности её
пользователей с целью выявления закономерностей их поведения.
Методы исследования
В данной дипломной работе для решения задачи анализа активностей
пользователей интернет-портала применяются методы EDA и машинного обучения
с учителем.
В качестве источников информации использовалась российская и зарубежная
научная периодика, а также ресурсы сети интернет.
Структура работы
В первой главе дана постановка задачи разработки ИС и анализа активности
пользователей ИС, выполнен обзор языка UML и разработаны основные диаграммы.
Во второй главе исследованы и формально описаны современные методы
машинного обучения для решения задачи анализа активности пользователей
информационной системы.
В третьей главе предложены методы и алгоритмы решения задачи
поставленной задачи.
В четвертой главе исследуются практические вопросы решения задачи,
проводятся экспериментальные исследования.
Список сокращений ....................................................................................................................... 3
Введение ......................................................................................................................................... 4
1 Постановка задачи и методы разработки информационных системы ............................. 6
1.1 Постановка задачи разработки информационной системы ........................................ 6
Техническое задание ............................................................................................................. 6
1.2 Постановка задачи анализа активностей пользователя ............................................... 8
1.3 Обзор и исследование языка моделирования UML для разработки
информационных систем .......................................................................................................... 9
Строительные блоки UML .................................................................................................... 9
Разработка диаграмм для информационной системы онлайн-образования .................. 15
2 Современные методы машинного обучения и их применение для решения поставленной
задачи ............................................................................................................................................ 25
2.1 Обзор современных методов машинного обучения ....................................................... 25
Методы машинного обучения ............................................................................................ 28
2.2 Применение методов машинного обучения для анализа активностей пользователя . 32
2.3. Аналитическое сравнение изученных методов и основные выводы ........................... 32
3 Разработка методов анализа активностей пользователя ....................................................... 38
4 Практическое исследование решения задачи анализа активностей пользователя ............. 39
4.1 Исходные данные и их предобработка ............................................................................ 39
4.2 Описание экспериментальных исследований ................................................................. 48
Расчёт потенциальной нагрузки на преподавателей ........................................................ 48
Выявление проблемных модулей ....................................................................................... 53
Метрика успеваемости ........................................................................................................ 57
Разведочный анализ данных ............................................................................................... 60
Применение методов машинного обучения ...................................................................... 66
4.3 Основные полученные результаты и сравнение с известными подходами ................. 69
Заключение ................................................................................................................................... 69
Список литературы ...................................................................................................................... 70
1. Якобсон А., Буч Г., Рамбо Дж. Унифицированный процесс разработки
программного обеспечения. – СПб.: Питер, 2002. – 496 с.
2. Мартин Фаулер. UML. Основы. Краткое руководство по стандартному
языку объектного моделирования. 3-е издание. – М.: Символ-Плюс, 2013. – 192 с.
3. Якобсон А., Буч Г., Рамбо Дж. Краткая история UML // Язык UML.
Руководство пользователя = The Unified Modeling Language Usere Guide. 2-е. – М.:
ДМК Пресс, 2006. – 496 с
4. Rational and UML Partners. UML Specification version 1.1 (OMG
document ad/97-08-11) – URL: https://www.omg.org/cgi-bin/doc?ad/97-08-11
5. Кватрани Т. Rational Rose 2000 и UML. Визуальное моделирование:
Пер. с англ. – М.: ДМК Пресс, 2013. – 176 с.
6. Леоненков А. В. Нотация и семантика языка UML / Леоненков А. В. 2-е
изд., исправ. – М.: Национальный Открытый Университет «ИНТУИТ», 2016. –
205 с. – Режим доступа: http://biblioclub.ru/index.php?page=book&id=429143,
свободный.
7. Леоненков А. В. Самоучитель UML 2. – СПб.: БХВ-Петербург, 2007. –
576 с.
8. Джозеф Шмуллер. Освой самостоятельно UML за 24 часа. 3-е издание.:
Пер. с англ. – М.: Издательский дом «Вильямс», 2005. – 416 с.
9. Рамбо Дж., Блаха М. UML 2.0. Объектно-ориентированное
моделирование и разработка. 2-е издание – СПб.: Питер, 2007. – 544 с.
10. Крэг Ларман. Применение UML 2.0 и шаблонов проектирования.
Практическое руководство. 3-е издание.: Пер. с англ. – М.: Издательский дом
«Вильямс», 2013. – 736 с.
11. Рашка С. Python и машинное обучение. / пер. с англ. А.В. Логунова. –
М.: ДМК Пресс, 2017. – 418 с.
12. Вайолино Боб. Машинное обучение: методы и способы. // Директор
информационной службы, 2018. – № 5 – Режим доступа:
https://www.osp.ru/cio/2018/05/13054535, свободный. (Дата обращения:
10.04.2022).
13. Rudolph Russell. Machine Learning: Step-by-Step Guide to Implement
Machine Learning Algorithms with Python. – CreateSpace Independent Publishing
Platform, 2018. – 106 c.
14. Дейтел Пол, Дейтел Харви. Python: Искусственный интеллект, большие
данные и облачные вычисления. — СПб.: Питер, 2020. — 864 с.: ил. — (Серия
«Для профессионалов»)
15. Вьюгин В.В. Математические основы теории машинного обучения и
прогнозирования. – М.: МЦНМО, 2013. — 387 с.
16. Nello Cristianini, John Shawe-Taylor. An Introduction to Support Vector
Machines and Other Kernel-based Learning Methods. — Cambridge University Press,
2000. – 204 с.
17. Juliana Tolles, William J. Meurer. Logistic Regression: Relating Patient
Characteristics to Outcomes. // JAMA, 2016. – Т. 316, № 5. – С. 533-534.
18. Карякина А. А., Мельников А. В. Сравнение моделей прогнозирования
оттока клиентов интернет-провайдеров // Машинное обучение и анализ данных,
2017. – T. 3, № 4. – C. 250-256.
19. Сапегин С. В. Моделирование и оптимизация цифровых сетей передачи
данных в САПР информационно-телекоммуникационных систем: дис. … канд.
техн. наук: 05.13.12. - Воронеж, 2002. - 162 с.
20. Двоеглазов А.И. Компьютерное моделирование систем управления пучками
заряженных частиц: дис. ... канд. физико-математических наук: 05.13.18. – СПб.,
2001. – 140 с.
21. Болдырев Е.А. Моделирование и разработка расширяемого программного
комплекса для исследований проблемы энергетической безопасности: дис. ...
канд. техн. наук: 05.13.18. – Иркутск, 2002. – 152 с.
22. Буч Г., Рамбо Дж., Якобсон И. Введение в UML от создателей языка; Пер. с англ.
Н. Мухин. – 2-е изд. – М.: ДМК Пресс, 2010. - 496 с.
23. Конюхова О.В. Графический пользовательский интерфейс для
автоматизированных систем раскроя изделий сложной формы: дис. ... канд. техн.
наук: 05.13.06. - Орел, 2006. - 170 с.
24. Сотникова А.А. Модульно-структурные средства сбора, обработки и анализа
данных в области лечебной профилактики: дис. ... канд. техн. наук: 05.13.17 /
Сотникова А. А.; [Место защиты: Пенз. гос. технол. акад.]. – Пенза, 2012. – 169 с.
25. Черняховская Л.Р. Поддержка принятия решений при управлении сложными
объектами в критических ситуациях на основе инженерии знаний: дис. ... док.
техн. наук: 05.13.01. – Уфа, 2004. – 380 с.
26. Кузнецов М.Б. Трансформация программных моделей и ее применение в
технологии MDA: дис. ... канд. физико-математических наук: 05.13.11. – М., 2005.
– 136 с.
27. Нуртдинова Э.Э. Интегрированная система информационного обеспечения как
фактор повышения эффективности предпринимательской деятельности: дис. ...
канд. эконом. наук: 08.00.05. – Уфа, 2015. – 176 с.
28. Торжков И. О. Механизм стратегического управления предприятиями лесного
комплекса: дис. ... канд. эконом. наук: 08.00.05 / Торжков И.О.; [Место защиты:
Юго-Зап. гос. ун-т]. – Воронеж, 2018. – 211 с.