Пояснительная записка 45 с., 29 рис., 1 табл., 7 источников, 2 прил.
Целью данного дипломного проекта является разработка метода бинарной классификации.
В качестве объекта исследования был выбран алгоритм метода опорных векторов.
В дипломном проекте выполнены следующие задачи:
- исследование особенностей существующих аналогов;
- разработаны требования к системе;
- проведен анализ и выбор языков программирования и средств разработки;
- реализованы данные для обучения и распознавания;
- реализовано обучение на данных для обучения;
- проведено тестирование разработанной системы.
Для реализации дипломного проекта было выбранно IDE PyCharm, язык программирования Python.
ВВЕДЕНИЕ.......................................................................................................... 3
1 ПОСТАНОВКА ЗАДАЧИ................................................................................. 5
1.1 Необходимый функционал проекта................................................................ 5
1.2 Системные требования для работы программы............................................. 5
2 ОБОСНОВАНИЕ ЦЕЛЕСООБРАЗНОСТИ РАЗРАБОТКИ АЛГОРИТМОВ БИНАРНОЙ КЛАССИФИКАЦИИ .............................................................................................. 6
2.1 Суть технической проблемы бинарной классификации................................. 6
2.2 Эффективность внедрения бинарной классификации.................................... 6
2.3 Анализ существующих алгоритмов бинарной классификации...................... 9
2.3.1 «Случайный лес»....................................................................................... 10
2.3.2 Градиентный бустинг деревьев решений.................................................. 12
2.3.3 Байесовский классификатор...................................................................... 12
2.3.4 Дискриминантный анализ.......................................................................... 14
2.3.5 Логистическая регрессия........................................................................... 14
2.3.6 Метод опорных векторов........................................................................... 16
3 ОБОСНОВАНИЕ ВЫБОРА СРЕДСТВ РАЗРАБОТКИ СИСТЕМЫ.............. 18
3.1 Анализ и обоснование выбора языка программирования Python................. 18
3.2 Анализ и обоснование выбоа среды разработки PyCharm........................... 19
3.3 Обоснование выбора готовых модулей в Python.......................................... 20
3.3.1 Matplotlib................................................................................................... 20
3.3.2 NumPy........................................................................................................ 21
3.3.3 Pandas......................................................................................................... 21
3.3.4 Sklearn........................................................................................................ 22
4 РАЗРАБОТКА И РЕАЛИЗАЦИЯ МЕТОДА ОПОРНЫХ ВЕКТОРОВ....................... 23
5 ТЕСТИРОВАНИЕ МЕТОДА ОПОРНЫХ ВЕКТОРОВ.................................. 30
ЗАКЛЮЧЕНИЕ.................................................................................................. 36
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ................................................. 37
Приложение А ТЕХНИЧЕСКОЕ ЗАДАНИЕ..................................................... 38
Приложение Г ЛИСТИНГ ПРОГРАММЫ......................................................... 39
1. Журавлёв, Ю.И. Распознавание. Классификация. Прогноз. Математические методы и их применение. / Ю.И. Журавлёв – Вып.2. – М. : Наука, 1989. – 163 с.
2. Колесников, С. Распознавание образов. Общие сведения / С. Колесников // Сайт газеты «Компьютер-Информ» [Электронный ресурс]. – Режим доступа : http://www.ci.ru/inform03_06/p_24.htm
3. Бидюк, П.И. Построение и методы обучения байесовских сетей / П.И. Бидюк, А.Н. Терентьев // Информатика и кибернетика. 2004. № 2. С. 140-154. 2.
4. Breiman, W. “Random Forests”/ Machine Learning. 45(1). 2001. Р. 5-32. 3.
5. Васильев, Н.П. Опыт расчета параметров логистической регрессии методом НьютонаРафсона для оценки зимостойкости растений / Н.П. Васильев, А.А. Егоров // Математическая биология и биоинформатика. 2011. Т. 6, № 2. С. 190-199. 4.
6. Клячкин, В.Н. Сравнительный анализ точности нелинейных моделей при прогнозировании состояния системы на основе марковской цепи / В.Н. Клячкин, Ю.С. Донцова // Известия Самарского научного центра РАН. 2013. Т. 15, № 4(4). С. 924-927.
7. Метод опорных векторов [Электронный ресурс]. – Режим доступа : https://ru.wikipedia.org/wiki/Метод_опорных_векторов