Тема дипломной работы: Сравнение вероятностных характеристик алгоритмов бинарной классификации
Пояснительная записка 45 с., 29 рис., 1 табл., 7 источников, 2 прил.
Целью данного дипломного проекта является разработка метода бинарной классификации.
В качестве объекта исследования был выбран алгоритм метода опорных векторов.
В дипломном проекте выполнены следующие задачи:
- исследование особенностей существующих аналогов;
- разработаны требования к системе;
- проведенанализ и выборязыковпрограммирования и средствразработки;
- реализованы данные для обучения и распознавания;
- реализовано обучение на данных для обучения;
- проведено тестирование разработанной системы.
Для реализации дипломного проекта было выбранноIDEPyCharm,языкпрограммированияPython.
ВВЕДЕНИЕ..................................................................................................... 3
1 ПОСТАНОВКА ЗАДАЧИ........................................................................... 5
1.1 Необходимый функционал проекта......................................................... 5
1.2 Системные требования для работы программы...................................... 5
2 ОБОСНОВАНИЕ ЦЕЛЕСООБРАЗНОСТИ РАЗРАБОТКИ АЛГОРИТМОВ БИНАРНОЙ КЛАССИФИКАЦИИ........................................................... 6
2.1 Суть технической проблемыбинарной классификации........................... 6
2.2 Эффективность внедрения бинарной классификации............................. 6
2.3 Анализ существующих алгоритмов бинарной классификации............... 9
2.3.1 «Случайный лес».................................................................................. 10
2.3.2 Градиентный бустинг деревьев решений............................................ 12
2.3.3 Байесовский классификатор................................................................. 12
2.3.4 Дискриминантный анализ.................................................................... 14
2.3.5 Логистическая регрессия..................................................................... 14
2.3.6Метод опорных векторов...................................................................... 16
3 ОБОСНОВАНИЕ ВЫБОРА СРЕДСТВ РАЗРАБОТКИ СИСТЕМЫ....... 18
3.1 Анализ и обоснование выбора языка программирования Python......... 18
3.2 Анализ и обоснование выбоа среды разработки PyCharm.................... 19
3.3 Обоснование выбора готовых модулей в Python.................................. 20
3.3.1 Matplotlib............................................................................................... 20
3.3.2 NumPy................................................................................................... 21
3.3.3 Pandas.................................................................................................... 21
3.3.4 Sklearn................................................................................................... 22
4 РАЗРАБОТКА И РЕАЛИЗАЦИЯ МЕТОДА ОПОРНЫХ ВЕКТОРОВ...... 23
5 ТЕСТИРОВАНИЕ МЕТОДА ОПОРНЫХ ВЕКТОРОВ........................... 30
ЗАКЛЮЧЕНИЕ............................................................................................. 36
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ........................................... 37
Приложение А ТЕХНИЧЕСКОЕ ЗАДАНИЕ.............................................. 38
Приложение Г ЛИСТИНГ ПРОГРАММЫ.................................................. 39