Цель исследования – разработка и тестирование концепции использования алгоритма k-means для решения задач классификации данных. Гипотеза исследования состоит в том, что возможно построение эффективного классификатора данных на основе результатов кластерного
анализа, полученных с помощью алгоритма k-means.
Введение.......................................................................................................... 3
1 Анализ путей совершенствования алгоритмов машинного обучения........... 6
1.1 Анализ данных с использованием машинного обучения....................... 6
1.2 Сравнительный анализ алгоритмов для классификации объектов на изображении............................................................................................... 14
1.3 Пути развития технологий машинного обучения................................. 19
2 Разработка технологии классификации данных на основе алгоритма k- means 24
2.1 Математический аппарат метрических алгоритмов кластеризации..... 24
2.2 Способ построения классификатора и классификации данных на основе результатов кластерного анализа............................................................... 31
3 Проведение тестирования предложенных подходов................................... 38
3.1 Программной реализация алгоритма построения классификатора и классификации данных на основе алгоритма k-means............................... 38
3.2 Вычислительный эксперимент на наборе данных «Fisher's Iris».......... 50
3.3 Вычислительный эксперимент на наборе данных «Machine».............. 56
3.4 Вычислительный эксперимент на наборе данных «DryBean».............. 60
Заключение.................................................................................................... 67
Список используемой литературы................................................................. 69
1. Алифбекова, Н.Р. Сравнительный анализ алгоритмов распознавания человеческого лица / Н.Р. Алифбекова, А.В. Рытов // Сборник статей Всероссийской студенческой научно-практической междисциплинарной конференции «Молодежь. Наука. Общество». 2020. – Тольяттинский государственный университет, 2020. – с. 38-41. – Текст : непосредственный.
2. Власов, А.В. Машинное обучение применительно к задаче классификации семян зерновых культур в видеопотоке / А.В. Власов, А.С. Федеев // Молодежь и современные информационные технологии – сборник трудов XIV Международной научно-практической конференции студентов, аспирантов и молодых учёных, 07–11 ноября 2016. – Национальный исследовательский Томский политехнический университет (Томск), 2016. – с. 133-135. – Текст : непосредственный.
3. Клячин В.Н. Использование агрегированных классификаторов при технической диагностике на базе машинного обучения / В.Н. Клячин, Ю.Е. Кувайскова, Д.А. Жуков // Информационные технологии и нанотехнологии (ИТНТ-2017) – сборник трудов III международной конференции и молодежной школы. Самарский национальный исследовательский университет имени академика С.П. Королева. 2017. – Предприятие "Новая техника" (Самара), 2017. – с. 1770-1773. – Текст : непосредственный.
4. Кононова, Н.В. Исследование подсистемы контентной фильтрации с использованием методов машинного обучения / Н.В. Кононова, Ю.А. Андрусенко, Т.А. Самокаева // Студенческая наука для развития информационного общества – сборник материалов VI Всероссийской научно-технической конференции. 22–26 мая 2017. – Северо-Кавказский федеральный университет (Ставрополь), 2017. – с. 268-270. – Текст :
непосредственный.
5. Мелдебай, М.А. Анализ мнений покупателей на основе машинного обучения / М.А. Мелдебай, А.К. Сарбасова // Прикладная математика и информатика: современные исследования в области естественных и технических наук – материалы III научно-практической всероссийской конференции (школы-семинара) молодых ученых. 24–25 апреля 2017 года. – Издатель Качалин Александр Васильевич, 2017. – с. 360-
363. – Текст : непосредственный.
6. Наумов, Д.П. Регулятор CAP на основе машинного обучения / Д.П. Наумов, Д.П. Стариков // Информационные технологии в управлении, автоматизации и мехатронике – сборник научных трудов Международной научно-технической конференции. 06–07 апреля 2017 года. – ЗАО "Университетская книга" (Курск), 2017. – с. 106-114. – Текст : непосредственный.
7. Осколков, В.М. Использование метода машинного обучения для повышения продуктивности на предприятии / В.М. Осколков, Н.И. Шаханов, И.А. Варфоломеев, О.В. Юдина, Е.В. Ершов // Автоматизация и энергосбережение машиностроительного и металлургического производств, технология и надежность машин, приборов и оборудования – материалы XII Международной научно-технической конференции, 21 марта 2017. – Вологодский государственный университет (Вологда), 2017. – с. 177-180. – Текст : непосредственный.