2023 год
Сдана на отлично.
Проверена бесплатно в ап.ру
Рассмотрены существующие техники кластеризации текстов, проанализированы присущие им слабые стороны, препятствующие удовлетворению сформулированных выше требований, выполнена классификация текста с предварительной кластеризацией по выбранным методам и классификацию без предварительной кластеризации и выведены результаты классификаций.
ВВЕДЕНИЕ 2
1 Аналитический обзор литературы 6
1.1 Актуальность проблемы 6
1.2 Алгоритмы кластеризации и метрики оценки 9
1.3 Алгоритм k средних (k-means) 13
1.4 Иерархическая кластеризация 20
1.5 DBSCAN 24
1.6 Сравнение алгоритмов 30
1.7 Классификация текста 31
2 Специальная часть 35
2.1 Содержательная постановка задачи 35
2.2 Математическая постановка задачи 35
2.3 Программная реализация 36
2.4 Результаты исследования 36
ЗАКЛЮЧЕНИЕ 38
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ 39
ПРИЛОЖЕНИЕ 40
1 Jiawei Han, Micheline Kamber, Jian Pei, "Data Mining: Concepts and Techniques", 2011. 456 c.
2 Brian S. Everitt, Sabine Landau, Morven Leese, "Cluster Analysis: Basic Concepts and Algorithms", 2020. 20 c.
..
20 R-дерево [Электронный ресурс] URL: https://clck.ru/UVNpq
21 Алёшин Н. А. "Техника и технологии: теория и практика", 2020, c. 9.
22 Гиперплоскость [Электронный ресурс] URL: https://clck.ru/34KMLv