Добрый день! Уважаемые студенты, Вашему вниманию представляется дипломная работа на тему: «Выбор числа кластеров на основе анализа последовательности итеративных аномальных кластеров Choosing the right number of clusters using the sequence of iterative anomalous clusters.»
1 Аннотация
Одной из главных проблем алгоритмов кластерного анализа является выбор числа кластеров, на которые будет разбиваться множество объектов. Данная работа посвящена изучению возможности использования для этой цели метода аномальных кластеров, который выводит центры аномальных кластеров
в качестве входных данных популярного алгоритма K-средних. Также в рамках проекта были рассмотрены прочие методы для определения оптимального числа кластеров и их сравнение с вышеупомянутым методом аномальных кластеров.
Ключевые слова — выбор числа кластеров, кластеризация, K-means, Аномальные кластеры
Содержание
1 Аннотация ........................................................................................................... 3
2 Annotation ............................................................................................................ 4
3 Введение............................................................................................................... 5
4 Обзор литературы.............................................................................................. 7
5 Метод аномальных кластеров и Intelligent K-means ................................... 8
5.1 Метод аномальных кластеров .................................................................. 8
5.2 Intelligent K-means ....................................................................................... 9
6 Метод Локтя...................................................................................................... 11
7 Метод разнородности ...................................................................................... 13
8 Данные ............................................................................................................... 14
9 Оценка качества............................................................................................... 17
10 Результаты ..................................................................................................... 19
11 Заключение .................................................................................................... 21
11.1 Выводы........................................................................................................ 21
11.2 Дальнейшая работа................................................................................... 21
12 Список источников ...................................................................................... 23
13 Приложения................................................................................................... 24
12 Список источников
[1] - Boris G Mirkin, 2019, Core Partitioning: K-means and Similarity Clustering, In book: Bondgraphen (pp.293-403).
[2] - Kingrani, Suneel Kumar and Levene, Mark and Zhang, Dell (2018) Estimating the number of clusters using diversity. Artificial Intelligence Research 7 (1), pp. 15-22. ISSN 1927-6974.
[3] - Md Abdul Masud, Joshua Zhexue Huang, Chenghao Wei, Jikui Wang, Imran Khan, Ming Zhong, 2018, I-nice: A new approach for identifying the number of clusters and initial cluster centres.
[4] - Yu-Lin He, Hong-Lian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Novel electricity pattern identification system based on improved I-nice algorithm
[5] - Renato Cordeiro de Amorim, Vladimir Makarenkov, Boris Mirkin, 2016, A-Wardpβ: Effective hierarchical clustering using the Minkowski metric and a fast k-means initialisation
[6] - Yulin He, Yingyan Wu, Honglian Qin, Joshua Zhexue Huang, Yi Jin, 2020, Improved I-nice clustering algorithm based on density peaks mechanism
[7] - https://archive.ics.uci.edu/ml/index.php
[8] - https://www.kaggle.com/camnugent/california-housing-prices