Задача кластеризации заключается в разбиении множества объектов на непересекающиеся подмножества — кластеры — та-ким образом, чтобы каждое подмножество состояло из схожих объектов, а объекты разных кластеров существенно отличались, при этом структура кластеров изначально неизвестна. Для опре-деления схожести объектов необходимо задавать функцию рас-стояния на множестве объектов.
ВВЕДЕНИЕ
1. Постановка задачи 3
2. Обзор литературы 4
3. Методы кластеризации 11
4. Испытание и обоснование эффективности предлагаемых
подходов 16
5. Описание результатов 18
6. Обсуждение результатов 22
7. Выводы и перспективы 24
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 25
ПРИЛОЖЕНИЕ 29
1. БОЛЬШАКОВА, Е. И. Автоматическая обработка тек-стов на естественном языке и компьютерная лингвисти-ка : учеб. пособие / Е. И. Большакова, Э. С. Клышинский, Д. В. Ландэ, А. А. Носков, О. В. Пескова, Е. В. Ягунова — М.: МИЭМ, 2011. — 272 с.
2. БУРЕ, В. М., МАЗАЛОВ, В. В., ПЛАКСИНА, Н. В. Вы-числение характеристик пассажиропотоков в транспорт-ных системах / Управление большими системами. Выпуск 47. М.: ИПУ РАН, 2014. С.77-91.
3. ВОРОНЦОВ, К. В. Машинное обучение. Курс лекций [Электронный ресурс]. — Режим доступа: http://www. machinelearning.ru/wiki/images/6/6d/Voron-ML-1.pdf (дата обращения: 25.03.2016).