Тема выпускной квалификационной работы: «Визуализация и анализ данных средствами языка R для улучшения сервиса поиска недвижимости на примере компании «Метр квадратный»». Данная работа посвящена созданию тепловой карты стоимости недвижимости в качестве элемента визуализации для сервиса поиска компании «Метр Квадратный». Задачи, которые решались в ходе данной работы:
1) изучение теоретических аспектов визуализации данных, кластеризации и кригинга, обзор применения выбранных методов в сфере недвижимости;
2) выбор необходимых пакетов в R и описание набора данных;
3) реализация выбранных методик и анализ результатов.
В ходе выполнения данной работы была изучена литература по темам
визуализации данных, кластеризации и кригинга. Было рассмотрено применение данных методов в сфере недвижимости, а также изучен рынок недвижимости в России в целом. Были рассмотрены основные пакеты языка R, требовавшиеся для выполнения работы. Также был проведен анализ набора данных о стоимости недвижимости в России, после чего была проведена его предварительная обработка.
В результате последовательного применения методик кластеризации и кригинга средствами языка R на имевшемся наборе данных, были получены тепловые карты стоимости недвижимости для каждого кластера.
ВВЕДЕНИЕ .............................................................................................................. 7
ГЛАВА 1 ПОСТАНОВКА ЗАДАЧИ И ОБЗОР ЛИТЕРАТУРЫ .......................... 9
1.1 Сервис поиска ресурса «Метр Квадратный» ........................................... 10
1.2 Постановка задачи....................................................................................... 13
1.3 Визуализация данных ................................................................................. 14
1.3.1 Средства визуализации в ЦИАН ............................................................... 16
1.3.2 Яндекс.Недвижимость ................................................................................ 18
1.3.3 Realtor.com ................................................................................................... 19
1.3.4 Карты, как элемент визуализации ............................................................. 20
1.4 Кригинг ........................................................................................................ 21
1.4.1 Теоретические основы кригинга ............................................................... 22
1.4.2 Применение кригинга ................................................................................. 26
1.5 Кластеризация ............................................................................................. 27
1.5.1 Алгоритм k-medoids .................................................................................... 29
1.5.2 Иерархическая кластеризация ................................................................... 32
1.6 Выводы по главе 1 ....................................................................................... 35
ГЛАВА 2 ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ДАННЫХ .............................. 37
2.1 Язык R .............................................................................................................. 37
2.1.1 Визуализация в R .......................................................................................... 38
2.1.2 Кластеризация в R ........................................................................................ 41
2.1.3 Кригинг в R ................................................................................................... 44
2.2 Описание набора данных ........................................................................... 46
2.3 Выводы по главе 2 ....................................................................................... 50
ГЛАВА 3 РЕАЛИЗАЦИЯ ТЕПЛОВОЙ КАРТЫ СТОИМОСТИ НЕДВИЖИМОСТИ .............. 51
3.1 Реализация тепловой карты средствами R ............................................... 51
3.2 Анализ результатов ..................................................................................... 60
3.2.1 Проверка подхода в другом городе ............................................................. 64
3.2.2 Сравнение с тепловой картой от Яндекс.Недвижимости ........................ 66
3.3 Выводы по главе 3 ....................................................................................... 68
ЗАКЛЮЧЕНИЕ ..................................................................................................... 70
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ ............................................ 72
ПРИЛОЖЕНИЕ ЛИСТИНГ ПРОГРАММЫ, РЕАЛИЗУЮЩЕЙ СОЗДАНИЕ ТЕПЛОВОЙ КАРТЫ .................... 75
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
1. Ипотека в I квартале 2023 года. – URL:
2. Стоит ли инвестировать в недвижимость в 2023 году. – URL:
3. Метр Квадратный. – URL: ../ (дата обращения ..
4. Muskan, Singh G., Prabha C. Data Visualization and its Key Funda- mentals: A Comprehensive Survey // IEEE. – 2022. – P. 1710-1714.
5. Jinson Z., Xin J.G. Development of an Ontology-Based Visual Ap- proach for Property Data Analytics // INTREST – 2021. – P. 1-15.
6. Panecki T., Pokojski W. Cartographic visualization of density: explor- ing the opportunities and constraints of Heat Maps // Polish Cartographical Review – 2021. – №53. – P. 22-36.
всего 26 источников