Разработка рекомендательной системы на основе анализа данных социальных сетей

Раздел
Программирование
Просмотров
270
Покупок
0
Антиплагиат
Не указан
Размещена
25 Мар 2020 в 10:29
ВУЗ
Не указан
Курс
4 курс
Стоимость
1 000 ₽
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
docx
Разработка рекомендательной системы на
311.6 Кбайт 1 000 ₽
Описание

Основной    целью    магистерской    работы   является    разработка рекомендательной              системы,     которая,        обрабатывая    данные                              из               страницы

пользователя в социальной сети, могла бы с высокой точностью выделять основные предпочтения и давать рекомендации. Идея такой системы заключается в подборе персонализированного списка товаров, которые можно было бы подарить анализируемому пользователю и которые бы отвечали его вкусам и потребностям.

Разработка такой рекомендательной системы требует решения ряда задач. На первом этапе основной акцент построения рекомендательной системы был сделан на исследованиях технологий извлечения, обработки и анализа данных в социальных сетях, а также алгоритмов построения рекомендаций.

Второй этап был посвящен разработке модулей сбора и обработки данных из интернет источников, а также сбору базы данных пользователей и их желаний.

На третьем этапе написания работы были решены задачи разбиения желаний пользователей (большинство из которых являются уникальными) на категории, а самих пользователей – на группы.

На четвертом этапе был разработан модуль рекомендаций, включающий в себя сбор и обработку информации о новом пользователе, а также построение рекомендаций с использованием алгоритма групповых рекомендаций.

Оглавление

Введение............................................................................................................... 2

1. Литературный обзор....................................................................................... 3

1.1 Обогащение данных пользователей. Методы веб-скреппинга для получения данных из социальных сетей............................................................................... 3

1.1.1 Получение веб-страниц с использованием библиотеки urllib.................... 5

1.1.2 Разбор HTML и извлечение информации из веб-страниц (Web scraping) 6

1.1.3 Разбор HTML-страниц с помощью регулярных выражений.................... 7

1.1.4 Разбор HTML-страниц с помощью библиотеки BeautifulSoup................. 9

1.2 Методы data mining для анализа данных в социальных сетях.................. 11

2.1 Общие сведения о СУБД MongoDB............................................................ 22

2.2 Алгоритм сбора данных и написание скрэппера с помощью BeautifulSoup . 23 3.     Разработка рекомендательной системы...................................................... 31

3.1 Постановка задачи и обзор проблематики................................................. 31

3.2 Описание разработанного модуля.............................................................. 33

4.      Построение модуля рекомендательной системы........................................ 38

4.1 Выбор метода построения рекомендательной системы............................. 39

4.2 Реализация модуля рекомендаций.............................................................. 40

Список литературы

I.      Специальная литература:

1.       Горчинская, Ольга. Анализ данных социальных сетей,Открытые системы. СУБД [Электронный ресурс] / Горчинская, Ольга, Ривкин, Андрей.

– науч.-метод. журн. – 2015.— № 03. – Режим доступа www.osp.ru. – (Дата обращения: 01.11.2017).

2.       Кириченко К.М. Обзор методов кластеризации текстовой информации [Электронный ресурс]/ Кириченко К.М, Герасимов М.Б. - электрон. текст. дан. - Режим доступа http://www.dialog- 21.ru/digest/2001/articles/kirichenko/. - (Дата обращения: 01.10.2018)

3.       Коршунов, Антон. Анализ социальных сетей: методы и приложения

/ Антон Коршунов, Иван Белобородов, Назар Бузун, Валерий Аванесов, Роман Пастухов, КириллЧихрадзе[и др.]. - электрон. текст. дан. - Режим доступа http://www.ispras.ru/proceedings/docs/2014/26/1/isp_26_2014_1_439.pdf. - (Дата обращения: 10.10.2017)

4.       Коршунов, Антон.Определение демографических атрибутов пользователей микроблогов / Антон Коршунов, Иван Белобородов, Андрей Гомзин, Кристина Чуприна [и др.]. - электрон. текст. дан. - Режим доступа

https://cyberleninka.ru/article/v/opredelenie-demograficheskih-atributov- polzovateley-mikroblogov. - (Дата обращения: 10.10.2017)

II.      Интернет-ресурсы:

1.     Северенс, Чарльз. Лекция «Введение в программирование на Python», Интуит , национальный открытый университет / Чарльз Северенс. - электрон.                  текст. дан.                -                  Режим   доступа https://www.intuit.ru/studies/courses/12179/1172/lecture/23887?page=4 – (Дата обращения 21.02.2018)

2.      Чубукова, Ирина. Курс «Datamining», Интуит, национальный открытый университет/ Ирина Чубукова. - электрон. текст. дан. - Режим доступа https://www.intuit.ru/studies/courses/6/6/lecture/162?page=2– (Дата обращения 25.03.2018)

3.  Обзор алгоритмов кластеризации данных / andreycha / - электрон. текст. дан. - Режим доступа https://habr.com/ru/post/101338/ – (Дата обращения 16.11.2018)

4.     Документация scikit-learn // - электрон. текст. дан. - Режим доступаhttps://scikit-learn.org/stable/ – (Дата обращения 03.12.2018)

5.  Кантор, Виктор. Кластеризация текстов по теме / Виктор Кантор, Евгений  Рябенко, Евгений  Соколов, EmeliDral, Константин Воронцов /- электрон.                   текст.                    дан.                    -                    Режим доступаhttps://www.coursera.org/lecture/unsupervised-learning/primier- klastierizatsiia-tiekstov-po-tiemie-bVVzw – (Дата обращения 15.11.2018)

6.  Рекомендательная система: введение в проблему холодного старта

/ vleskin /          -          электрон.         текст.          дан.          -          Режим доступаhttps://habr.com/ru/company/surfingbird/blog/168733/ – (Дата обращения 16.11.2018)

7.  WebScraping с помощью python/ miptgirl / - электрон. текст. дан. - Режим доступа https://habr.com/ru/post/280238/ – (Дата обращения 16.11.2018)

8.       Документация  NLTK  //  -  электрон.  текст.  дан.  -  Режим доступаhttps://www.nltk.org/ – (Дата обращения 03.12.2018)

Вам подходит эта работа?
Похожие работы
Основы программирования
Лабораторная работа Лабораторная
4 Ноя в 20:48
6 +6
0 покупок
Основы программирования
Лабораторная работа Лабораторная
4 Ноя в 18:17
10 +10
0 покупок
Основы программирования
Лабораторная работа Лабораторная
4 Ноя в 13:48
9 +9
0 покупок
Основы программирования
Лабораторная работа Лабораторная
4 Ноя в 13:44
9 +9
0 покупок
Основы программирования
Контрольная работа Контрольная
3 Ноя в 19:32
8 +8
0 покупок
Другие работы автора
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:40
42
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:27
44 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 10:19
28
0 покупок
Web-программирование
Дипломная работа Дипломная
20 Сен в 09:47
33 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
19 Сен в 19:29
36 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 22:46
39
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 21:15
33
0 покупок
Web-программирование
Дипломная работа Дипломная
17 Сен в 20:58
36 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 22:41
30
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:50
33
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:48
22 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
14 Сен в 21:08
30
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 23:51
30
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 22:49
23
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 11:21
40 +2
0 покупок
Web-программирование
Дипломная работа Дипломная
13 Сен в 00:29
42 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
12 Сен в 00:40
35 +1
0 покупок
Web-программирование
Дипломная работа Дипломная
11 Сен в 23:24
35
0 покупок
Web-программирование
Дипломная работа Дипломная
11 Сен в 10:31
47 +1
0 покупок
Темы журнала
Показать ещё
Прямой эфир