Непрерывный научно-технический прогресс меняет способы взаимодействия между людьми. Особую роль в этом процессе играет интернет. Количество способов коммуникации онлайн с каждым годом растет. Одной из ключевых платформ для ведения общения в интернете являются социальные сети.
Социальная сеть – онлайн платформа для общения, знакомств, создания социальных отношений с другими людьми. Социальные сети прочно вошли в жизнь современного человека. Одной из таких сетей является социальная сеть
«Вконтакте». Являясь одной из самых популярных социальных сетей на постсоветском пространстве, она имеет большое влияние, предоставляя платформу для взаимодействия между людьми онлайн.
Основой социальных сетей являются сообщества. Сообщества могут создаваться для различных целей. Сообщества могул являться платформами для общения, для выражения своих взглядов, для взаимодействия с клиентами. Например, крупная компания может иметь сообщество для осуществления коммуникации с клиентами. В подобной группе люди могут оставлять свои жалобы или пожелания в удобной для них форме. Или сообщество в социальной сети может являться независимым СМИ.
Существует большое количество сообществ с разнообразными целями, аудиторией, контентом. Количество людей в сообществах может достигать нескольких миллионов человек. Подобные сообщества могут играть значительную роль при ведении бизнеса.
В сообществах социальной сети «Вконтакте» ежедневно публикуется огромное количество информации. Большая часть информации находится в текстовом виде. Сбор и автоматическая обработка текстовой информации может помочь в поборе правильной стратегии для взаимодействий в социальной сети.
Созданию инструмента для анализа сообществ в социальной сети
«Вконтакте» будет посвящена данная работа. В качестве основного метода
анализа текста будет использована нейронная сеть, определяющая тональность текста. На основе этой модели будут построены различные статистики, описывающие интересующее сообщество.
Введение..................................................................................................... 3
1 Постановка задачи.................................................................................. 5
2 Теоретическая часть............................................................................... 6
2.1 Язык программирования Python........................................................ 6
2.2 Библиотеки для языка программирования Python............................ 7
2.3 Базы данных......................................................................................... 8
2.4 Нейронные сети.................................................................................... 9
2.5 Django................................................................................................. 11
2.6 HTML, CSS, JS................................................................................... 12
3 Функциональное описание................................................................... 14
3.1 Нейронная сеть................................................................................... 14
3.2 Описание парсера.............................................................................. 14
3.3 Хранение данных............................................................................... 14
3.4 Начало использования....................................................................... 15
3.5 Раздел «Быстрая статистика»............................................................ 18
3.6 Раздел «Униграммы»......................................................................... 19
3.7 Раздел «Биграммы»........................................................................... 20
3.8 Раздел «Метрики активности».......................................................... 21
3.9 Пример анализа сообщества............................................................. 22
Заключение.............................................................................................. 26
Литература............................................................................................... 27
ПРИЛОЖЕНИЕ А......................................................................................... 28
1. C. H. Swaroop. A Byte of Python — 2020 — P. 15—16.
2. Стружкин, Н. П. Базы данных. Проектирование. Учебник / Н.П. Стружкин, В.В. Годин. - М.: Юрайт, 2016. – С. 12.
3. Николенко С. Глубокое обучение. Погружение в мир нейронных сетей. / Николенко С., Кадурин А., Архангельская Е. – СПб.: Питер, 2018 – С. 231.
4. S. Hochreiter, J. Schmidhuber Long short-term memory Neural Computation: journal. — 1997 — Vol. 9, no. 8. — P. 1735—1780.
5. Николенко С. Глубокое обучение. Погружение в мир нейронных сетей. / Николенко С., Кадурин А., Архангельская Е. – СПб.: Питер, 2018 – С. 236.
6. Б. Хеник. HTML и CSS Путь к совершенству / Б. Хеник — СПб.: O'Reilly — С. 32.
7. Рубцова Ю. Автоматическое построение и анализ корпуса коротких текстов (постов микроблогов) для задачи разработки и тренировки тонового классификатора //Инженерия знаний и технологии семантического веба. – 2012. – Т. 1. – С. 109-116.