ВКР Выявление пользователей социальных сетей, ведущих здоровый образ жизни

Главная

Магазин

Дипломная работа

Информатика

ВКР Выявление пользователей социальных сетей, ведущих здоровый образ жизни

Псевдосфера

Был(а) на сайте 5 часов назад

Раздел

Программирование

Предмет

Информатика

Тип

Дипломная работа

Просмотров

140

Покупок

Антиплагиат

Не указан

Размещена

11 Фев 2023 в 14:43

ВУЗ

Не указан

Курс

Не указан

Стоимость

1 000 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

Выявление пользователей социальных сетей, ведущих здоровый образ жизни

5 Мбайт 1 000 ₽

Описание

На 1 февраля 2023 года оригинальность более 80%

Могу проверить вам актуальную оригинальность работы перед покупкой, пишите в личку.

Оригинал документа в pdf, конвертация в Word автоматическая (в word могут быть недочеты, которые вы легко исправите самостоятельно)

Эта работа основана на использовании обработки естественного языка и методов машинного обучения для построения классификаторов, способных предсказать, поведения и тенденции к здоровому образу жизни пользователей социальной сети ВКонтакте.

В результате этой работы, несколько классификаторов машинного обучения обучены выполнять задачу классификации пользователей на основе результатов, которые они дали в опросе, связанным со здоровьем. Различные наборы признаков, полученные из данных, собранных в социальных сетях, в сочетании с различными классификаторами, оцениваются с помощью метрики ROC AUC, чтобы определить, какая комбинация наборов признаков и классификаторов способна выполнить эту задачу. Для выполнения этой задачи используется язык программирования: Python и его различные библиотеки.

Введение

Эта работа заключается в использовании комбинации обработки естественного языка и машинного обучения для прогнозирования того, склоняются ли люди к определенному образу жизни и поведению. Результатом этой работы является оценка работы этих классификаторов машинного обучения.

Тема мониторинга здоровье общества с помощью социальных сетей получает все большее и больше интереса в научном сообществе. В источнике [1] исследователи попытались использовать методы обработки естественного языка для определения отношения пользователей социальных сетей к курению кальянного табака (ККТ). Исследователи попытались выявить потребителей с неоднозначными или смешанными взглядами на ККТ. Выявление таких людей, которые ещё не определились по поводу их отношения к ККТ, позволяет здравоохранительным органам нацеливаться на таких них и направлять им информацию, которая может изменить их мнение о ККТ. Часто когда здравоохранительные органы рассылают информацию публике о вреде употребление табака, табачные компании рассылают, в ответ, информацию которая пытается опровергнуть научные доказательства которые указывают что курение табака это вредно. Один способ избежать контратаки табачных компаний это рассылать такую информацию только некоторым людям которых можно ещё убедить о вреде курения. Методы автоматической классификации таких пользователей может сильно увеличить эффективность трудов здравоохранительных органов с борьбой против курения.

В другом исследовании [2] был использован иной подход к использованию данных, собранных в социальных сетях, в качестве инструмента общественного здравоохранения. Исследователи собрали 4,5 млн. твитов, связанных с диабетом, диетой, физическими упражнениями и ожирением (ДДФуО), и проанализировали их с целью выявления корреляции между этими темами.

Эта работа разделена на введение, четыре главы, заключение и списка литературы.

Введение состоит из мотивации этой работы, списка целей, которые должны быть достигнуты в этой работе, и список завязанных работ, над которыми работают другие академики.

Первая глава этой работы состоит из фундаментальных основ машинного обучения и истории машинного обучения.

Вторая глава этой работы состоит из различных методов, которые могут быть использованы для подготовки текстовых данных для использования в процессе машинного обучения.

Третья глава работы описывает различные способы оценки и тестирования моделей машинного обучения.

Четвертая глава описывает пошаговый процесс извлечения из текста наборов признаков и их использования для обучения классификатора Random Forest.

Вывод состоит из анализа всех результатов, собранных в ходе этой работы.

Оглавление

Содержание ..................................................................................................... 3 Введение .......................................................................................................... 4 1. Теоретические сведения из машинного обучения ................................ 8

1.1 История машинного обучения ............................................................... 8 1.2 Основы машинного обучения .............................................................. 10

2. Обзор инструментов ............................................................................. 13 2.1 Очистка текста ...................................................................................... 16 2.2 Методы отображения данных .............................................................. 17 2.3 Методы оценки моделей ...................................................................... 23

3. Практика ................................................................................................ 38 3.1 Классификация пользователей соцсетей ............................................ 43 3.2 Признаки и методы .............................................................................. 46 3.3 Результаты ............................................................................................ 50

Заключение .................................................................................................... 53 Приложения ................................................................................................... 55 Список используемой литературы ............................................................... 58

Список литературы

Список используемой литературы

1. Chu K.H. Identifying Key Target Audiences for Public Health Campaigns: Leveraging Machine Learning in the Case of Hookah Tobacco Smoking. / K.H. Chu, J. Colditz, M. Malik, T. Yates, B. Primack// J Med Internet Res 2019; 21(7):e12443 URL: https://www.jmir.org/2019/7/e12443

2. Karami, A. Characterizing diabetes, diet, exercise, and obesity comments on Twitter. /A. Karami, A.A. Dahl, G. Turner-McGrievy, H. Kharrazi, G. Shaw//International Journal of Information Management,Volume 38, Issue 1,2018, Pages 1-6, ISSN 0268-4012, https://doi.org/10.1016/j.ijinfomgt.2017.08.002. (https://www.sciencedirect.com/science/article/pii/S0268401217306126)

3. Yan, H. Automatic detection of eating disorder‐related social media posts that could benefit from a mental health intervention. / H. Yan, E.E. Fitzsimmons‐Craft, M. Goodman, M. Krauss, S. Das, P. Cavazos‐Rehg// Int J Eat Disord. 2019; 52: 1150– 1156. https://doi.org/10.1002/eat.23148

4. Aphinyanaphongs, Y.Text classification for automatic detection of alcohol use-related tweets: A feasibility study. /Y. Aphinyanaphongs, B. Ray, A. Statnikov, P. Krebs// Proceedings of the 2014 IEEE 15th International Conference on Information Reuse and Integration (IEEE IRI 2014), Redwood City, CA, USA, 2014, pp. 93-97, doi: 10.1109/IRI.2014.7051877.

5. Garimella, V.R.K. Social Media Image Analysis for Public Health. /V.R.K. Garimella, A. Alfayad, I. Weber.// In Proceedings of the 2016 CHI Conference on Human Factors in Computing Systems (CHI '16). Association for Computing Machinery, New York, NY, USA, 5543–5547. DOI:https://doi.org/10.1145/2858036.2858234

6. Prieto V. M. Twitter: a good place to detect health conditions. / V. M Prieto, S.

Matos, M. Alvarez, F. Cacheda // PloS one. – 2014. – Т. 9. – №. 1. – С. e86191.

7. Khalil K. Detection of Social Media Users Who Lead a Healthy Lifestyle. / K. Khalil, M. Stankevich, I. Smirnov, M. Danina // In: Kuznetsov S.O., Panov A.I., Yakovlev K.S. (eds) Artificial Intelligence. RCAI 2020. Lecture Notes in Computer Science, vol 12412. Springer, Cham. https://doi.org/10.1007/978-3-030-59535-7_17

8. Khodorchenko, M. Developing an approach for lifestyle identification based on explicit and implicit features from social media. / M. Khodorchenko, N. Butakov // Procedia Computer Science, 136, 236-245

9. Ilakkuvan, V. (2019). Patterns of Social Media Use and Their Relationship to Health Risks Among Young Adults. / V. Ilakkuvan, A. Johnson, A. C. Villanti, W. D. Evans, M. Turner // Journal of Adolescent Health, 64 (2), 158-164

10. Furini, M. Public Health and Social Media: Language Analysis of Vaccine Conversations. /M. Furini, G. Menegoni // 2018 International Workshop on Social Sensing (SocialSens), Orlando, FL, 2018, pp. 50-55.

11. Eichstaedt, J.C. Facebook language predicts depression in medical records. /J. C. Eichstaedt, R. J. Smith, R. M. Merchant, L. H. Ungar, P. Crutchley, D. Preoţiuc-Pietro, D. A. Asch, H. A. Schwartz // Proceedings of the National Academy of Sciences Oct 2018, 115 (44) 11203-11208; DOI: 10.1073/pnas.1802331115

12. MyStem Homepage, https://tech.yandex.ru/mystem, last accessed 2019/08/19.

13. Straka, M. Tokenizing, pos tagging, lemmatizing and parsing ud 2.0 with udpipe.

/M. Straka, M., J. Straková// In Proceedings of the CoNLL 2017 Shared Task: Multilingual Parsing from Raw Text to Universal Dependencies (pp. 88-99).

14. Pedregosa, F. (2011). Scikit-learn: Machine learning in Python. Journal of machine learning research. / F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, J. Vanderplas // 12(Oct), 2825-2830.

15. Chen, T. (2016, August). Xgboost: A scalable tree boosting system. / T. Chen, C. Guestrin // In Proceedings of the 22nd acm sigkdd international conference on knowledge discovery and data mining (pp. 785-794).

16. Pennebaker, J. W. (2011). The secret life of pronouns. / J. W. Pennebaker // New

Scientist, 211(2828), 42-45.

17. Stankevich M. (2019) Predicting Depression from Essays in Russian. / M.

Stankevich, I. Smirnov, Y. Kuznetsova, N. Kiselnikova, S. Enikolopov // Computational Linguistics and Intellectual Technologies, DIALOGUE, 18, 637-647.

18. Stankevich, M. (2018). Feature Engineering for Depression Detection in Social Media. / M. Stankevich, V. Isakov, D. Devyatkin, I. Smirnov// In ICPRAM (pp. 426-431).

19. Devyatkin, D.(2014). Intellectual analysis of the manifestations of verbal aggressiveness in the texts of network communities. /D. Devyatkin, Y. Kuznetsova, N. Chudova, A. Shvets // Artificial Intelligence and Decision Making, (2), pp. 27-41.

20. Russel, S. Artificial Intelligence a Modern Approach Third Edition. / S. Russel, P.

Norvig, // Pearson, 2016.

21. Barnwal, S.K. (2017). Using Psycholinguistic Features for the Classification of

Comprehenders from Summary Speech Transcripts. /S.K. Barnwal, U. Shanker.// 122-136. 10.1007/978-3-319-72038-8_10.

22. Salas-Zárate, M. del P.. Automatic detection of satire in Twitter: A psycholinguistic-based approach. / M. del P. Salas-Zárate, M. A. Paredes-Valverde, M. A. Rodriguez-García, R. Valencia-García, G. Alor-Hernández// Knowledge-Based Systems, Volume 128,2017, Pages 20-33, ISSN 0950-7051, https://doi.org/10.1016/j.knosys.2017.04.009.

(https://www.sciencedirect.com/science/article/pii/S0950705117301855)

23. Gou, L. KnowMe and ShareMe: understanding automatically discovered

personality traits from social media and user sharing preferences. /L. Gou, M. Zhou, H. Yang// Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. 2014.

24. Forman, G. Learning from Little: Comparison of Classifiers Given Little Training.

/ G. Forman, I. Cohen// PKDD 2004, LNAI 3202, pp. 161–172, 2004.

Вам подходит эта работа?

Похожие работы

Информатика

РОСДИСТАНТ ТГУ | Информатика | Практические задания | 8 Вариант (буквы Фамилии З, Я, Ф) | Новое 2025

2 000 ₽

Добрый

Контрольная работа Контрольная

4 Мар в 16:54

85 +8

0 покупок

Информатика

РОСДИСТАНТ ТГУ | Информатика | Лабораторные работы | 8 Вариант (буквы Фамилии З, Я, Ф) | Новое 2025

2 000 ₽

Добрый

Лабораторная работа Лабораторная

4 Мар в 16:51

82 +6

0 покупок

Информатика

Практическая работа «Информационные технологии в профессиональной деятельности»

400 ₽

user746755

Контрольная работа Контрольная

4 Мар в 15:15

124 +10

0 покупок

Информатика

[Росдистант] Цифровые технологии в ресторанном бизнесе (Практические задания) Росдистант ТГУ

440 ₽

user345999

Задача Задача

3 Мар в 18:56

128 +10

0 покупок

Информатика

Алгоритм Дейкстры: теория, реализация и экспериментальный анализ

490 ₽

Arakshi

Реферат Реферат

3 Мар в 17:45

106 +10

0 покупок

Другие работы автора

Высшая математика

Онлайн-контест Центральный Университет (седьмая волна) 27 января-9 февраля Грантовый конкурс 2024-2025 Кости два возможных дойти до светофора за 2 мин подождать на светофоре с вероятностью от 0 до 120 сек перейти дорогу прямо к магазину за 10 сек

590 ₽

Псевдосфера

Задача Задача

5 Фев в 03:09

0 покупок

Высшая математика

Онлайн-контест Центральный Университет (седьмая волна 27 января-9 февраля Грантовый конкурс 2024-2025 Экспериментально известно,что 30 выпавшего на лёд снега под собственным весом превращается в лёдИзвестно,что на асфальте осталось на 40 больше снега

590 ₽

Псевдосфера

Задача Задача

5 Фев в 02:51

0 покупок

Высшая математика

Онлайн-контест Центральный Университет (седьмая волна) 27января-9февраля Грантовый конкурс 2024-2025контейнезированого салата Оливье Всегда Сыт диаграмма Гладкий лёд Увеличить площадь каткаМеньше варить глинтвейнЗакупить больше коньков блины вкуснее

590 ₽

Псевдосфера

Задача Задача

5 Фев в 02:34

0 покупок

Высшая математика

Онлайн-контест Центральный Университет (седьмая волна) 27 января-9 февраля Грантовый конкурс 2024-2025 Вычислите наименьшую биссектрису в треугольнике со сторонами10,15,20.Какое наименьшее количество решений иметь уравнение x^5+bx^4+cx^3+dx^2+ex+f=0

290 ₽

Псевдосфера

Задача Задача

5 Фев в 02:07

103 +1

0 покупок

Высшая математика

Задача 5 (Т-Старт 2025) Найдите наименьшее натуральное число N такое, что для любого натурального числа п выполнено неравенство N HOK(n + 1, n + 2,…,n + 10) > HOK(n,n + 1, …,n + 9)?

290 ₽

Псевдосфера

Задача Задача

28 Янв в 08:58

949

64 покупки

Высшая математика

Задача 7 (Т-Старт январь 2025) Лучшие 5 каналов в Пульсе никогда не меняются, однако меняется их порядок. Порядок меняется наугад каждую неделю по следующему алгоритму: первый номер становится наугад каким-то номером k со 2-го по 5-й, а номера

290 ₽

Псевдосфера

Задача Задача

27 Янв в 00:20

1 107

85 покупок

Высшая математика

Задача 6 (Т-Старт 2025) Функция f : N -> N определена на натуральных числах и принимает натуральные значения. Известно, что функция f строго возрастает, а также, что для каждого натурального выполнено f(f(n))= 3n. Найдите f(2024).

290 ₽

Псевдосфера

Задача Задача

24 Янв в 14:00

1 736

70 покупок

Высшая математика

Задача 4 (Т-Старт январь 2025) Последовательность {а_n} задана рекуррентно: а_0=0, a_1=1 и а_(n+2) = a_(n+1)+xа_n, для каждого целого неотрицательного числа n, где х - некоторое рациональное число. Оказалось, что Sum...=1 Найдите х

290 ₽

Псевдосфера

Задача Задача

24 Янв в 11:40

1 073

81 покупка

Высшая математика

Задача 3 (Т-Старт январь 2025) Каждое место в опенспейсе задаётся номером ряда (число от 1 до 10) и номером места в ряду (число от 1 до 16), получается пара чисел (r,m), где r - номер ряда, m - номер места в ряду. Саша придумал для себя игру.В первый

290 ₽

Псевдосфера

Задача Задача

24 Янв в 11:33

1 437

99 покупок

Высшая математика

Задача 2 (Т-Старт январь 2025) Тимлид и джун играют в игру. Тимлид выбирает целое число р от 1 до 100, а джун пытается его угадать. В каждом раунде джун задаёт тимлиду два вопроса, на которые можно ответить «да» или «нет». Тимлид обязан на один

290 ₽

Псевдосфера

Задача Задача

24 Янв в 10:54

2 154

81 покупка

Высшая математика

Задача 1 (Т-Старт январь 2025) Слово из 12 букв каждая из которых Т, Б ,А, Н или К назовем меpчовым, если в нем какие-то 5 последовательных букв образуют ТБАНК. Например, БКБННТБАНКТН - мерчовое, а АТНБКТА-НАТКИ-нет. Сколько существует мерчовых слов?

510 ₽

Псевдосфера

Задача Задача

24 Янв в 10:32

1 995

62 покупки

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ЮЖУРАЛЗОЛОТО ГРУППА КОМПАНИЙ» 2021-2023 гг. ИНН 7424024375 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 18:08

100

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ГРУППА ПОЗИТИВ» 2021-2023 гг. ИНН 9718077239 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:58

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «Пик-Специализированный Застройщик» 2021-2023 гг. ИНН 7713011336 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:52

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «Лизинговая компания «Европлан» 2021-2023 гг. ИНН 9705101614 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:29

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ГРУППА АСТРА» 2021-2023 гг. ИНН 7726476459 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:05

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «МИЛКОМ» 2021-2023 гг. ИНН 1834100340 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:51

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «ЖИГУЛЕВСКОЕ ПИВО» 2021-2023 гг. ИНН 6315526630 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:43

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «ЗАВОД «КОМЕТА» 2021-2023 гг. ИНН 5321038774 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:39

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ШИНСЕЙЛ» 2021-2023 гг. ИНН 9724055868 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:31

0 покупок

Предыдущая работа

ВКР Построение изображений 3-мерных объектов с использованием марширования лучей

Следующая работа

⭐ Тайм-менеджмент руководителя в системе государственного и муниципального управления (ответы на тесты Синергия / МТИ / МосАП, февраль 2023)

Закажите новую работу, выполненную по вашим требованиям у эксперта

Темы журнала

Статьи справочника

Прямой эфир