Внимание. Работа выложена в текстовом формате PDF (работа легко форматируется, редактируется, конвертируется в word).
Тема выпускной квалификационной работы: распознавание эмоций в тексте с помощью методов машинного обучения. Данная работа посвящена изучению различных методов анализа тональности текста, основных подходов и инструментов, используемых в процессе анализа, анализу алгоритмов машинного обучения, а также разработке программного продукта для анализа тональности текста на основе машинного обучения.
Задачи, которые решались в ходе исследования:
1) Обзор существующих методов распознавания эмоций в тексте.
2) Сравнение инструментов анализа тональности текста.
3) Анализ и предобработка данных.
4) Выбор алгоритмов машинного обучения для классификации
эмоций.
5) Обучение выбранной модели на подготовленных данных.
6) Оценка качества модели и ее параметров.
7) Проведение экспериментов и получение результатов.
Работа проведена на базе языка программирования Python с использованием библиотеки для работы с анализом текста, в частности распознавания эмоций, под названием Transformer (Hugging Face). Также была использована предобученная модель RuBERT которая обучалась на большой выборке текстов на русском языке. Для обучения использовалась выборка отзывов о мобильных приложениях. Все тексты были размечены по тональности. В результате была проведена разработка программного продукта для анализа тональности текста на основе машинного обучения, проведенанализ алгоритмов и методов анализа и социально-этических аспектов использования этой технологии.
ВВЕДЕНИЕ
ГЛАВА 1 ТЕОРЕТИЧЕСКИЙ ОБЗОР
1.1 Понятие «эмоция» и ее роль в тексте
1.2 Обзор существующих методов распознавания эмоций в тексте
1.3 Описание основных методов машинного обучения, используемых в данной работе
ГЛАВА 2 АНАЛИЗ И ПРЕДОБРАБОТКА ДАННЫХ
2.1 Обзор наборов данных с разметкой эмоций в тексте
2.2 Анализ и предобработка данных
2.3 Предложения по созданию собственной системы анализа текстов
ГЛАВА 3 ПОСТРОЕНИЕ МОДЕЛИ 3.1 Выбор алгоритмов машинного обучения для классификации эмоций
3.2 Обучение выбранной модели на подготовленных данных
3.3 Оценка качества модели и ее параметров
ГЛАВА 4 ЭКСПЕРИМЕНТЫ И РЕЗУЛЬТАТЫ
4.1 Проведение экспериментов с различными моделями и параметрами
4.2 Сравнение результатов с существующими методами распознавания
4.3 Анализ точности, полноты и других метрик оценки качества моделей
ГЛАВА 5 ВЫВОДЫ
5.1 Резюмирование основных результатов работы
5.2 Обсуждение достигнутых результатов и их значимости
5.3 Предложения по развитию методов распознавания
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А ОПИСАНИЕ ФУНКЦИЙ
1. Акжолов Р. К., Верига А. В. Анализ тональности текста //Вестник науки. – 2019. – Т. 4. – №. 9 (18). – С. 29–31.
2. Ахмедов Э. Ю. СИСТЕМЫ АНАЛИЗА ТОНАЛЬНОСТИ ТЕКСТА //Евразийский журнал компьютерных наук и математической теории. – 2022. – Т. 2. – №. 14. – С. 38-42.
3. Белянин В. П. Компьютерный анализ тональности текста //Вестник Калужского университета. Серия 1. Психологические науки. Педагогические науки. – 2021. – Т. 4. – №. 1. – С. 69-79.
4. Бердюкова С. С., Коломойцева И. А. Исследование применения сверточных нейронных сетей для анализа тональности текста //Современные информационные технологии в образовании и научных исследованиях (СИТОНИ-2021). – 2021. – С. 378-383.
5. Голубев А. А., Лукашевич Н. В. Исследование моделей нейронных сетей типа bert для анализа тональности текстов на русском языке //Научно-техническая информация. серия 2: информационные процессы и системы. – 2021. – №. 1. – С. 32-41.
всего 25 источников