Что требуется выполнить:
1. Обзор литературы по обработке и анализу текстовой информации
2. Сформировать обучающие и тестовые выборки из отзывов к фильмам
3. Решить задачу классификации отзывов по трем классам («положительный», «нейтральный», «негативный»), проведя исследование влияния на качество классификации размерности словаря выборки, параметров выбранных методов классификации и процедур предварительной обработки данных
4. Представить полученные результаты исследования в графической и табличной форме
5. Провести анализ полученных результатов
Исходные данные:
Отзывы с сайта kinopoisk.ru
Методы: Случайный лес, Метод к-ближайших соседей, метод опорных векторов.
Отзывы предоставлены в прикрепленном архиве
Задачу классификации решать с помощью python и популярных библиотек
В файле должны быть: оглавление, главы отражающие выполнение задания, выводы в главах, заключение, список литературы, приложение. Объем не менее 16 стр.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |