1. Разработать на языке python (версии 3.6 и выше) в среде разработки PyCharm программу, выполняющую:
a. Загрузку текстовых выборок
b. Предварительную обработку текстовой информации (удаление стоп-слов, чисел, стемминг и т.п.)
c. Разбиение выборок на обучающие и тестовые части (80% и 20% от общего числа текстов в выборке, соответственно)
d. Классификацию текстов из тестовой части выборок двумя методами в соответствии с заданным вариантом из табл.1
e. Провести сравнение полученных результатов по точности и быстродействию классификации.
Оформить отчет (титульный лист, формализованную постановка задачи, теоретические разделы описывающие выбранные методы и подходы для решения задачи, разделы описывающие результаты обработки текстовой информации и классификации с выводами, список использованной литературы, приложение с кодом программы). Объем отчета без приложений: 10-20 стр.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |