Предмет: Машинное обучение и анализ данных.
Курсовая работа на тему: "Применение ансамблевых методов для решения прикладной задачи анализа данных".
Предметная область на выбор "Применение ансамблевых методов для анализа текста" или "Применение ансамблевых методов для имитации человеческой речи в сообщениях в социальных сетях".
Работа должна содержать:
1. Предобработку данных. Работа должна содержать исчерпывающий алгоритм предварительной обработки данных. Он служит для того, чтобы исправить все несовершенства в данных и сделать набор данных как можно более пригодным для машинного обучения. Процедура предварительной обработки данных должна быть воспроизводима и должна наиболее эффективно решать задачи предобработки.
2. Замеры времени (для анализа временной сложности алгоритмов). Все инструкции, запускающие цикл обучения модели должны содержать замер времени обучения. Замер можно производить с помощью магических инструкций Jupyter или (более предпочтительно) с использованием стандартной библиотеки Python. Сравнение моделей должно учитывать и время обучения.
3. Визуализацию. Работа должна демонстрировать навыки студента визуализировать информацию. Особенно на этапах описательного анализа и анализа обучаемости модели. Оценивается разнообразие, наглядность и информативность визуализации.
4. Использование метрик эффективности. Оценивается разнообразие и адекватность задаче примененных метрик эффективности (включая время обучения) а также полнота сравнения и правильность выводов из сравнения моделей по разным метрикам.
5. Оценку валидности результатов. Студент должен продемонстрировать умение оценивать достоверность измерения метрик моделей и повышать ее с использованием перекрестной проверки (кросс-валидации). Использование k-fold cross validation является предпочтительным методом измерения эффективности модели. Если происходит выбор модели, то ее итоговая эффективность должна измеряться на чистом наборе данных.
Просьба также ознакомиться с методическими рекомендациями во вложении.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |