1.Загрузите исходные данные с сайта http://archive.ics.uci.edu/ml/datasets . Набор должен быть предназначен для классификации и содержать не менее 20 показателей.
2. Подготовьте описание исходных данных. В отчет добавьте: описание данных и постановку задачи; таблицу с описанием показателей (показатель, шкала, диапазон); гистограмму распределения объектов по классам.
3. С помощью блоков визуализации постройте диаграммы для показателей, которые проявляют наибольшее различие по классам.
4. Соберите схему в пакете Orange для классификации. Используйте следующие блоки анализа раздела Model: Naïve Bayes, Constant, kNN, Tree, SVM, CN2 Rule Induction, Random Forest, Neural Network. В отчет добавьте общую схему, а также результаты работы методов CN2, Classification Tree с помощью блоков CN2 Rule Viewer, Tree Viewer.
5. С помощью блоков раздела Evalute (Test & Score, Confusion Matrix) выполните оценку качества классификационных моделей при разных режимах тестирования. В отчете представьте таблицу с оценками точности классификации для разных методов и при разных режимах тестирования.
6. Постройте матрицу ошибок с помощью блока Confusion Matrix.
7. Оценка влияния гиперпараметров алгоритмов. Проведите эксперименты с параметрами алгоритмов. Приведите параметры, которые позволили добиться наилучшего качества классификации.
8. Сформировать 3-5 искусственных набора данных с помощью блока Paint Data. Выполните классификацию сформированных наборов.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |