Добрый день! Программа Jupyter Notebook.
Необходимо:
1. Импортировать данные.
2. Провести предобработку данных.
2.1. Определить наличие пропусков и выбросов в данных.
2.2. Принять решение, что с ними делать.
2.3. Если необходимо, скорректировать масштаб признаков.
2.4. Если необходимо, преобразовать форматы признаков.
2.5. Если необходимо, создать новые признаки на основе имеющихся.
3. Решить задачу классификации.
3.1. Определить алгоритмы, по которым будет производиться классификация (2 различных алгоритма).
3.1.1. В качестве одного из алгоритмов обязательно взять Дерево решений.
3.1.2. Для дерева решений оценить информативность признаков и визуализировать дерево.
3.2. Для каждого алгоритма подобрать оптимальные параметры.
3.3. Выбрать лучший вариант классификации.
3.4. Оценку качества производить по кросс-валидации.
4. Визуализировать результат.
Сами исходные данные отправлю в ЛС.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |