Предмет «Анализ данных» Задание 1. Импортировать данные. 2. Провести предобработку данных. 2.1. Определить наличие пропусков и выбросов в данных. 2.2. Принять решение, что с ними делать. 2.3. Если необходимо, скорректировать масштаб признаков. 2.4. Если необходимо, преобразовать форматы признаков. 2.5. Если необходимо, создать новые признаки на основе имеющихся. 3. Провести кластеризацию данных. 3.1. Определить алгоритмы, по которым будет производиться кластеризация (2 различных алгоритма). 3.2. Для каждого алгоритма подобрать оптимальные параметры. 3.3. Обосновать выбор количества кластеров. 3.4. Выбрать лучший вариант кластеризации. 4. Визуализировать результат. Данные для задания находятся в файле «clustering_dataset.csv» Писание данных находится в файле «Описание данных.pdf» Надо отправить Jupyter-ноутбук с выполненным заданием. Инструмент: Jupyter Notebook Интерпретатор: Python, Anaconda
Гарантия на работу | 1 год |
Средний балл | 4.56 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |