Метод кластеризации — Задача №4344410

Главная

Заказы

Задача

Метод кластеризации

user252382

Был(а) на сайте 2 года назад

Выполнен

Заказ

4344410

Раздел

Программирование

Предмет

Python

Тип работы

Задача

Антиплагиат

Не указан

Срок сдачи

2 Ноя 2021 в 20:00

Цена

2 000 ₽

Блокировка

10 дней

Размещен

31 Окт 2021 в 16:15

Просмотров

110

Метод кластеризации K-mean с помощью пакета sklearn.

Для выполнения задания используется набор данных из предыдущей лр.

Что нужно сделать:

1. К текущему датасету необходимо добавить новый аттрибут, например, если есть дата рождения, то посчитать возраст или определить популярность фильма по количеству просмотров и т.п.

2. "Причесать" датасет: удалить выбросы и дубли, обработать пропущенные значения, найти кривые данные и т.п.

3. Построить графики зависимости одной переменной от другой (plt.scatter), описать какие кластеры (группы) вы видите. Построить несколько разных графиков, найти ярковыраженные группы.

4. Изучить перечисленные ноутбуки, по примеру, попробовать применить метод KMeans к вашему датасету (https://scikit-learn.org/stable/modules/generated/sklearn.cluster.KMeans.html)

https://www.kaggle.com/kushal1996/customer-segmentation-k-means-analysis

https://www.kaggle.com/karthickaravindan/k-means-clustering-project

https://www.kaggle.com/hellbuoy/online-retail-k-means-hierarchical-clustering

https://www.kaggle.com/sirpunch/k-means-clustering

Разместите заказ
Выберите исполнителя
Получите результат

Гарантия на работу	1 год
Средний балл	4.52
Стоимость	Назначаете сами
Эксперт	Выбираете сами
Уникальность работы	от 70%

31 Окт 2021 в 23:25

Начало работы

2 Ноя 2021 в 17:42

Окончание работы

user252382

написал(а) положительный отзыв

2 Ноя 2021 в 17:47

Быстро, качественно! Очень счастлива, что встретила исполнителя)))) Обязательно обращусь ещё)

Предыдущий заказ

Математические методы и моделирование в экономике

Следующий заказ

Информационные технологии в образовании

Прямой эфир