Ознакомьтесь с описаниями представленных атрибутов.
Оцените полноту и чистоту данных. Попытайтесь понять, что стоит за этими данными в реальном мире. Приведите данные в удобный/нормальный вид для дальнейшей работы.
Проведите разведочный анализ данных (четыре часа):
Проведите базовую чистку: дубликаты, пустые значения, типизация данных, ненужные атрибуты.
Посмотрите на распределение ключевых атрибутов, их отношения.
Выполните задание согласно вашей специализации (18 часов):
Научитесь предсказывать совершение целевого действия (ориентировочное значение ROC-AUC ~ 0.65) — факт совершения пользователем целевого действия.
Упакуйте получившуюся модель в сервис, который будет брать на вход все атрибуты, типа utm_*, device_*, geo_*, и отдавать на выход 0/1 (1 — если пользователь совершит любое целевое действие).