«Анализ данных крупного агрегатора такси (поиск инсайтов, проверка гипотезы, составление рекомендаций стейкхолдерам)».
Цель задания:
Собрать все полученные знания воедино.
Исследовать данные, проверить гипотезу, сделать выводы презентовать результаты.
Введение:
Поздравляем! Вы попали на стажировку в одно из подразделений группы компаний, Вы — аналитик крупного агрегатора такси. Теперь перед вами стоит важная задача:
самостоятельно провести исследование данных, проверить гипотезу о поведенческом предпочтении пользователей к определённому классу такси и сделать выводы, чтобы помочь компании стать лучшей на рынке. Успехов!
Описание задания:
№
Задание
Баллы
1
Загрузите файл dip_hw_x_taxi.csv в pandas dataframe
5
2
Рассчитайте основные описательные статистики
(среднее, минимум, 25-50-75-персентили, максимум)
10
3
Вычислите количество значений по классам такси
5
4
Визуализируйте распределение дистанций поездок
5
5
Визуализируйте распределения дистанций поездок, по каждому классу такси в отдельности, а также определите типы распределений для эконом-класса и комфорт-класса
10
6
Сформируйте выборки по эконом и комфорт-классам. Визуализируйте пересечение интервалов дистанций этих классов (примечание: поможет функция sns.distplot)
10
7
Проведите стат. тест (поможет: функция scipy.stats.ttest_ind), проверьте гипоетезу, что дистанции поездок в комфорт-классе отличаются от дистанций поездок эконом-класса (примечание: H0 – выборки не отличаются, H1 – выборки отличны; уровень значимости = 5%)
20
8
Сделайте выводы по результатам проведения стат. теста
5
9
Вычислите средние выборок исследуемых классов, с учётом полученного результата проверки гипотез определите – какой из классов предпочитают на дальние поездки (эконом или комфорт)
10
10
Оформите презентацию для демонстрации результатов стейкхолдерам (примечание: для оформления воспользуйтесь шаблоном)
20
Итого: максимум 100 баллов
Для зачёта необходимо набрать 70 и более
Результат ДЗ: предоставить в виде ссылок на ноутбук и презентацию.
Убедитесь, что к ноутбуку и презентации предоставлен доступ по ссылке, иначе преподаватель не сможет проверить работу. Для этого можно открыть браузер в режиме инкогнито и убедиться, что ссылки открываются корректно.
Как запустить Chrome в режиме инкогнито.
Как запустить Safari в режиме инкогнито.
Критерии оценки задания:
Выполнены пункты задания.
Оформлена презентация проекта.
Описание датасета:
Датасет содержит информацию о поездках на такси одного из известных агрегаторов:
● order_gk — идентификатор поездки;
● weekday_key — день недели совершения поездки;
● hour_key — час совершения поездки;
● distance_km — дистанция поездки;
● offer_class_group — класс поездки (Economy, Comfort, Premium, Delivery); ● driver_response — статус поездки (1 — поездка совершена; 0 — отмена).
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |