Проект сдаётся в виде .ipynb файла и набора используемых данных (например .csv или .xlsx файла, но могут быть и другие форматы). Необходимое условие - данные для проекта должны содержать > 500 наблюдений. Проект должен содержать: 1) постановку задачи 2) где и какие данные брались 3) Ваш анализ. Оцениваться будет: 1) На сколько актуальная/интересная/сложная задача поставлена 2) Качество и количество добытых данных/способ их получения 3) Ваш анализ: качество/интересность визуализаций, выдвинутые гипотезы, способ их проверки, способ работы с моделями, качество обработки данных, качество полученного прогноза (если задача будет заключаться в прогнозе), логичность и корректность выводов и т.д. То есть, необходимо подобрать dataset на любую тему, поставить задачу в рамках этого dataset и решить ее в Python с использованием статистических и математических методов. Ниже прикрепляю ссылку на возможный вариант dataset. https://data.cityofchicago.org/Transportation/Taxi-Trips/wrvz-psew В качестве задачи предлагаю исследовать зависимость между длиной поездки и размером чаевых, оставляемых водителю. Этот dataset значительно больше требуемого объема, поэтому рационально будет взять только часть его (500-700 наблюдений). Если Вы считаете нужным, то можете предложить более удачные варианты постановки задачи для данного dataset или выбора другого dataset. Также позже готова дать ссылку на пример проекта, который преподаватель считает хорошим.
| Гарантия на работу | 1 год |
| Средний балл | 4.52 |
| Стоимость | Назначаете сами |
| Эксперт | Выбираете сами |
| Уникальность работы | от 70% |