сделать исчерпывающий анализ по факторам, способствующим развитию диабета с использованием Python.

На выполнении
Заказ
6381909
Раздел
Математические дисциплины
Предмет
Другое
Антиплагиат
Не указан
Срок сдачи
28 Ноя в 23:55
Цена
Договорная
Блокировка
10 дней
Размещен
23 Ноя в 13:48
Просмотров
14
Описание работы

Задание 1.

Вам необходимо сделать исчерпывающий анализ по факторам, способствующим развитию диабета.

Что делать:

первый датасет, который попал к вам на анализ. Архив в приложение.

-  Загрузите его к себе в ноутбук, охарактеризуйте имеющиеся колонки и число наблюдений. Проанализируйте, какие факторы связаны с развитием диабета, а какие нет.

- Добавьте к вашим данным еще один датасет. Определите, какие колонки в этих двух датасетах соответствуют одним и тем же параметрам, проконтролируйте, чтобы датасеты объединились по ним корректно. Повторите ваш анализ с новыми данными, появились ли какие-то новые наблюдения и выводы? Архив 1 в приложение.

 

Условия:

Ограничения в использовании библиотек/функций: Нет. Результат прислать в форме ссылки на ноутбук в Google Colab или Github. Предпочтительно в Google Colab.

Критерии оценки результата:

Вариант 1    Код хорошо читается, соответствует pep-8, используются функции, а так же __annotations__ и __doc__           10 баллов;

Вариант 2    Код, в целом, понятен и хорошо читается, используются функции, но нет __annotations__ и __doc__  7 баллов;

Критерий 2. Детали.

  • Наличие основных графиков для анализа данных: distplot/histplot, boxplot/violinplot, heatmap для df.corr(), lmplot, paired boxplot/violinplot, catplot.
  • Наличие биологически обоснованных выводов о влиянии концентрации глюкозы в крови, уровня кровяного давления и т.д., которые не противоречат медицине.
  • Корректно выполненное объединения датасетов, колонки с одинаковым смыслом (например, колонка Glucose из первого датасета и колонка glucose из второго датасета) объединены верно.
  • Наличие манипуляций с колонками для приведения их в другой тип данных (например, lambda-функция для перевода возраста из числа в категории [10, 20, 30 …] или введение отсечки для первых двух датасетов по колонке для кровяного давление, чтобы адекватно сравниться с третьим датасетом).

Вариант 1    Наличие всех основных типов графиков (отсутствие 1 из типов штрафуется 1 баллом)        3 балла

Вариант 2    Merge/Concat всех трех датасетов выполнен правильно (любой неверный Merge/Concat - 0 баллов)          3 балла

Вариант 5*  Бонусный балл, если работа выполнена красиво, без помарок*           1 балл

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир