Нужно найти и выбрать датасет с данными, которые хранятся в виде таблицы (признаки х наблюдения), в формате *.csv.
Для выбранного датасета нужно выполнить следующие шаги.
Проверить, присутствуют ли в данных пропуски.
Если пропуски присутствуют, обработать их
Если в данных нет пропусков, для любого признака подготовить код, который можно было бы применить, если бы в этом признаке были пропущенные значения.
Создать новый признак с помощью lambda- функции:
Добавить новый признак
Описать, по какому принципу вы его добавили, и какую пользу он несет
Исследовать данные при помощи статистики.
Использовать фильтрацию (выбор части данных по определенным условиям) для просмотра данных или для выбора части данных, для которых рассчитывается статистика. При этом необходимо использовать как минимум одно сложное условие.
Рассчитать статистики для как минимум трех признаков и привести краткую интерпретацию результата.
Рассчитать корреляцию между двумя числовыми признаками и привести краткую интерпретацию результата.