Практическое задание 2. Курс системы искусственного интеллекта 2.
Рекомендации по выполнению задания
Алгоритм выполнения:
1 Выбрать набор данных, содержащий не менее 10 атрибутов,
отмеченный как набор, для задачи классификации с репозитория
https://archive.ics.uci.edu/ml/datasets.php. Запрещено использовать
выборку данных, представленную в электронном учебнике.
2 Загрузить выбранный набор данных.
3 Произвести исследовательский анализ данных:
● получить объём исследуемых данных;
● получить число атрибутов и их типы данных;
● посмотреть распределение числа примеров классов;
● выполнить преобразование категориальных атрибутов;
● заполнить пропущенные значения в выборке.
4 Разделить набор данных на обучающую и тестовую выборки и
объяснить это разбиение.
5 Обучить модели классификации на основе трёх алгоритмов машинного
обучения (по выбору слушателя курса), отметить, почему были
выбраны эти алгоритмы.
6 Оценить эффективность моделей на тестовой выборке с помощью
матрицы неточностей, критериев полноты Recall и точности Precision.
7 Представить текстовое описание выполнения каждого этапа работы.
Отчет по работе формируется в двух форматах:
● .ipynb;
.pdf (ipynb, сохраненный в формате .pdf).