Написать программу на Python, которая обучает три бинарных классификатора на выборке recs2009_public.csv с помощью трёх алгоритмов, из которых нужно взять случайный лес, градиентный бустинг и третий любой другой метод.
Метка класса - Climate_Region_Pub. Так как необходимо создать бинарные классификаторы а возможных классов – 5, то сначала необходимо изменить значение метки Climate_Region_Pub. Для этого необходимо посмотреть последнюю цифру номера своей зачетной книжки (или студенческого билета) и выполнить следующие корректировки:
если последняя цифра 0 или 5: метку 0 заменить на класс А, метки 1, 2, 3, 4 заменить на класс В;
если последняя цифра 1 или 6: метку 1 заменить на класс А, метки 0, 2, 3, 4 заменить на класс В;
если последняя цифра 2 или 7: метку 2 заменить на класс А, метки 0, 1, 3, 4 заменить на класс В;
если последняя цифра 3 или 8: метку 3 заменить на класс А, метки 0, 1, 2, 4 заменить на класс В;
если последняя цифра 4 или 9: метку 4 заменить на класс А, метки 0, 1, 2, 3 заменить на класс В.
Выбрать признаки, использующиеся при обучении, и, если необходимо, выполнить их предобработку. Разделить выборку на обучающую и тестовую.
В работе необходимо исследовать работу алгоритмов обучения с разными значениями гиперпараметров и выбрать наилучшие значения последних.
Для модели случайный лес вывести значения важности признаков.
Написать короткий отчет по работе, включив в него программу с комментариями, значения качества моделей (верности классификатора, а также точности и полноты для класса A). Указать плюсы и минусы полученных классификационных моделей.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |