Сам датасет
https://www.kaggle.com/datasets/iamsouravbanerjee/analytics-industry-salaries-2022-india
Инструкция:
Загружаем датасет pd.read_csv
Обрабатываем данные: пропуски, выбросы
Кодируем категориальные переменные
Разделяем данные на трейн и тест 70 на 30 (не забудьте отделить фичи от таргета)
Выбираем подходящую модель - смотря какая задача: классификация или регрессия
Обучаем модель на трейне
Считаем метрики на тесте.
И не забудьте проверить таргет на дисбаланс
Самое главное обратить внимание на дисбаланс и на метрики,чтобы метрики вкладывались в норму
Пытался сделать сам,но столкнулся с тем,что метрики показывают очень низкий и неприемлемый результат
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |