Есть: 2 датасета с фрилансерами (1) и предлагаемыми работами (2). В каждом указана ставка за час и скиллы фрилансера/для работы через запятую
Что сделать:
1) сделать кластеризацию скиллов в 7-10 кластеров (из частных скиллов нужно получить общие (дизайн, IT и тп)
2) сделать разведочный анализ + проверка гипотез (графики и регрессии: какие кластеры скиллов наиболее оплачиваемы, какие чаще всего упоминаются и т.п. + подробнее в тз (тут около 3-4 гипотез на проверку)
* в этой части прогнать хотя бы 2 регрессии
3) Описать результаты на 3 000+ слов (антиплагиат для этой части 85%)