Есть json файлы, первый комплект - метаданные проектов, второй - данные о качестве проекта по различным метрикам. Файлы не соотносятся друг с другом, разные файлы и разные анализы. Уже написан некоторый код в google colab. Нужно поправить код , и добавить ещё кластерный анализ, tf-idf, cos similarity и ещё что-нибудь. В метаданных ещё необходимо проанализировать отдельно колонку ‘name’ - название проекта - анализ структуры, часто встречающиеся слова, уникальные значения и необходимо показать, что большинство названий не информативные- не указывают на предметную область проекта.
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |