1: Загрузить, исследовать и выполнить предварительную обработку набора данных
. 2: Обучить модель классификации и провести ее анализ.
3: Протестировать как минимум две модели и сравнить их производительность.
4: Создать презентационный материал, который можно использовать для обмена информацией о модели.
5: Предложить миниум 3 способа использования алгоритмов классификации, регрессии и кластеризации для социальных проектов, а также методы, которые могут быть выбраны для различных проектов.
2 задание 1: Загрузить набор данных как минимум из 5000 строк. 2: Исследовать данные и определить способ предварительной обработки. 3: Осуществить предварительную обработку данных: выбросы, недостающие данные и т.д. 4: Представить метод, используемый для предварительной обработки данных и получения результата. 5: Предложить по крайней мере 5 способов использования данных для социальных проектов и объяснить, какой метод может быть выбран для различных проектов
3-е задание 1. Собрать данные, содержащие как минимум 50 000 токенов (из книг/с сайта). 2. Провести предварительную обработку данных. Вычислить уменьшение количества токенов по мере обработки данных. 3. Проанализировать токены. Какие 5 токенов встречаются чаше всего? Как они помогают описать текст? 4. Предложить как минимум 5 способов использования набора данных в социальных проектах.
4-е задание 1: Придумать убедительную постановку проблемы проекта. 2: Загрузить, исследовать и провести предобработку набора данных минимум из 2000 строк. 3: Использовать обработанне данные для обучения модели и ее оценки. 4: Использовать как минимум две модели и сравнить их производительность. 5: Сделайте Jupyter Notebook, который можно использовать для представления и обучения других людей пошаговому процессу создания ИИ-решения в области числовых данных
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |