Цель работы: научиться пользоваться инструментальными средствами анализа данных
Задача: Произвести кластеризацию документов (можно использовать любые документы, сайты и т.д.)
Ход выполнения работы:
1)Подготовка данных
2)Установка RapidMiner. Установка компонентов textProcessing
3) Использование компоненты- Process Dociment from files и различных фильтров (минимум-3).
4) Проведение кластеризации документов (документов должно быть минимум 20) разными методами (минимум - 2).
5) Оценить алгоритмы (точность, полнота, F-мера)
6) Анализ полученных результатов (полноценный анализ работы)
ОТЧЕТ:
Содержит скриншоты экрана каждого действия с комментариями, подсчеты метрик оценки алгоритмов, вывод по полученному результату
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |