Цель работы: научиться пользоваться инструментальными средствами анализа данных
Задача: Произвести кластеризацию документов (можно использовать любые документы, сайты и т.д.)
Ход выполнения работы:
1)Подготовка данных
2)Установка RapidMiner. Установка компонентов textProcessing
3) Использование компоненты- ProcessDocimentfromfiles и различных фильтров (минимум-3).
4) Проведение кластеризации документов (документов должно быть минимум 20) разными методами (минимум - 2).
5) Оценить алгоритмы (точность, полнота, F-мера)
6) Анализ полученных результатов (полноценный анализ работы) ОТЧЕТ: Содержит скриншоты экрана каждого действия с комментариями, подсчеты метрик оценки алгоритмов, вывод по полученному результату
https://www.youtube.com/watch?v=Umk67I6IehY&feature=youtu.be