1)Установка RapidMiner и обновление его до последней версии.
2) Установка компонентов textMining и WebMining
3) Использование оператора CrawlWeb для сохранения документов на рабочий компьютер. ВНИМАНИЕ: установите ограничение не более 50 страниц.
3) Использование компонентs Process Dociment from files и различных фильтров (минимум-3).
4) Проведение кластеризации документов
5) Анализ полученных результатов.