1)Установка RapidMiner и обновление его до последней версии.�
2) Установка компонентов textMining и WebMining �
3) Использование оператора CrawlWeb для сохранения документов на рабочий компьютер. ВНИМАНИЕ: установите ограничение не более 50 страниц.�
3) Использование компонентs Process Dociment from files и различных фильтров (минимум-3). �
4) Проведение кластеризации документов.
5) Анализ полученных результатов.