1. Установка RapidMiner и обновление его до последней версии.
2. Установка компонентов textMining и WebMining.
3. Использование оператора CrawlWeb для сохранения документов на рабочий компьютер.
4. Использование компонента - Process Dociment from files и различных фильтров.
5. Проведение кластеризации документов