- Загрузить текст на русском языке из файла (файл test.txt, объем файла ~ 200 Кб) текст выбрать самостоятельно
- Удалить стоп-слова и знаки препинания
- Выполнить токенизацию, подсчёт слов и анализ документа DataFrame (Слово|Количество|Ранг|Процент) (действия 2 и 3 можно сделать в одной функции токенов-чистка)
- Построить гистограмму, treepmap, облако слов
Опубликовать файл расширения ipynb
Пример в прикреплённом файле