Кластеризация статей

Выполнен
Заказ
4000063
Раздел
Программирование
Предмет
Тип работы
Антиплагиат
Не указан
Срок сдачи
5 Апр 2021 в 20:00
Цена
Договорная цена
Блокировка
10 дней
Размещен
1 Апр 2021 в 11:16
Просмотров
103
Описание работы
  1. Установить библиотеки wikipedia, scipy.
  2. Найти список статей англоязычной Википедии по темам: Religious figures, Arctic Ocean, Drugs. (минимум 15 статей по каждой теме) и записать в отдельный массив.
  3. Получить тест статей (документ) и записать в отдельный массив.
  4. Извлечь фичи из текстов на английском языке с помощью TF-IDF (признаки).
  5. Определить число кластеров с помощь elbow метода и нарисовать график 1.
  6. Разбить массив признаков на кластеры с помощью алгоритмов KMeans, MiniBatchKMeans, DBSCAN и вывести результат работы алгоритмов в консоль, как на графике 2.
  7. Разбить массив признаков на кластеры с помощью иерархической кластеризации (из библиотеки scipy) и представить результат в виде дендрограммы(график 3)
  8. На основе признаков из покемонов и статей построить PCA и TSNE распределения в двумерном пространстве.
  9. Визуализировать результат с помощью scatter графика(график 4)

почти каждая команда с комментариями

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу1 год
Средний балл4.52
СтоимостьНазначаете сами
ЭкспертВыбираете сами
Уникальность работыот 70%
Время выполнения заказа:
3 дня 9 часов 1 минута
Выполнен в срок
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки в течение 1 года
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Прямой эфир