Применение LDA для тематического моделирования научных статей

Выполнен
Заказ
4373468
Раздел
Программирование
Тип работы
Антиплагиат
80% Антиплагиат.РУ (модуль - Интернет Free)
Срок сдачи
21 Ноя 2021 в 23:55
Цена
Договорная
Блокировка
10 дней
Размещен
13 Ноя 2021 в 16:52
Просмотров
116
Описание работы

Статья ВАК. Добавить теоретическую часть, описать результаты уже готовой модели

Нужно описать уже имеющуюся и модель и её результаты: т.е. подготовить в виде статьи для сдачи в определённый журнал.

Эксперимент был проведён, результаты были получены

есть обученная модель (pickles), исходный код на Python, собирающий данные и осуществляющий их предобратотку, результаты работы (коэффициенты и в виде "облака слов").

5-6 страниц. Оригинальность работы 80%, заимствования из одного источника не более 30%

Текст статьи должен быть размещён в две колонки, без принудительных переносов, через один интервал, шрифтом Times New Roman 10 кегля, на одной стороне листа белой писчей бумаги формата А4, без помарок и вставок. Для облегчения форматирования прилагается шаблон статьи, который размещён на сайте.

Суть в чём: мы взяли статьи с Pubmed с 2000 по 2020 год (описания, а не полные тексты). И прогнали по ним LDA, чтобы определить, какие темы актуальны за это время в каждый год. Модель далеко не идеальная, возможно, в неё понадобится внести изменения (например, использовать алгоритм для определения количества тем, а не выбрать число "от балды") или её придётся переобучить. Исходные данные, дамп текста (на всех этапах обработки) скину чуть позже.

Примерный план может быть таким: О предварительной обработке.

О тематическом моделировании текстов. Какие задачи решает? Зачем нужно?

О тематическом моделировании в контексте медицинских текстов. Где используется? Какие достижения?

Об используемых методах. Какие есть, какие плюсы и минусы?

О наборе данных. В чём особенности? Какой размер датасета? Что нужно учитывать при моделировании?

О предварительной обработке данных? Как особенности данного типа текстов влияют на выбранные способы обработки данных? Почему выбраны такие параметры?

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Время выполнения заказа:
34 дня 4 часа 56 минут
Выполнен
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир