Статья ВАК. Добавить теоретическую часть, описать результаты уже готовой модели
Нужно описать уже имеющуюся и модель и её результаты: т.е. подготовить в виде статьи для сдачи в определённый журнал.
Эксперимент был проведён, результаты были получены
есть обученная модель (pickles), исходный код на Python, собирающий данные и осуществляющий их предобратотку, результаты работы (коэффициенты и в виде "облака слов").
5-6 страниц. Оригинальность работы 80%, заимствования из одного источника не более 30%
Текст статьи должен быть размещён в две колонки, без принудительных переносов, через один интервал, шрифтом Times New Roman 10 кегля, на одной стороне листа белой писчей бумаги формата А4, без помарок и вставок. Для облегчения форматирования прилагается шаблон статьи, который размещён на сайте.
Суть в чём: мы взяли статьи с Pubmed с 2000 по 2020 год (описания, а не полные тексты). И прогнали по ним LDA, чтобы определить, какие темы актуальны за это время в каждый год. Модель далеко не идеальная, возможно, в неё понадобится внести изменения (например, использовать алгоритм для определения количества тем, а не выбрать число "от балды") или её придётся переобучить. Исходные данные, дамп текста (на всех этапах обработки) скину чуть позже.
Примерный план может быть таким: О предварительной обработке.
О тематическом моделировании текстов. Какие задачи решает? Зачем нужно?
О тематическом моделировании в контексте медицинских текстов. Где используется? Какие достижения?
Об используемых методах. Какие есть, какие плюсы и минусы?
О наборе данных. В чём особенности? Какой размер датасета? Что нужно учитывать при моделировании?
О предварительной обработке данных? Как особенности данного типа текстов влияют на выбранные способы обработки данных? Почему выбраны такие параметры?
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |