Применение языковых моделей BERT для подборки публикаций по заданной теме.

Отменен
Заказ
5345601
Раздел
Программирование
Предмет
Тип работы
Антиплагиат
Не указан
Срок сдачи
25 Апр 2023 в 23:55
Цена
1 500 ₽
Блокировка
10 дней
Размещен
18 Апр 2023 в 15:25
Просмотров
112
Описание работы

В данной работе применяются изученные в предыдущей работе инструменты для решения задачи выбора статьи, максимально близкой как отдельным аннотациям исходной коллекции, так и всей коллекции в целом.

Для выполнения этого задания рекомендуется воспользоваться средой Google Colab.

Исходная коллекция аннотаций находится в файле Аннотации_статей_ММРО_2011_Статистическая_теория_обучения.txt, коллекция статей для ранжирования - в файле full_text_articles_for_classification.zip. Статьи представляют собой скан-копии оригинальных работ, переведённые в формат .doc с соответствующей корректировкой.

Задание: используя пример из предыдущего задания(Первое задание.rar), реализовать:

  • поиск статьи, максимально близкой по смыслу объединённому множеству фраз всех аннотаций из файла Аннотации_статей_ММРО_2011_Статистическая_теория_обучения.txt;
  • для каждой аннотации из файла Аннотации_статей_ММРО_2011_Статистическая_теория_обучения.txt - поиск статьи, максимально близкой ей по смыслу. Найти аннотацию, максимально близкую по смыслу наибольшему числу статей из представленных в файле full_text_articles_for_classification.zip.

Аннотации брать вместе с заголовками.

Сравнить:

  • результаты, полученные с применением косинусной близости и расстояния Евклида;
  • результаты, полученные с применением четырёх задействованных вариантов модели трансформеров предложений (bert-base-nli-mean-tokenssentence-transformers/distiluse-base-multilingual-cased-v1sentence-transformers/all-MiniLM-L6-v2 и, соответственно, sberbank-ai/ruscibert).

В качестве ответа на задание представить преограммную реализацию в блокноте Jupyter Notebook и текстовый файл с результатами экспериментов (как в предыдущем задании).

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир