Задача на анализ текста, программирование на Python

Отменен
Заказ
5145339
Раздел
Программирование
Тип работы
Антиплагиат
Не указан
Срок сдачи
29 Дек 2022 в 14:00
Цена
Договорная
Блокировка
5 дней
Размещен
27 Дек 2022 в 13:32
Просмотров
70
Описание работы

На входе три "больших" текстовых файла. В нашей терминологии - это больше 10 000 слов. Файл текстовый, может быть ворд, или обычный txt - файл. Как вариант можно взять любой ворд-файл и сохранить его в txt-формате.

Первый шаг создание инвертированного списка. должна быть возможность задания в диалоге имя папки, в которой расположены исходные файлы (как минимум 3, и каждый с числом слов более 10 000).

Строим инвертированный список. Дальше необходимо организовать поиск файлов (книг) в которых встречаются вводимые пользователем слова, соединенные логической операцией И (AND)/  Выводится имя файла (книги) в которых встретились требуемые слова. 

Продолжить работу с построенным инвертированным списком, а точнее с словником и частотой отдельных слов.

Подобрать константу для закона Ципфа для каждого файла, сравнить константы, подобрать константу для совокупности слов из трех файлов.


Проанализировать на соответствие закону Ципфа художественный текст, и текст из вашей профессиональной деятельности (ИТ технологии)

Результаты представить как Питон программы, с выводом графиков.

Вот это будет плюсом "Представить отчет в виде ворда с анализом результатов, в том числе постановку задачи оптимизации, выбор критерия оптимизации, сравнение результатов. Выводы."

Нужна такая же работа?
  • Разместите заказ
  • Выберите исполнителя
  • Получите результат
Гарантия на работу 1 год
Средний балл 4.96
Стоимость Назначаете сами
Эксперт Выбираете сами
Уникальность работы от 70%
Нужна аналогичная работа?
Оформи быстрый заказ и узнай стоимость
Гарантированные бесплатные доработки
Быстрое выполнение от 2 часов
Проверка работы на плагиат
Темы журнала
Показать ещё
Прямой эфир