На входе три "больших" текстовых файла. В нашей терминологии - это больше 10 000 слов. Файл текстовый, может быть ворд, или обычный txt - файл. Как вариант можно взять любой ворд-файл и сохранить его в txt-формате.
Первый шаг создание инвертированного списка. должна быть возможность задания в диалоге имя папки, в которой расположены исходные файлы (как минимум 3, и каждый с числом слов более 10 000).
Строим инвертированный список. Дальше необходимо организовать поиск файлов (книг) в которых встречаются вводимые пользователем слова, соединенные логической операцией И (AND)/ Выводится имя файла (книги) в которых встретились требуемые слова.
Продолжить работу с построенным инвертированным списком, а точнее с словником и частотой отдельных слов.
Подобрать константу для закона Ципфа для каждого файла, сравнить константы, подобрать константу для совокупности слов из трех файлов.
Проанализировать на соответствие закону Ципфа художественный текст, и текст из вашей профессиональной деятельности (ИТ технологии)
Результаты представить как Питон программы, с выводом графиков.
Вот это будет плюсом "Представить отчет в виде ворда с анализом результатов, в том числе постановку задачи оптимизации, выбор критерия оптимизации, сравнение результатов. Выводы."
Гарантия на работу | 1 год |
Средний балл | 4.96 |
Стоимость | Назначаете сами |
Эксперт | Выбираете сами |
Уникальность работы | от 70% |