Задание использование библиотеки NLTK

Раздел
Программирование
Предмет
Просмотров
110
Покупок
0
Антиплагиат
Не указан
Размещена
29 Мар в 07:31
ВУЗ
Не указан
Курс
Не указан
Стоимость
350 ₽
Демо-файлы   
1
jpg
DEMO1 DEMO1
276.6 Кбайт 276.6 Кбайт
Файлы работы   
1
Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.
zip
Задание NLTK
1 Мбайт 350 ₽
Описание

Задание

  1. В алфавите из 26 букв имеется 26 в степени 10, или 26^10, десятибуквенных строк. Сколько может быть стобуквенных строк?
  2. Операцию умножения Python можно применять к спискам. Что произойдет, если вы введете ['Monty', 'Python'] * 20 или 3 * sent1?
  3. Сколько слов содержится в text2? Сколько различных слов?
  4. Создайте дисперсионный сюжет четырех главных героев «Sense and Sensibility»: Elinor, Marianne, Edward и Willoughby. Что вы можете сказать о ролях мужчин и женщин в этом романе? Можете идентифицировать пары?
  5. Найдите словосочетания в text5.
  6. len(set(text4)). Каково назначение этого выражения. Опишите два этапа выполнения этого вычисления.
  7. Посмотрите еще раз пункт 2 по спискам и строкам. Определите строку и присвойте ее переменной, например, my_string = 'My String'. Распечатайте содержимое переменной двумя способами: сначала просто введите имя переменной, а затем с помощью оператора print. Попробуйте сложить строку саму с собой, используя my_string + my_string или умножив ее на число, например, my_string * 3. Обратите внимание, что строки соединяются без пробелов. Как можно это исправить?
  8. Определите переменную my_sent как список слов. Используйте ' '.join(my_sent), чтобы преобразовать список в строку. Используйте split(), чтобы разделить строку на изначальный список слов.
  9. Определите несколько переменных, содержащих списки слов. Соедините их вместе в различных комбинациях (используя оператор «плюс»), чтобы сформировать целое предложения. Какая связь между len(phrase1+phrase2) и len(phrase1)+len(phrase2)?
  10. Рассмотрим следующие два выражения, которые имеют одинаковое значение. Которое из них более актуально в NLP? Почему? a. "Monty Python"[6:12] b. ["Monty", "Python"]
  11. Что сделает send1[2][2]? Почему? Поэкспериментируйте с другими значениями индекса.
  12. Первое предложение text3 предоставляется в переменной send3. Индекс слова 'the' в sent3 равен 1, потому что send3[1] дает нам 'the'. Каковы индексы двух других вхождений этого слова в sent3?
  13. Найдите все слова в Chat Corpus (text5), начинающиеся с буквы b. Выведите их в алфавитном порядке.
  14. Введите list(range(10)) в строке интерпретатора. Теперь попробуйте list(range(10, 20)), list(range(10, 20, 2)), and list(range(20, 10, -2)).
  15. Используйте text9.index(), чтобы найти индекс слова «sunset». Методом проб и ошибок найдите фрагмент полного предложения, содержащего это слово.
  16. Используйте сложение списков, операцию set и sorted, чтобы вычислить словарный запас предложений send1 ... send8.
  17. В чем разница между следующими двумя строками? Какая из них даст большее значение? Будет ли это характерно для других текстов? sorted(set(w.lower() для w в text1)) и sorted(w.lower() для w в set(text1))
  18. В чем разница между следующими двумя тестами: w.isupper() и not w.islower()?
  19. Напишите выражение среза (slice), которое извлекает два последних слова text2.
  20. Найдите все четырехбуквенные слова в Chat Corpus (text5). С помощью частотного распределения (FreqDist) покажите эти слова в порядке убывания частотности.
  21. Просмотрите обсуждение цикла с условием (пункт 4). Используйте комбинацию for и if, чтобы перебрать слова сценария фильма «Monty Python and the Holy Grail» (text6) и вывести все слова в верхнем регистре, по одному в строке.
  22. Напишите выражения для поиска всех слов в text5, удовлетворяющих одному из перечисленных ниже условиям. Результат должен быть в виде списка слов: ['слово1', 'слово2', ...]. a) Окончание на ise b) Содержит букву z. c) Содержит последовательность букв pt. d) Наличие всех строчных букв, кроме начальной заглавной (т.е. titlecase)
  23. Определить sent, как список слов  ['she', 'sells', 'sea', 'shells', 'by', 'the', 'sea', 'shore']. Теперь напишите код для выполнения следующих задач: a) Выведите все слова, начинающиеся с sh. b) Вывести все слова длиннее четырех символов
  24. Что делает следующий код Python? sum(len(w) for w in text1) Можно ли использовать его для расчета средней длины текста в слове?
  25. Определите функцию vocab_size(text), которая имеет один параметр для текста и возвращает словарный запас текста.
  26. Определите функцию percent(word, text), которая вычисляет, как часто данное слово встречается в тексте, и выражает результат в процентах.
  27. Мы использовали set`ы для хранения словарей. Попробуйте следующее выражение: set(sent3) < set(text1). Поэкспериментируйте с этим, используя разные аргументы для set(). Что оно делает? Можете ли вы придумать практическое применение для этого выражения?

Архив содержит выполненные задания и результаты в формате ipynb и py (подходит для любой среды: Google Colab, Jupyter Notebook, PyCharm и т.д.), а также отчет по работе в формате Word

Если вам нужны подобные работы, то можете написать мне)

Вам подходит эта работа?
Другие работы автора
Анализ и прогнозирование
Задача Задача
11 Апр в 06:36
58 +2
1 покупка
Сетевые технологии
Лабораторная работа Лабораторная
9 Апр в 18:29
55 +2
0 покупок
Python
Контрольная работа Контрольная
30 Мар в 18:26
108 +2
3 покупки
Информационные технологии
Задача Задача
29 Мар в 04:47
141 +2
2 покупки
Методы защиты информации
Задача Задача
28 Мар в 01:19
93 +2
0 покупок
Теория кодирования
Контрольная работа Контрольная
26 Мар в 10:37
89 +3
0 покупок
Теория информации
Задача Задача
26 Мар в 05:23
103 +2
0 покупок
Сетевые технологии
Контрольная работа Контрольная
26 Мар в 04:57
100 +3
0 покупок
Теория информации
Курсовая работа Курсовая
26 Мар в 04:27
93 +2
0 покупок
Теория информации
Курсовая работа Курсовая
26 Мар в 04:16
93 +1
0 покупок
Python
Отчет по практике Практика
26 Мар в 03:44
140 +2
3 покупки
Криптография
Лабораторная работа Лабораторная
25 Мар в 14:48
99 +2
0 покупок
Искусственный интеллект
Контрольная работа Контрольная
25 Мар в 14:27
102 +2
0 покупок
Теория информации
Задача Задача
25 Мар в 14:15
106 +1
0 покупок
Криптография
Лабораторная работа Лабораторная
25 Мар в 13:46
56 +1
0 покупок
Криптография
Лабораторная работа Лабораторная
25 Мар в 13:40
92 +2
0 покупок
Python
Контрольная работа Контрольная
25 Мар в 13:15
111 +2
0 покупок
Искусственный интеллект
Лабораторная работа Лабораторная
24 Мар в 13:26
98 +2
0 покупок
Искусственный интеллект
Контрольная работа Контрольная
24 Мар в 13:04
71 +1
0 покупок
Темы журнала
Показать ещё
Прямой эфир