Применение алгоритмов интеллектуального анализа текстовых данных

Главная

Магазин

ВКР

Информатика

Применение алгоритмов интеллектуального анализа текстовых данных

МаРгОшкА

Был(а) на сайте 1 месяц назад

Раздел

Программирование

Предмет

Информатика

Тип

ВКР

Просмотров

220

Покупок

Антиплагиат

Не указан

Размещена

9 Ноя 2021 в 20:56

ВУЗ

Не указан

Курс

Не указан

Стоимость

800 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

75информатика 5

970 Кбайт 800 ₽

Описание

Тема выпускной квалификационной работы – «Применение алгоритмов интеллектуального анализа текстовых данных».

Как показывает практика текстовой аналитики, наиболее эффективными средствами повышения качества анализа текстов являются методы и алгоритмы интеллектуального анализа данных.

Применение алгоритмов интеллектуального анализа текстовых данных представляет актуальность и научно-практический интерес.

Оглавление

Введение.................................................................................................................. 5

Глава 1 Обзор и анализ методов и алгоритмов интеллектуального анализа текстовых данных..................................................................................................................... 7

1.1 Метод токенизации................................................................................. 9

1.2 Частота термина в документе (TF-IDF)................................................ 13

1.3 Методы стемминга и лемматизации..................................................... 15

1.4 Стоп-листинг........................................................................................ 19

Глава 2 Обзор и анализ алгоритмов интеллектуального анализа текстовых

данных................................................................................................................... 22

2.1 Алгоритмы токенизации...................................................................... 22

2.2 Алгоритм TF-IDF................................................................................. 26

2.3 Алгоритм лемматизации WordNet....................................................... 29

2.4 Алгоритмы стоп-листинга.................................................................... 31

Глава 3 Разработка программы интеллектуального анализа текстовых данных ... 35 3.1 Выбор среды разработки программы............................................................. 35

3.1.1 Интегрированная среда разработки Visual Studio + Python Tools for Visual Studio........................................................................................................... 35

3.1.2 Интегрированная среда разработки PyCharm..................................... 37

3.1.3 Интегрированная среда разработки Eclipse + PyDEv......................... 38

3.2 Реализация и тестирование программы............................................... 41

Заключение............................................................................................................ 44

Список используемой литературы........................................................................ 45

Список литературы

1. Библиотека NTLK [Электронный ресурс]. URL: http://www.nltk.org/ (дата обращения: 10.06.2021).

2. ВКонтакте опубликовали библиотеку для предобработки текстовых данных [Электронный ресурс]. URL: https://neurohive.io/ru/novosti/vkontakte- opublikovali-biblioteku-dlya-predobrabotki-tekstovyh-dannyh/ (дата обращения: 10.06.2021).

3. Кластеризация и классификация больших текстовых данных с помощью машинного обучения на Java [Электронный ресурс]. URL: https://itnan.ru/post.php?c=1&p=529548 (дата обращения: 10.06.2021).

4. Краткое руководство. Знакомство с интегрированной средой разработки Visual Studio [Электронный ресурс]. URL: https://docs.microsoft.com/ru-ru/visualstudio/ide/quickstart-ide-orientation?view=vs- 2019 (дата обращения: 10.06.2021).

5. Ле Мань Ха. Оптимизация алгоритма KNN для классификации // ТРУДЫ МФТИ. 2016. Том 8, № 1. С. 92-94.

6. Левенштейн В.И. Двоичные коды с исправлением выпадений, вставок и замещений символов // Докл. АН СССР. 1965. 163 (4). C. 845–848.

7. Метод TF-IDF [Электронный ресурс]. URL: https://ru.wikipedia.org/wiki/TF-IDF (дата обращения: 10.06.2021).

8. Отраднов К.К., Раев В.К. Экспериментальное исследование эффективности методик векторизации текстовых документов и алгоритмов их кластеризации. Вестник РГРТУ. 2018. № 64. С. 74-82.

Вам подходит эта работа?

Похожие работы

Информатика

Эксплуатационная практика Прикладная информатика Управление цифровыми проектами, продуктами и инновациями Синергия

900 ₽

AsyaT

Отчет по практике Практика

22 Янв в 11:45

18 +18

1 покупка

Информатика

150 ₽

user610716

Тест Тест

22 Янв в 07:18

15 +15

0 покупок

Информатика

Росдистант, ТГУ. Информационные технологии в юридической деятельности Лабораторные работы 1,2

700 ₽

kwakwa

Лабораторная работа Лабораторная

21 Янв в 21:42

17 +17

0 покупок

Информатика

Росдистант, ТГУ. Информационные технологии в юридической деятельности Практические работы 1-6

1 000 ₽

kwakwa

Контрольная работа Контрольная

21 Янв в 21:39

18 +18

0 покупок

Информатика

Информатика (Темы 1-2) Синергия Колледж 1 семестр Ответы на тесты 0-2, итоговый тест, компетентностный

350 ₽

EasyLearn

Тест Тест

21 Янв в 21:01

19 +19

0 покупок

Другие работы автора

Банковское дело

тест Синергия Банковское дело

230 ₽

МаРгОшкА

Тест Тест

25 Мая 2022 в 19:10

368 +1

1 покупка

Микроэкономика

тест по микроэкономике. Синергия

290 ₽

МаРгОшкА

Тест Тест

20 Мар 2022 в 12:04

363

1 покупка

Адвокатура

Теория и практика адвокатской деятельности. Синергия

280 ₽

МаРгОшкА

Тест Тест

26 Фев 2022 в 18:53

367 +1

3 покупки

Логистика

Снабжение. Синергия

230 ₽

МаРгОшкА

Тест Тест

26 Фев 2022 в 18:48

357

0 покупок

Право

Право недвижимости в практике нотариуса. Синергия

300 ₽

МаРгОшкА

Тест Тест

26 Фев 2022 в 18:44

819 +1

12 покупок

Педагогика

Педагогика высшей школы. Синергия

230 ₽

МаРгОшкА

Тест Тест

26 Фев 2022 в 18:40

373 +1

0 покупок

Социальная психология

Психология социально-правовой деятельности. Синергия

230 ₽

МаРгОшкА

Тест Тест

10 Янв 2022 в 19:14

335

3 покупки

Юриспруденция

Введение в юридическую профессию. Задачи.Синергия

260 ₽

МаРгОшкА

Задача Задача

10 Янв 2022 в 19:08

434 +1

1 покупка

История

Компетентностные задачи по истории. Синергия

260 ₽

МаРгОшкА

Задача Задача

10 Янв 2022 в 18:54

324 +2

0 покупок

Зарубежная история

История государства и права зарубежных стран. Синергия

260 ₽

МаРгОшкА

Тест Тест

10 Янв 2022 в 18:51

391 +1

3 покупки

Психология

тест Лидерство/ответы/Синергия

210 ₽

МаРгОшкА

Тест Тест

9 Дек 2021 в 19:28

407 +1

1 покупка

Трудовое право

Трудовое право/ответы/Синергия

230 ₽

МаРгОшкА

Тест Тест

9 Дек 2021 в 19:10

368 +1

2 покупки

Правовые основы бизнеса

сделки слияния. Синергия

200 ₽

МаРгОшкА

Тест Тест

9 Дек 2021 в 18:43

248 +1

0 покупок

Педагогика

Педагогика высшей школы.Синергия

200 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 19:42

260 +1

2 покупки

Педагогика

Сравнительное правоведение.Синергия

230 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 19:23

353

3 покупки

История

История и методология права. Синергия

150 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 19:01

191 +1

0 покупок

История

История политико-правовых знаний

190 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 18:46

187 +1

0 покупок

История Отечества

История (отечественного )государства и права России. Синергия

230 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 18:32

271

0 покупок

Психология

Психология власти. Синергия

280 ₽

МаРгОшкА

Тест Тест

7 Дек 2021 в 18:22

331 +1

11 покупок

Трудовое право

Практика трудового регулирования отношений в сфере интелектуальной стоимости. Синергия

210 ₽

МаРгОшкА

Тест Тест

6 Дек 2021 в 21:06

181 +1

0 покупок

Предыдущая работа

Реконструкция системы электроснабжения уличной сети освещения города

Следующая работа

Ответы на тест. Архитектура промышленных зданий. Набрано 93%. 507

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир