Алгоритмы машинного обучения для фильтрации спама

Главная

Магазин

Курсовая работа

Информационные технологии

Алгоритмы машинного обучения для фильтрации спама

user326806

Был(а) на сайте 1 час назад

Раздел

Программирование

Предмет

Информационные технологии

Тип

Курсовая работа

Просмотров

256

Покупок

Антиплагиат

Не указан

Размещена

7 Янв 2022 в 16:41

ВУЗ

Не указан

Курс

Не указан

Стоимость

900 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

КУРСОВАЯ Алгоритмы машинного обучения для фильтрации спама

676.2 Кбайт 900 ₽

Описание

Цель курсовой работы — реализовать и сравнить алгоритмы машинного обучения для фильтрации спама.

Для достижения цели поставлены следующие задачи:

· Определить основные понятия машинного обучения

· Выбрать подходящие алгоритмы для решения задачи фильтрации спама

· Подобрать данные для обучения и тестирования

· Реализовать и обучить выбранные алгоритмы

· Сравнить реализованные алгоритмы

Спам — это массово рассылаемые рекламные сообщения конкретных людей или организаций для тех, кто не желает получать таковые сообщения. С появлением в современном мире сети Интернет и связанной с ней электронной почтой резко возникла потребность в фильтрации спама, потому что распространение спам-сообщений стало очень частым явлением для владельцев виртуальных ящиков. В настоящий момент эта проблема не решена до конца, потому что появляются всё новые способы организации вредоносной или просто неприятной рассылки. Современные электронные ящики снабжены своими проработанными системами фильтрации спама, которые в целом работают и отделяют ненужные для пользователя письма, но даже они иногда дают сбой, и происходит неправильная сортировка. Именно из-за этого тема фильтрации спама все еще остается актуальной.

Данная задача с самого начала решалась с помощью методов машинного обучения. По мере развития данной области начали появляться различные классификаторы, которые используются для фильтрации спама, представленного в виде текстового сообщения. Некоторые из таких классификаторов будут главными рассматриваемыми объектами данной работы.

Оглавление

СОДЕРЖАНИЕ

ВВЕДЕНИЕ. 3

1 Теоретическая часть. 4

1.1 Машинное обучение. 4

1.2 Задача классификации. 5

1.3 Классификаторы для фильтрации спама. 6

1.3.1 «Наивный» байесовский алгоритм. 7

1.3.2 Метод опорных векторов. 9

1.4 Метрики для оценки алгоритмов классификации. 14

1.5 Инструментарий и технологии. 16

2 Практическая часть. 18

2.1 Работа с данными для обучения и тестирования модели. 18

2.2 Реализация работы классификаторов и оценка их работы.. 20

ЗАКЛЮЧЕНИЕ. 26

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ. 27

ПРИЛОЖЕНИЕ А Листинг программы классификации спама на основе «наивного» байесовского алгоритма. 29

ПРИЛОЖЕНИЕ Б Листинг программы классификации спама на основе метода опорных векторов. 36

Список литературы

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

1. Курс Введение в машинное обучение [Электронный ресурс]. – URL: https://www.coursera.org/learn/vvedenie-mashinnoe-obuchenie (дата обращения: 01.04.2020).

2. Мюллер, Андреас, Гвидо, Сара. Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными. : Пер. с англ. — СПб. : ООО «Диалектика», 2019. — 480 с.

3. Общие понятия [Электронный ресурс]. – URL: http://neerc.ifmo.ru/wiki/index.php?title=Общие_понятия (дата обращения: 10.05.2020).

4. Машинное обучение [Электронный ресурс]. – URL: http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение (дата обращения: 02.04.2020).

5. Лекция 1. Различные задачи машинного обучения [Электронный ресурс]. – URL: http://www.machinelearning.ru/wiki/images/a/a1/BayesML-2009-1.pdf (дата обращения: 02.04.2020).

6. Скляренко Н.С. Обзор алгоритмов машинного обучения, решающих задачу обнаружения спама // Новые информационные технологии в автоматизированных системах. 2017. №20. [Электронный ресурс]. – URL: https://cyberleninka.ru/article/n/obzor-algoritmov-mashinnogo-obucheniya-reshayuschih-zadachu-obnaruzheniya-spama (дата обращения: 05.04.2020).

7. Бурлаков Михаил Евгеньевич Применение в задаче классификации SMS сообщений оптимизированного наивного байесовского классификатора // Известия Самарского научного центра РАН. 2016. №4-4. [Электронный ресурс]. – URL: https://cyberleninka.ru/article/n/primenenie-v-zadache-klassifikatsii-sms-soobscheniy-optimizirovannogo-naivnogo-bayesovskogo-klassifikatora (дата обращения: 05.04.2020).

8. 6 простых шагов для освоения наивного байесовского алгоритма [Электронный ресурс]. – URL: http://datareview.info/article/6-prostyih-shagov-dlya-osvoeniya-naivnogo-bayesovskogo-algoritma-s-primerom-koda-na-python/ (дата обращения: 05.04.2020).

9. Bayesian poisoning [Электронный ресурс]. – URL: https://en.wikipedia.org/wiki/Bayesian_poisoning (дата обращения: 10.05.2020).

10. Метод опорных векторов [Электронный ресурс]. – URL: https://ru.wikipedia.org/wiki/Метод_опорных_векторов (дата обращения: 05.04.2020).

11. Матрица ошибок (Confusion matrix) [Электронный ресурс]. – URL: https://learnmachinelearning.wikia.org/ru/wiki/Матрица_ошибок_(Confusion_matrix) (дата обращения: 16.05.2020).

12. Оценка классификатора (точность, полнота, F-мера) [Электронный ресурс]. – URL: http://bazhenov.me/blog/2012/07/21/classification-performance-evaluation.html (дата обращения: 16.05.2020).

13. SMS Spam Collection Data Set [Электронный ресурс]. – URL: http://archive.ics.uci.edu/ml/datasets/SMS+Spam+Collection (дата обращения: 22.05.2020).

14. sklearn.naive_bayes.MultinomialNB [Электронный ресурс]. – URL: https://scikit-learn.org/stable/modules/generated/sklearn.naive_bayes.MultinomialNB.html (дата обращения: 15.05.2020).

sklearn.svm.SVC [Электронный ресурс]. – URL: https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html (дата обращения: 15.05.2020).

Вам подходит эта работа?

Похожие работы

Информационные технологии

Информационные технологии в фотоискусстве

290 ₽

Nestykanka

Реферат Реферат

23 Дек в 09:26

16 +16

0 покупок

Информационные технологии

Информационные технологии в сфере безопасности

250 ₽

user831705

Контрольная работа Контрольная

22 Дек в 12:23

13 +13

0 покупок

Информационные технологии

💯 Технологии и системы искусственного интеллекта [Тема 1-5] — ответы на тест Синергия / МОИ / МТИ / МосАП

300 ₽

k4linkin

Тест Тест

21 Дек в 23:38

21 +21

0 покупок

Информационные технологии

Эксплуатационная практика | П.В | Производственная практика 7 семестр [СИНЕРГИЯ]

1 000 ₽

user678033

Отчет по практике Практика

21 Дек в 15:02

10 +10

0 покупок

Информационные технологии

Технологии смешанной реальности

1 450 ₽

alex-study

Курсовая работа Курсовая

20 Дек в 21:03

17 +17

0 покупок

Другие работы автора

Бухгалтерский учет, анализ и аудит

Виды аренды основных средств, сравнительная характеристика текущей и долгосрочной аренды

900 ₽

user326806

Курсовая работа Курсовая

10 Ноя в 13:48

39 +1

0 покупок

Энергетика

Обоснование выбора типа и структуры системы энергообеспечения с участием возобновляемых источников энергии

500 ₽

user326806

Реферат Реферат

10 Ноя в 13:42

0 покупок

Менеджмент

Управление как вид человеческой деятельности

900 ₽

user326806

Курсовая работа Курсовая

10 Ноя в 13:39

41 +1

0 покупок

Право

Частная собственность граждан: понятие, содержание

900 ₽

user326806

Курсовая работа Курсовая

10 Ноя в 13:36

0 покупок

Бухгалтерский учет, анализ и аудит

Учет запасов

500 ₽

user326806

Реферат Реферат

10 Ноя в 13:33

0 покупок

Языкознание

Управление качеством организации образовательного процесса в общеобразовательной школе дистанционные практики иностранных языков

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:40

0 покупок

Экономическая безопасность

Анализ стратегии национальной безопасности РФ. Пути совершенствования системы противодействия новым вызовам и угрозам

1 500 ₽

user326806

Дипломная работа Дипломная

26 Окт в 11:35

34 +1

0 покупок

Организация и планирование производства

Повышение экономической эффективности работы использования производственных мощностей

1 500 ₽

user326806

Дипломная работа Дипломная

26 Окт в 11:33

0 покупок

Бухгалтерский учет, анализ и аудит

ПРОЕКТИРОВАНИЕ ЗАНЯТИЙ ОБЩЕПРОФЕССИОНАЛЬНОЙ ДИСЦИПЛИНЫ ОП 01 ЭКОНОМИКА ОРГАНИЗАЦИИ ДЛЯ ПОДГОТОВКИ БУДУЩИХ БУХГАЛТЕРОВ

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:28

0 покупок

Экономика предприятия

Прибыль предприятия и обоснование путей ее повышения

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:22

0 покупок

Право социального обеспечения

Профессиональные пенсии в РФ

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:20

0 покупок

Логистика

Логистика на уровне международных экономических отношений

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:18

38 +1

0 покупок

Логистика

Экономические методы управления складских хозяйством на базах и складах

900 ₽

user326806

Курсовая работа Курсовая

26 Окт в 11:16

80 +1

0 покупок

Менеджмент

Разработка проекта по развитию социальной инфраструктуры предприятия

1 500 ₽

user326806

ВКР ВКР

26 Окт в 09:55

0 покупок

Управление персоналом

Различия в управлении персоналом в России и Китае

2 000 ₽

user326806

Магистерская диссертация Магистерская диссертация

26 Окт в 09:43

0 покупок

Экономика АПК

ВКР Диагностика финансового состояния предприятия на примере ООО МТС ЕРШОВСКАЯ

1 500 ₽

user326806

ВКР ВКР

26 Окт в 09:39

0 покупок

Финансы и кредит

Финансовые инновации в банковском секторе (на примере Коммерческого банка «ФинТех»

1 500 ₽

user326806

ВКР ВКР

26 Окт в 09:31

0 покупок

Маркетинг

Маркетинговые исследования рынка. Применяемые методы

500 ₽

user326806

Реферат Реферат

18 Окт в 15:04

0 покупок

Маркетинг

Маркетинговые исследования рынка на примере ООО Буквица

900 ₽

user326806

Курсовая работа Курсовая

18 Окт в 15:01

0 покупок

Информационная безопасность

Программно-аппаратные средства защиты информации в сетях и системах передачи данных

1 500 ₽

user326806

ВКР ВКР

18 Окт в 14:58

1 покупка

Предыдущая работа

[Росдистант] Электроэнергетические системы и сети (курсовой проект, вариант Ц-Щ)

Следующая работа

Нормативно-правовые акты в системе Российского законодательства

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир