ВКР Исследование особенностей построения моделей машинного обучения на малых наборах данных в биомедицине

Главная

Магазин

Дипломная работа

Прикладная математика

ВКР Исследование особенностей построения моделей машинного обучения на малых наборах данных в биомедицине

Псевдосфера

Был(а) на сайте 7 часов назад

Раздел

Математические дисциплины

Предмет

Прикладная математика

Тип

Дипломная работа

Просмотров

136

Покупок

Антиплагиат

Не указан

Размещена

11 Фев 2023 в 13:38

ВУЗ

Не указан

Курс

Не указан

Стоимость

1 000 ₽

Файлы работы

Каждая работа проверяется на плагиат, на момент публикации уникальность составляет не менее 40% по системе проверки eTXT.

ВКР Исследование особенностей построения моделей машинного обучения на малых наборах данных в биомедицине

1.2 Мбайт 1 000 ₽

Описание

На 1 февраля 2023 года оригинальность более 80%

Могу проверить вам актуальную оригинальность работы при покупке, пишите в личку.

Оригинал документа в pdf, конвертация в Word автоматическая (в word могут быть недочеты, которые вы легко исправите самостоятельно)

В данной работе были рассмотрены проблемы при работе с наборами данных в биомедицине, которые затрудняют применение классических моделей машинного обучения. Этот список проблем включает ограниченность по размеру, несбалансированность классов, пропущенные значения, большое количество признаков и другие. В ходе исследования были выведены инструменты для их решения и также описано их влияние на различные модели, которые применяются для решения задач классификации, кластеризации и регрессии.

В ходе разработки программного кода были построены модели машинного обучения с применением описанных инструментов. Для написания кода был использован язык программирования Python, который является одним из основных инструментов для осуществления интеллектуального анализа данных.

В современном мире существует необходимость хранения и обработки

огромного количества информации и данных. Аналитики и исследователи изучают данные, с целью найти возможные закономерности и зависимости между различными показателями. Благодаря увеличению вычислительной мощности, памяти и способности генерации ошеломляющих объемов данных компьютеры используются для выполнения широкого спектра сложных задач, с которыми им удается справляться с впечатляющей скоростью и точностью. Машинное обучение – один из наиболее значимых инструментов, который помогает продвигать прогресс в развитии искусственного интеллекта, а также участвует в работе с данными и их анализе.

Основным инструментом машинного обучения, как научной области, является статистика. Статистические методы помогают осуществлять разработку проектов прогнозного моделирования, а также интерпретировать результаты полученной модели. Машинное обучение также включает в себя и математику и компьютерные науки. Фундаментальные математические знания важны, чтобы анализировать результаты применения алгоритмов обработ-ки данных, и, в частности, для понимания алгоритмов построения классификаторов. А компьютерные науки используются непосредственно как инструмент для построения моделей машинного обучения.

Машинное обучение широко используется как в научных кругах, так и в таких прикладных предметных областях: фондовые, валютные рынки, демография, маркетинг, бизнес, банковская система. На данный момент практически любая область требует использования анализа данных и методов машинного обучения для стимулирования разработки «интеллектуальных продуктов», способных делать точные прогнозы с использованием различных источников данных.

В нашей работе мы рассмотрим одну из важнейших областей, где применяется машинное обучение и интеллектуальный анализ данных -биомедицина. Биомедицина – это раздел медицины, изучающий организм человека с точки зрения теории, его строение, функции в состоянии болезни, их диагностики, коррекции и лечения. В биомедицине так же собираются данные о пациентах, начиная от анализов крови, заканчивая томографией мозга. В совокупности некоторый набор показателей может напрямую сказываться на факторы появления конкретной болезни, а также, возможность выявления высокого риска возникновения неотложных медицинских ситуаций, таких как рецидив или переход в другое болезненное состояние. Благодаря возможности комплексного анализа существующих данных область биомедицины может выйти на совершенно новый уровень и открыть новые методы для лечения болезней и их избежание.

В частности, применение машинного обучения в биомедицине способно решить следующие задачи:

• Определить вид заболевания

• Выбрать оптимальную стратегию лечения

• Спрогнозировать развития болезни

• Вычислить риск возможных осложнений в будущем

• Выявить синдромы и признаки определенной болезни

Оглавление

Содержание ........................................................................................................................ 3 Введение ............................................................................................................................. 4 1. Теоретический аспект проблемы малого набора данных ....................................... 8

1.1 Необходимые сведения из машинного обучения .................................................. 8 1.2 История применения машинного обучения в биомедицине .............................. 12 1.3 Основные проблемы работы с малыми наборами данных в биомедицине ...... 15

2. Основные подходы для работы с малыми наборами данных .............................. 24 2.1 Алгоритмы работы с данными .............................................................................. 25 2.2 Показатели точности модели ................................................................................ 33 2.3 Инструменты для решения проблем малого набора данных ............................. 38

3. Применение иструментов по работе с малыми наборами данных ...................... 46 3.1 Обучение моделей .................................................................................................. 46 3.2 Результаты ............................................................................................................... 59

Заключение ....................................................................................................................... 61 Список используемой литературы ................................................................................. 62 Приложения...................................................................................................................... 65

Список литературы

1. Rong, G. Artificial Intelligence in Healthcare: Review and Prediction Case

Studies. / G. Rong, A. Mendez, E.B. Assi, B. Bo Zhao, M. Sawan // Engineering 6 (2020) 291-301

2. Sidey-Gibbons, J.A.M. Machine learning in medicine: a practical introduction /

J. A.M. Sidey-Gibbons, C.J. Sidey-Gibbons // Sidey-Gibbons and Sidey-Gibbons BMC Medical Research Methodology (2019) 19:64

3. Forman, G. Learning from Little: Comparison of Classifiers Given Little Training. / G. Forman, I. Cohen// PKDD 2004, LNAI 3202, pp. 161–172, 2004.

4. Shaikhina, T. Machine Learning for Predictive Modelling based on Small Data in Biomedical Engineering. / T. Shaikhina, D. Lowe, S. Daga, D. Briggs, R.

Higgins, N. Khovanova.// IFAC-PapersOnLine 48-20 (2015) 469–474

5. Tanwani, A.K. Guidelines to Select Machine Learning Scheme for

Classification of Biomedical Datasets. /A.K. Tanwani, J. Afridi, M.Z. Shafiq, M. Farooq// EvoBIO 2009, LNCS 5483, pp. 128–139, 2009.

6. Segovia, F. Multivariate analysis of dual-point amyloid PET intended to assist

the diagnosis of Alzheimer’s disease. /F. Segovia, J. Ramírez, D. Castillo-Barnes, D. Salas-Gonzalez, M. Gómez-Río, P. Sopena-Novales, C. Phillips, Y. Zhang, J.M. Górriz// Neurocomputing 417 (2020) 1-9.

7. Su, C. Mining genetic and transcriptomic data using machine learning approaches in Parkinson’s disease./ C. Su, J. Tong, F. Wang// npj Parkinson’s

Disease (2020) 6:24

8. Jubair, S. A novel approach to identify subtype-specifc network biomarkers

of breast cancer survivability. / S. Jubair, A. Alkhateeb, A.A. Tabl, L. Rueda,

A. Ngom //Network Modeling Analysis in Health Informatics and Bioinformatics (2020) 9:43

9. Schperberg, A.V. Machine learning model to predict oncologic outcomes for

drugs in randomized clinical trials. Int. J. Cancer. / A.V. Schperberg, A. Boichard, I.F. Tsigelny, S.B. Richard, R. Kurzrock// 2020;147:2537–2549.

10. Sarrouti, M. A Machine Learning-based Method for Question Type Classification in Biomedical Question Answering. /M. Sarrouti, S.O.E. Alaoui//

Methods Inf Med 2017; 56: 209–216.

11. Nguyen, D.H. Recent advances and prospects of computational methods for

metabolite identification: a review with emphasis on machine learning approaches. /D.H. Nguyen, C.H. Nguyen, H. Mamitsuka// Briefings in Bioinformatics, 20(6), 2019, 2028–2043.

12. Tran, T. Risk stratification using data from electronic medical records better predicts suicide risks than clinician assessments. /T. Tran, W. Luo, D. Phung,

R. Harvey, M. Berk, R.L. Kennedy, S. Venkatesh // Tran et al. BMC Psychiatry 2014, 14:76.

13. Foster, K.R. Machine learning, medical diagnosis, and biomedical engineering research – commentary. /K.R. Foster, R. Koprowski, J.D Skufca// Foster et al. BioMedical Engineering OnLine 2014, 13:94.

14. Podgorelec, V. Decision Trees: An Overview and Their Use in Medicine. /V. Podgorelec, P. Kokol, B. Stiglic, I. Rozman // Journal of Medical Systems, Vol.

26, No. 5, October 2002

15. Bone, D. Applying Machine Learning to Facilitate Autism Diagnostics: Pitfalls

and Promises. / D. Bone, M.S. Goodwin, M.P. Black, C. Lee, K. Audhkhasi, S.Narayanan// J Autism Dev Disord (2015) 45:1121–1136

16. Campbell, C. Machine Learning Methodology in Bioinformatics. / C. Campbell

// Springer Handbook of Bio- / Neuroinformatics (2014) 185:206

17. Steyerberg, E.W. Internal and external validation of predictive models: A

simulation study of bias and precision in small samples. / E.W. Steyerberg, S.E. Bleeker, H.A. Moll, D.E. Grobbee, K.G.E. Moons // Journal of Clinical Epidemiology 56 (2003) 441–447.

18. Zitnika, M., Nguyenb, F., Wang, B., Leskovec, J., Goldenberg, A., Hoffman,

M.M. Machine Learning for Integrating Data in Biology and Medicine: Principles, Practice, and Opportunities. /M. Zitnika, F. Nguyenb, B.Wang, J.

Leskovec, A. Goldenberg, M.M. Hoffman //Information Fusion 50 (2019) 71:91

19. Holder, L.B. Machine learning for epigenetics and future medical applications.

/L.B. Holder, M.M. Haque, M.K. Skinner //ISSN: 1559-2294 (Print) 1559-2308.

20. Habr.com: сайт. – URL: https://habr.com/ru/post/470650/ (дата обращения

01.03.2021)

Вам подходит эта работа?

Похожие работы

Прикладная математика

Прикладная математика.ти (тест с ответами Синергия/МОИ/ МТИ /МОСАП)

300 ₽

Andrey_Petrov

Тест Тест

12 Янв в 19:00

37 +7

1 покупка

Прикладная математика

Пакеты прикладных программ диф. зачет ТУСУР ответы

100 ₽

Catastrophe

Тест Тест

19 Дек 2024 в 10:40

0 покупок

Прикладная математика

Задание на контрольной работе

200 ₽

Apachmen

Задача Задача

18 Ноя 2024 в 00:12

0 покупок

Прикладная математика

Задание на контрольной работе

200 ₽

Apachmen

Задача Задача

18 Ноя 2024 в 00:10

0 покупок

Прикладная математика

ВКР Развитие уровня технологической готовности проекта стартапа «АгроСпектр»

900 ₽

ВасилийТеркин

Дипломная работа Дипломная

18 Ноя 2024 в 00:08

44 +1

0 покупок

Другие работы автора

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ЮЖУРАЛЗОЛОТО ГРУППА КОМПАНИЙ» 2021-2023 гг. ИНН 7424024375 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 18:08

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ГРУППА ПОЗИТИВ» 2021-2023 гг. ИНН 9718077239 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:58

65 +1

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «Пик-Специализированный Застройщик» 2021-2023 гг. ИНН 7713011336 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:52

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «Лизинговая компания «Европлан» 2021-2023 гг. ИНН 9705101614 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:29

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ПАО «ГРУППА АСТРА» 2021-2023 гг. ИНН 7726476459 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

2 Янв в 17:05

78 +1

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «МИЛКОМ» 2021-2023 гг. ИНН 1834100340 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:51

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «ЖИГУЛЕВСКОЕ ПИВО» 2021-2023 гг. ИНН 6315526630 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:43

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности АО «ЗАВОД «КОМЕТА» 2021-2023 гг. ИНН 5321038774 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:39

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ШИНСЕЙЛ» 2021-2023 гг. ИНН 9724055868 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:31

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «Рентал-СтройСервис» 2021-2023 гг. ИНН 5434115363 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:28

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «СМАРТТЕХТРЕЙД» 2021-2023 гг. ИНН 1650381404 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:25

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ПОЛАТИ» 2021-2023 гг. ИНН 5029188770 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:20

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «КРЫМ ВОДОВОЗ» 2021-2023 гг. ИНН 9102265884 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:17

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ТЕПЛОВИК» 2021-2023 гг. ИНН 1660276293 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:14

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ОКЕЙ» 2021-2023 гг. ИНН 7826087713 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:11

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «КАСКАДЦЕНТР» 2021-2023 гг. ИНН 4345321041 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:07

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ТНГ-АлГИС» 2021-2023 гг. ИНН 1644034890 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 15:02

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «СОЛНЕЧНЫЙ СВЕТ» 2021-2023 гг. ИНН 7731316845 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 14:58

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО ПК «Современные окна» 2021-2023 гг. ИНН 2465214418 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 14:55

0 покупок

АФХД - Анализ финансово-хозяйственной деятельности

Анализ финансово-хозяйственной деятельности ООО «ДОМОВОЙ-ГРУПП» 2021-2023 гг. ИНН 5944207090 Анализ финансового положения и эффективности деятельности

450 ₽

Псевдосфера

Задача Задача

30 Дек 2024 в 14:52

45 +1

0 покупок

Предыдущая работа

ВКР Глубокое обучение с подкреплением в задачах управления финансовыми портфелями

Следующая работа

ВКР Анализ предметной области и формирование требований к разрабатываемой базе данных

Закажите новую работу, выполненную по вашим требованиям у эксперта.

Темы журнала

Статьи справочника

Прямой эфир