Дата изготовления: май 2024 года.
Цель данной работы изучение технологий Big Data и статистических методик для анализа одномерных временных рядов курсов ценных бумаг.
Для достижения поставленной цели необходимо решить следующие задачи:
– сделать обзор сфер применимости технологий «больших данных»;
– рассмотреть инструменты Data Science;
– изучить некоторые алгоритмы машинного обучения, используемые для моделирования временных рядов;
– протестировать изученные алгоритмы на реальных данных и построить прогнозы.
Есть приложение.
Работа была успешно сдана - заказчик претензий не имел.
Готовые работы я могу оперативно проверить на оригинальность по Antiplagiat .ru и сообщить Вам результат.
Введение 3
1 Технологии Big Data и сферы применения 5
2 Алгоритмы прогнозирования временных рядов финансовых данных 17
2.2 Логистическая регрессия 17
2.3 Линейный дискриминантный анализ 21
2.4 Квадратичный дискриминантный анализ 27
3 Прогнозирование курса акций с использованием библиотеки Scikit-Learn языка программирования Python 29
Заключение 36
Список использованных источников 37
Приложение А Код реализации статистических методов в Python 39
1 Финам.ru – инвестиционная компания, брокер, Фондовая биржа ММВБ и РТС, стоимость, котировки, курс акций URL: http://finam.ru/ (дата обращения 10.06.2018)
2 Douglas, L. 3D Data Management: Controlling Data Volume, Velocity and Variety, L. Douglas, – Gartner, 2001.
3 Christy Pettey, Gartner Says Solving 'Big Data' Challenge Involves More Than Just Managing Volumes of Data / Christy Pettey, Laurence Goasduff, – Gartner, 2011.
4 Data Age 2025: The Evolution of Data to Life-Critical URL: https://www.seagate.com/www-content/our-story/trends/files/Seagate-WP-DataAge2025-March-2017.pdf (дата обращения 10.06.2018)
5 Натан Марц, Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени / Натан Марц, Джеймс Уоррен, – М.: Вильямс. -2016. -292 c.
6 Haihong, E., Survey on NoSQL database, Pervasive Computing and Applications (ICPCA) / E. Haihong, Le Guan, Du Jian, – 2011 6th International Conference on 26-28 Oct. 2011, p. 363-366
7 Ghemawat, S., MapReduce: Simplified Data Processing on Large Clusters Proc. of the Sixth Symposium on Operating System Design and Implementation / S. Ghemawat, J. Dean, – San Francisco, USA, 2004. Vol. 6, N 10. P. 137-150.
8 White, T., Hadoop: The definitive guide / T. White, – 3rd -O’Reilly Media, 2012. 688 p.
9 Цыплаков, А.А., Некоторые эконометрические методы. Метод максимального правдоподобия в эконометрии / А.А. Цыплаков, – Учебное пособие. - Новосибирск: НГУ, 1997, 129 с.
10 Дубров, А.М., Многомерные статистические методы / А.М. Дубров, В.С. Мхитарян, Л.И. Трошин, – Москва. 2003г., 352 с.
11 Linear and Quadratic Discriminant Analysis URL: http://scikit-learn.org/stable/modules/lda_qda.html#id1 (дата обращения 10.06.2018)
12 Hastie, T., The Elements of Statistical Learning / T. Hastie, R. Tibshirani, J. Friedman, – Section 4.3, 2008, p.106-119.