Цель: на примере экономических данных о стоимостях ценных бумаг выяснить, как методы фильтрации сигналов способны улучшить прогностические характеристики различных широко применяемых моделей прогнозирования и выявить наиболее эффективные комбинации методов фильтрации в отношении каждой прогнозной модели.
Задачи:
1. Собрать данные о стоимостях наиболее волатильных ценных бумаг для пяти российских компаний из открытых баз данных Finam.
2. Провести предобработку данных с целью приведения временных рядов к стационарному виду.
3. Провести фильтрацию временных рядов с применением алгоритмов Empirical Mode Decomposition, Fast Fourier Transform и Wavelet Transform.
4. Сгруппировать отфильтрованные ряды в различные наборы данных соответственно виду фильтрации, включая исходные неотфильтрованные данные.
5. Разделить полученные наборы данных на тренировочные и тестовые выборки.
6. Обучить прогностические модели ARIMAX, XGBoost и Temporal Fusion Transformer на тренировочных данных для каждого типа фильтрации.
7. Сделать модельный прогноз и оценить его качество по метрике SMAPE (Symmetric Mean Average Percentage Error) на тестовой выборке для каждого набора данных, отфильтрованного определенным методом.
8. Агрегировать результаты оценок метрик качества прогноза в единую таблицу для наглядного представления эффективности прогноза конкретной модели в сочетании с каждым методом фильтрации.
9. Сделать выводы о наиболее эффективных сочетаниях методов фильтрации данных с прогностическими моделями из разных областей наук
Методологическая база данного исследования включает в себя теоретический обзор предыдущих научных работ по рассматриваемой проблематике, а также проведение эмпирического анализа с использованием различных методов фильтрации из области спектрального анализа, таких как Empirical Mode Decomposition, Fast Fourier Transform и Wavelet Transform. Оценка качества прогнозирования осуществляется на моделях, относящихся к классической эконометрике, машинному обучению и глубинному обучению: ARIMAX, XGBoost и Temporal Fusion Transformer соответственно.
Данные для исследования включали котировки акций 5 самых волатильных российских компаний по рейтингу Мосбиржи на конец 2023 года, а именно акции компаний: Аэрофлот (AFLT), Ростелеком (RTKM), Мечел (MTLR), Русагро (AGRO) и Юнипро (UTLR).
Для анализа данных и построения моделей используются инструменты языка программирования Python и специализированных библиотек на его основе, таких как: PyMD, pywt, xgboost, gluonts, mxnet, а также pandas и statsmodels.
ВВЕДЕНИЕ 3
ГЛАВА I. ОБЗОР ПРЕДЫДУЩИХ ИССЛЕДОВАНИЙ 7
ГЛАВА II. МЕТОДОЛОГИЯ И ПРИМЕНЕНИЕ АЛГОРИТМОВ ФИЛЬТРАЦИИ 12
1. Empirical Mode Decomposition (EMD) 12
2. Fast Fourier Transform (FFT) 18
3. Wavelet Transform (WT) 27
ГЛАВА III. ПРОГНОЗИРОВАНИЕ ВРЕМЕННЫХ РЯДОВ 33
1. ARIMAX 34
2. XGBoost 41
3. Temporal Fusion Transformer 48
ЗАКЛЮЧЕНИЕ 58
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 60
ПРИЛОЖЕНИЯ 62
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ
1. Ballings, M., Van den Poel, D., Hespeels, N., & Gryp, R. (2015). Evaluating multiple classifiers for stock price direction prediction. Expert systems with Applications, 42(20), 7046 7056.
2. Black, F. (1986). Noise. The journal of finance, 41(3), 528 543.
3. Cowles 3rd, A. (1933). Can stock market forecasters forecast?. Econometrica: Journal of the Econometric Society, 309 324.
4. Dow, C. H. (1884). Dows theory. Wall Street Journal.
5. Engle, R. F., Ng, V. K., & Rothschild, M. (1990). Asset pricing with a factor ARCH covariance structure: Empirical estimates for treasury bills. Journal of econometrics, 45(1-2), 213-237.
всего 23 источника