FEATURE ENGINEERING НА БАЗЕ ДИНАМИЧЕСКИХ ФАКТОРОВ ДЛЯ ПРОГНОЗНОГО МОДЕЛИРОВАНИЯ РАЗВИТИЯ И ЭВОЛЮЦИИ ЭКОНОМИЧЕСКИХ СИСТЕМ

Витлинский В.В.
д.э.н., профессор
wite101@meta.
Катунина О.С.
к.э.н., доцент
uaprommet@ukr.net
Киевский национальный экономический университет имени Вадима Гетьмана, г. Киев

Презентация

В настоящее время технологии Learning Feature Engineering (LFE), изначально разрабатываемые для перекрестных данных, становятся особенно востребованными для прогнозного моделирования временных рядов. При анализе одномерных рядов для всего временного ряда, либо только для скользящих или расширяющихся окон, обычно генерируются признаки на базе описательных статистик, физических показателей нелинейности и сложности системы, а также измеряющие периодичность поведения данных в пределах временного ряда, периодограммы [1].

LFE-исследования в области моделирования динамики развития и эволюции экономики в числе базовых методов используют кластерный анализ временных рядов, в том числе анализ сходства по метрикам расстояний, например, метрике динамической деформации времени (Dynamic Time Warping – DTW). Для моделирования динамических процессов, зафиксированных в виде последовательностей наблюдений во времени наиболее перспективны модели глубокого обучения Deep Learning на базе рекуррентных нейронных сетей [2].

В данной работе рассматривается LFE – подход на базе динамических факторов, которые извлекаются в процессе динамического факторного моделирования на данных временных рядов. Для построения моделей используются идеи динамического факторного анализа (ДФА), сочетающего в себе методы классического факторного анализа и векторной авторегрессия.

В отличие от существующих методов прогнозирования отдельных временных рядов, при динамическом факторном моделировании рассматривается динамика системы в целом. Это позволяет найти паттерны в данных динамики, латентные связи между показателями, которые можно эффективно идентифицировать при сравнении разных моделей и использовать для конструирования оптимального пространства предикторов. В моделях ДФА используется возможность минимизировать ошибку определенного показателя, что позволяет получить мультивариантный прогноз и рассмотреть альтернативные сценарии развития и эволюции динамической экономической системы.

Для оценивания эффективности разработанного подхода построено несколько моделей динамических экономических систем. Первая – для анализа и прогнозирования мировых фондовых индексов [3]. Полученные ошибки прогнозных значений, хотя и отличаются друг от друга, в целом достаточно малы и не превышают 3,1% для индекса Dow Jones DJIA, 1,9% для индекса DAX, 0,5% для ряда других.

Вторая модель построена для анализа динамики системы макроэкомических показателей, отражающих изменения в экономике некоторых стран Европы в течение последних 20 лет [4], ошибка прогноза отдельных показателей не превышала 5%, а для некоторых была менее 1%.

Третья модель описывала динамику курсов основных криптовалют к доллару США. Из десяти криптовалют с разной долей в портфеле инвестиций, было оставлено пять: Bitcoin (ВTC), Ethereum (ETH), Bitcoin Cash (BCH), Litecoin (LTC) и Monero, т.е. валюты, которые имеют наибольшую стоимость и объем оборота. Сформирована динамическая система, состоящая из десяти показателей курсов криптовалют (спрос и предложение для пяти валют) на данных за десять месяцев с 1 марта по 31 октября 2020 г. В качестве базовой выбрана двухфакторная модель ДФА с двумя единицами запаздывания. Построены интервальные и рекурсивные прогнозы, в модель включались одинаковые временные ряды с разной длиной шага, использовался переход к увеличению шага с усреднением данных наблюдений на новом интервале. Построенные модели позволили получить ошибки прогнозных значений на уровне 20% для ВТС, 15% для ETH и 4-7% для других криптовалют, что ниже точности моделей, предложенных в [5], однако позволило смоделировать развитие и эволюцию не отдельных временных рядов, а их системы в целом.

Полученные результаты позволяют утверждать, что, в рамках рассмотренного LFE–подхода, разработаны инструменты динамического факторного моделирования на данных временных рядов, в частности, построен комплекс моделей ДФА. В отличие от существующих инструментальных подходов к анализу динамических экономических систем, возникает возможность активного вмешательства в процесс построения соответствующих моделей для минимизации ошибки произвольно выбранного показателя в процессе проведения ex-post анализа. В построенных моделях ошибка прогноза отдельных показателей не превышала 5%, а для некоторых была менее 1%. Получение такого уровня достоверности прогнозов открывает новые возможности для анализа динамики произвольных динамических экономических систем.

ЛІТЕРАТУРА

  1. Zheng A., Casari A. Feature Engineering for Machine Learning: Principles and Techniques for Data Scientists. 1st Edition. O’Reilly Media; March 2018 – 325 p.
  2. Nielsen A. Practical Time Series Analysis: Prediction with Statistics and Machine Learning. O’Reilly Media, 2019. — 500 p.
  3. Катунина О.С. Моделирование динамики мировых фондовых индексов. // Бізнесінформ. – 2017, 11. − 197–202.
  4. Вітлінський В.В., Катуніна О.С. Моделювання динамічних факторних систем макроекономічних показників деяких країн. Науковий журнал “Наукові записки Національного університету”Острозька академія" серія “Економіка”", 2019, №13(41), с. 88-97.
  5. Дербенцев В.Д., Великоіваненко Г.І., Даценко Н.В. Застосування методів машинного навчання до прогнозування часових рядів криптовалют. Нейро-нечіткі технології моделювання в економіці. 2019. № 8. С. 65–93.