Прогнозирование доходности на фондовом и валютном рынках на основе моделей искусственных нейронных сетей тема диссертации по экономике, полный текст автореферата

Ученая степень
кандидата экономических наук
Автор
Головачев, Сергей Сергеевич
Место защиты
Москва
Год
2014
Шифр ВАК РФ
08.00.10

Автореферат диссертации по теме "Прогнозирование доходности на фондовом и валютном рынках на основе моделей искусственных нейронных сетей"

На правах рукописи

ГОЛОВАЧЕВ СЕРГЕЙ СЕРГЕЕВИЧ

ПРОГНОЗИРОВАНИЕ ДОХОДНОСТИ НА ФОНДОВОМ И ВАЛЮТНОМ РЫНКАХ НА ОСНОВЕ МОДЕЛЕЙ ИСКУССТВЕННЫХ НЕЙРОННЫХ

СЕТЕЙ

Специальность: 08.00.10 - Финансы, денежное обращение и кредит

Автореферат диссертации на соискание ученой степени кандидата экономических наук

Москва-2014

2 4 ИЮЛ 2014

005550673

005550673

Работа выполнена на кафедре международных валютно-финансовых отношений федерального государственного автономного образовательного учреждения высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Научный руководитель доктор экономических наук

Евстигнеев Владимир Рубенович Официальные оппоненты Семенкова Елена Вадимовна

доктор экономических наук, профессор, Высшая школа международного бизнеса РАНХиГС, заведующая кафедрой управления капиталом Бахтизин Альберт Рауфович

доктор экономических наук, доцент, ФГБУН ЦЭМИ РАН, заведующий лабораторией компьютерного моделирования социально-экономических процессов Ведущая организация ФГБУН Институт экономики РАН Защита состоится «07» октября 2014 года в 16:00 часов на заседании диссертационного совета Д 212.048.07 при Национальном исследовательском университете «Высшая школа экономики» по адресу: 101000, г. Москва, ул. Мясницкая, д.20, ауд. 327-К.

С диссертацией можно ознакомиться в библиотеке и на сайте (http://www.hse.ru) Национального исследовательского университета «Высшая школа экономики». Автореферат разослан '/Ъ уЮР-^Я 2014 г. Ученый секретарь диссертационного совета, доктор экономических наук, профессор Философова Татьяна Георгиевна

Общая характеристика работы

Актуальность диссертационного исследования имеет как теоретические, так и практические основания. В условиях глобализации зависимость реального сектора экономики и благосостояния физических лиц от процессов, происходящих на финансовых рынках, очень велика. Особенно сильно это можно было ощутить в ходе мирового финансового кризиса 2008 года, когда обвал финансового сектора повлек за собой рецессию во многих мировых экономиках. Теоретическое описание массовых ожиданий участников финансового рынка и прогнозирование на этой основе котировок позволяют обогатить инструментарий финансового анализа высоко эффективными формальными методами.

В финансовом анализе искусственные нейронные сети рассматриваются как механизм реконструкции репрезентативного агента, принимающего решения, и благодаря своим отличительным характеристикам могут быть использованы для прогнозирования доходности на фондовом и валютном рынке.

В диссертации рассматриваются наиболее ликвидные фондовые и валютные рынки развитых стран, поскольку именно рынки с наибольшей ликвидностью бывают наиболее близки к состоянию информационной эффективности. Это состояние заявлено в качестве цели для суверенных регуляторов финансовых рынков и отражено, в частности, в документах Международной организации комиссий по ценным бумагам (IOSCO), что делает именно развитые рынки наиболее интересным, «чистым» объектом исследования.

Отдельная важная проблема в рамках исследований искусственных нейронных сетей и повышения эффективности их прогнозных способностей - это различные способы обработки входных данных. Это объясняется тем, что в последние годы массивы данных, доступные финансовым аналитикам, существенно возросли, а взаимосвязи между ними, в том числе причинно-

следственные, усложнились. Поэтому в рамках данной работы основное внимание будет уделено исследованию и применению различных инструментов обработки эмпирических данных перед их предъявлением искусственным нейронным сетям и сравнительному анализу их возможностей для прогнозирования доходности на фондовом и валютном рынках развитых стран. В частности, будут подробно рассмотрены метод главных и метод независимых компонент, которые используются во многих научно-исследовательских работах, в частности, по количественным финансам.

/Следует добавить, что полезность исследований с помощью искусственных нейронных сетей нельзя связывать только с финансово-экономической сферой. Полученные исследовательские результаты могут дать важный синергетический эффект для других отраслей науки. В числе наиболее перспективных можно выделить когнитивную психологию, теории принятия решений индивидуумами и группами лиц, а также поведения больших социальных систем.

Степень разработанности темы в научной литературе. На протяжении последние „лет можно выделить большое количество исследований по теоретическим и по практическим аспектам применения искусственных нейронных сетей, на изучении которых сделан акцент в данной работе. Разброс публикаций по данной тематике достаточно широк.

Первыми стали труды У. Мак-Каллокка и В. Питтса, Ф.Розенблатта, Д.Хебба. К попыткам систематизировать информацию (прежде всего, типологию) в данной области можно отнести работы, К.Бишопа, В.Круглова, П. Макнелиса, К.Файфа, С.Хайкина. Используемые в работе методы предварительной обработки данных перед предъявлением искусственным нейронным сетям широко рассматриваются в работах А. Бека и А. Вайгенда, Й. Горрица и др., Л. Делатавера и др., Й. Джолиффа, П. Комона, А. Хюваринена.

Существует обширная литература, где описывается построение полноценных моделей искусственного интеллекта с помощью искусственных нейронных сетей и экспериментального взаимодействия агентов в больших имитационных системах. Отметим публикации С.Альфарано и др., А. Баравиера и др., Р. Конта и Ж.-Ф. Боше, Б. Лебейрона, Б. Макмуллина, М.Митчелл, Р. Да Силва и др.

Кроме этого можно выделить широкий спектр публикаций, связанных именно финансовыми рынками, а именно с прогнозированием доходности на фондовом и валютном рынках с помощью искусственных нейронных сетей (вплоть до сегментации по географической принадлежности). В числе интересных работ можно отметить исследования М. Амин и др., Й. Боллен и др., Й.-К. Квон и др., П. Тенти, Х.-Г. Циммерманна и др.

Однако во многих опубликованных работах наблюдается следующая дихотомия: с одной стороны, в крупных фундаментальных трудах проводится детальный разбор типов искусственных нейронных сетей, принципов их построения и особенностей обучения, зачастую без практического применения предлагаемых моделей (особенно на финансовых рынках); с другой стороны, в практических статьях в большинстве случаев главной целью ставится финансовая результативность исследуемой модели (доходность виртуального инвестиционного портфеля), но при этом не проводится достаточно глубокий разбор теоретических выводов. Важной особенностью данной работы является синтез практического применения построенных моделей и теоретического анализа полученных результатов.

Основная научная гипотеза состоит в том, что модели искусственных нейронных сетей могут имитировать формирование ожиданий репрезентативного агента (инвестора) на финансовых рынках. Основными характеристиками процесса формирования этих ожиданий считаются ограниченная рациональность,

самообучение, а также возникновение субъективно полных картин будущего (self-attribution) на основе сценарной интерпретации прошлой информации. Эти особенности способа принятия инвестиционных решений эффективно имитируются с помощью конкурентных механизмов предварительной обработки входных данных (по сравнению с другими методами обработки, а также методами, не использующими предварительную обработку входных данных) в самоорганизующихся искусственных нейронных сетях Кохонена - Хакена и роевой архитектуры. В результате может быть существенно повышено качество прогнозирования"доходности на финансовых рынках развитых стран по критерию роста виртуального инвестиционного портфеля.

В рамках исследования предполагается, что распределения логарифмических доходностей на финансовых рынках порождаются механизмом, систематически отклоняющимся от центральной предельной теоремы, что соответствует состоянию неполной информационной эффективности. Под состоянием неполной информационной эффективности подразумевается определённая временная задержка в обработке данных агентами на финансовых рынках и соответствующая отложенная реакция цен на поступающую информацию. В свою очередь, это служит естественной предпосылкой для прогнозирования динамики финансовых рынков с помощью аналитических моделей, обращающихся к прошлым значениям временных рядов (в том числе моделей искусственных нейронных сетей).

Принятый в диссертации подход позволяет придать строгую количественную форму результатам, полученным в области поведенческих финансов, для которых критически важен механизм принятия решений репрезентативным агентом. Эти результаты затем используются для прогнозирования финансовых рынков.

Объект исследования - рыночные портфели (фондовые индексы) развитых стран и валютные пары. Предмет исследования - прогнозирование доходности на фондовых рынках развитых стран и валютном рынке с помощью моделей искусственных нейронных сетей с предварительной обработкой входных данных.

Цель диссертационного исследования — предложить способы прогнозирования доходное™ на фондовом и валютном рынках развитых стран с помощью моделей искусственных нейронных сетей с предварительной обработкой входных данных, которые соответствуют типичным реакциям лиц, принимающих решения, по критерию роста виртуального инвестиционного портфеля, построенного на основе прогнозов сети.

В соответствии с этой целью в работе ставятся и решаются следующие задачи:

• показать возможность прогнозирования доходности на финансовых рынках с помощью моделей искусственных нейронных сетей как механизма, имитирующего принятие решений репрезентативным агентом;

• сравнить использование метода главных компонент (principal component analysis) и метода независимых компонент (independent component analysis) в качестве различных форм предварительной обработки входных данных для искусственных нейронных сетей при прогнозировании доходности на финансовых рынках;

• показать, что предварительная обработка входных данных с помощью методов главных и независимых компонент, которая сводится только к сокращению размерности входного пространства или заданию контекстной памяти, недостаточна для получения эффективного результата при прогнозировании доходности на финансовых рынках;

• предложить новую спецификацию искусственной нейронной сети для прогнозирования доходности на финансовых рынках, в которой

предварительная обработка входных данных осуществляется на основе конкурентных механизмов взаимодействия - как внутри одной сети, так и между несколькими независимыми сетями;

• -решить типичные технические проблемы в построении искусственных нейронных сетей, такие как интерпретация результатов обработки входных данных с помощью метода независимых компонент и подбор начальных значений сети при прогнозировании доходности на финансовых рынках;

• на основе полученных результатов получить строгие формальные • выводы о применимости определенных видов искусственных

нейронных сетей на финансовых рынках различного типа. Теоретической и методологической основой исследования служат труды известных учёных в области экономики и финансовой математики, среди которых К.Бишоп, Т. Кохонен, Б. Крозе и П. Смагт, К.Файф, С.Хайкин, Г.Хакен, а также другие значимые исследования, посвященные искусственным нейронным сетям.

Большое значение для выбора автором методов исследования и формирования подходов к анализу искусственных нейронных сетей имели работы В.Р. Евстигне№а, A.A. Ежова и С.А.Шумского, Г.Г. Малинецкого, А.Б. Потапова, И.Р. Пригожина, Й.Фойта, Я. Хейгемана, А. Хюваринена, а также многие работы в области поведенческих финансов.

Информационная база. Для практического тестирования построенных в работе моделей искусственных нейронных сетей были использованы реальные котировки фондового и валютного рынков: официальные данные по фондовым индексам S&P 500 (США), FTSE 100 (Великобритания), DAX 30 (Германия), САС 40 (Франция), BEL 20 (Бельгия), АТХ 20 (Австрия), Nikkei 225 (Япония), а также по валютным парам евро/американский доллар, евро/британский фунт,

евро/японская йена, британский фунт/американский доллар, американский доллар/японская йена.

Научная новизна диссертации заключается в установлении важных особенностей распределения доходностей и ценообразования на финансовых рынках с помощью искусственных нейронных сетей, а также в разработке двух новых моделей искусственных нейронных сетей и уточнении применимости одной существующей для прогнозирования фондового и валютного рынков, а именно:

• установлена связь между качеством прогнозирования фондового рынка с помощью предложенных в работе искусственных нейронных сетей по критерию роста виртуального инвестиционного портфеля и наличием «выбросов» в распределении доходностей, доказана способность таких

. моделей фиксировать редкие движения цен на финансовом рынке;

• выявлены особенности ценообразования на фондовом и валютном рынке (доля «шумовой» компоненты), которые обуславливают качество их прогнозирования с помощью искусственных нейронных сетей по критерию роста виртуального инвестиционного портфеля;

• для прогнозирования доходности на фондовом и валютном рынках адаптирована модель распознавания образов Хакена на основе метода главных и метода независимых компонент и использована в качестве искусственной нейронной сети с контекстной памятью;

• для прогнозирования доходности на фондовом и валютном рынках разработана модель искусственной нейронной сети на основе адаптированной для финансовых рынков модели Хакена и самоорганизующихся карт (сети Кохонена);

• для прогнозирования доходности на фондовом и валютном рынках построена модель из комитета искусственных нейронных сетей, соединяющая кластеризацию входных данных и обучение нескольких независимых, конкурирующих, искусственных нейронных сетей. Следует отметить^ что в диссертационном исследовании равное внимание было уделено как методическим особенностям построения, так и практическому тестированию моделей искусственных нейронных сетей. Полученные результаты могут стать важным вкладом в российскую научную литературу по тематике искусственных нейронных сетей, где наблюдается относительная нехватка исследований, соединяющих концептуальный анализ и обзор прикладных результатов применительно к финансовым рынкам, и в целом в развитие методологии прогнозирования доходности финансовых инструментов.

Теоретическая и практическая значимость исследования. Теоретическая значимость работы заключается в развитии методологии прогнозирования доходности финансовых инструментов, а именно в разработке новых типов предварительной обработки входных данных для моделей искусственных нейронных сетей как механизма принятия решений репрезентативным агентом на финансовых рынках. Сделаны существенные выводы о факторах, которые обуславливают качество прогнозирования доходности на финансовых рынках с помощью моделей искусственных нейронных сетей (по критерию роста виртуального инвестиционного портфеля): среди них наиболее важны «толстые хвосты» распределений, а также доля шумовой компоненты в ценовом процессе.

Практическая значимость работы заключается в том, что были построены работающие прогнозные модели искусственных нейронных сетей с предварительной обработкой входных данных для фондового и валютного рынков развитых стран. Количественно это выражалось в успехе виртуального инвестиционного портфеля, который значительно превосходил рыночную

10

динамику, модель авторегрессии, а также модель искусственной нейронной сети без предварительной обработки входных данных. Данный результат свидетельствует о том, что модели искусственных нейронных сетей с предварительной обработкой входных данных могут быть использованы для прогнозирования доходности на финансовых рынках. Кроме этого, роевая модель искусственных нейронных сетей оказалась способна предсказывать аномальные явления на американском фондовом рынке, что делает её полезным инструментом в арсенале риск-менеджмента.

Результаты, полученные в работе, могут быть востребованы академическими исследователями в области финансовой математики, рыночными аналитиками и трейдерами, портфельными инвесторами, а также корпоративными риск-менеджерами.

Апробация результатов исследования. Основные выводы и результаты диссертационного исследования нашли отражение в 5 научных публикациях в периодических изданиях, в том числе на английском языке, а также обсуждались на конференциях «Прогнозирование финансовых рынков» на факультете мировой экономики и мировой политики НИУ ВШЭ в 2010 году и 4th International Conference on Pattern Recognition and Machine Intelligence, проходившей в НИУ ВШЭ в 2011 году. Практические построения предлагаемых в работе моделей искусственных нейронных сетей неоднократно разбирались на открытом научно-исследовательском семинаре кафедры международных валютно-финансовых отношений факультета мировой экономики и мировой политики НИУ ВШЭ. По материалам диссертационного исследования подготовлен учебный курс «Нейронные сети и генетические алгоритмы в прогнозировании финансовых рынков», читаемый для студентов 3 и 4 курсов бакалавриата, а также 1 курса магистратуры в Национальном исследовательском университете «Высшая школа экономики» на факультете Мировой экономики и мировой политики.

Диссертация подготовлена по специальности 08.00.10 - Финансы, денежное обращение и кредит, п. 6.8. «Методология оценки доходности финансовых инструментов» Паспорта специальности ВАК.

Структура работы отражает решение ключевых задач, поставленных в научном исследовании. Диссертация состоит из введения, трёх глав, заключения, библиографического списка, содержащего 219 наименований, и приложение. Основная часть работы изложена на 165 страницах, включает 7 таблиц и 46 рисунков.

Основное содержание работы

Во введении обосновывается актуальность выбранной темы, определяются цель и задачи работы, объект и предмет диссертационного исследования, раскрывается научная новизна и практическая значимость результатов исследования. В данном разделе уделяется внимание информационной, теоретической и методологической базе, на которой строится исследование.

В первой главе прослеживается связь искусственных нейронных сетей с современными моделями многоагентных систем. Рассматривается возможность применения искусственных нейронных сетей для прогнозирования финансовых •рынков на основе поведенческих финансов (как механизма принятия решений репрезентативным агентом) и представления рынка как сложной, самоорганизующейся системы.

Были рассмотрена история исследований искусственных нейронных сетей, проанализированы их основные характеристики, принципы и необходимые условия построения, а также применяемые способы обучения. Кроме этого, на основе одного из главных свойств нейронных сетей - самоорганизации - была прослежена их взаимосвязь с многоагентными системами. При этом отмечалась возможность комбинирования двух этих типов моделей в рамках экспериментов по имитационному взаимодействию на финансовых рынках.

Что касается оценки эффективности построенной модели (качества прогноза), то обычно таким критерием для искусственных нейронных сетей выступает значение ошибки прогноза. Однако в данной работе эффективность измерялась через динамику виртуального портфеля, рассчитываемого по эмпирическим данным на основе прогнозов модели. Таким образом можно не только представить наглядную интерпретацию полученных прогнозных результатов, но и оценить инвестиционный потенциал разработанной модели. Это важно потому, что на финансовых рынках модели, демонстрирующие более низкую среднюю ошибку, могут менее точно предсказывать знак будущей доходности по сравнению с моделями с большей ошибкой.

Оценка надёжности прогнозов моделей искусственных нейронных сетей с предварительной обработкой данных проводилась с помощью расчета доверительных интервалов для математического ожидания доходности портфеля (в процентах годовых).

Для того чтобы оценить сравнительную эффективность прогнозирования финансовых рынков с помощью построенных в работе моделей искусственных нейронных сетей были сформированы ещё три виртуальных инвестиционных портфеля (бенчмарка). Первый портфель формировался по прогнозам искусственной нейронной сети прямого прохода без предварительной обработки входных данных, второй - по прогнозам авторегрессии, третий представлял собой рыночный портфель. Сеть прямого прохода без предварительной обработки входных данных была необходимым ориентиром для того, чтобы отслеживать приращение результативности прогноза от применения обработки, что являлось одной из главных модификаций построенных в работе моделей искусственных нейронных сетей. Авторегрессия помогала сопоставить сконструированную модель с линейным эконометрическим построением. Рыночный портфель, основанный на пассивной торговой стратегии «купи и держи», обеспечивал

сравнение результатов модели с реальной динамикой соответствующего финансового рынка.

В связи с тем, что информация на финансовых рынках быстро устаревает и становится нерелевантной, было необходимо обучать построенные модели искусственных нейронных сетей на постоянно обновляющемся массиве данных. По этой причине в работе использовались скользящие векторы (метод «скользящего окна»), и прогнозное значение всех моделей пересчитывалось для каждого торгового периода по новым данным. Все прогнозы делались для значения доходности финансового инструмента на один торговый период вперёд за границей выборки обучающего «окна», т.е. представленные результаты прогнозирования финансовых рынков носят вневыборочный характер (оиЫзГ-Башрк).

С целью соблюдения математической корректности прогнозирования финансовых рынков в ходе виртуальных торговых сессий использовались логарифмические приросты цен закрытия финансовых инструментов. Кредитное плечо не вводилось. Комиссия финансовых посредников не учитывалась. Начальные значения всех портфелей равнялись 1.

Чтобы продемонстрировать, что превышение доходности, полученной с помощью искусственных нейронных сетей с предварительной обработкой входных данных, неслучайно по отношению к рыночной динамике и другим моделям, в отношении результатов, вынесенных на иллюстрации, проводился выборочный дисперсионный 1-тест на равенство следующих средних значений: виртуального инвестиционного портфеля с предварительной обработкой входных данных и нейросетевого портфеля прямого прохода без обработки данных; виртуального инвестиционного портфеля с предварительной обработкой входных данных и авторегрессионного портфеля; виртуального инвестиционного портфеля

с предварительной обработкой входных данных и пассивного рыночного портфеля.

Во второй главе предложены способы прогнозирования финансовых рынков на основе упрощения картины мира репрезентативным агентом и использования контекстной памяти при принятии решений. Рассмотрено сравнительное применение метода главных и метода независимых компонент в качестве инструментов предварительной обработки входных данных в моделях искусственных нейронных сетей. С помощью двух этих методов проводилось два вида популярной обработки эмпирической информации - снижение размерности (упрощение картины мира) и формирование контекстной библиотеки данных в искусственной нейронной сети, обученной по методу Левенберга-Марквардта и сети Хакена.

Модель Хакена, которая традиционно используется для распознавания образов, была задействована в диссертации в новом для себя качестве - для прогнозирования динамики фондового и валютного рынков. Для того, чтобы задать библиотеку контекстной информации в модели Хакена использовался метод главных и метод независимых компонент.

В аналитическом виде модель Хакена выглядит как (1):

мм т

4, = + + яХ^о'К^-.К + с(дя_, О?-. (1)

т = 1 ет = 1

где q - эмпирический скользящий вектор доходности на финансовом рынке, V -симметричная матрица, представляющая собой библиотеку контекстной информации, ш - номер столбца в матрице V, М - длина вектора q и размерность матрицы V, X - коэффициент обучения сети, В и С - параметры, влияющие на скорость обучения и сходимость сети, п - номер итерации.

15

Библиотека контекстной информации V из (1) задавалась либо как набор реконструкций эмпирического вектора X с последовательным сдвигом в прошлое по одной или двум главным компонентам (в зависимости от волатильности на рынке) - в случае использования метода главных компонент, либо как набор реконструкций эмпирического вектора X по каждой из независимых компонент на основе демикширующей матрицы (матрица, обратная матрице, кодирующей вектор независимых компонент в наблюдаемый вектор сигналов) - в случае использования метода независимых компонент. Столбцы демикширующей матрицы рассчитывались в соответствии с (2):

где - столбец (вектор весов) демикширующей матрицы XV, начальные значения которого равны 1, х - эмпирический вектор, Е - математическое ожидание, g -нелинейная функция преобразования (в данном случае был использован гиперболический тангенс), п - номер итерации, на которой проводятся вычисления.

Результаты прогнозирования по реальным рыночным данным позволили сделать следующие выводы в отношении рассматриваемых в работе моделей:

- предварительная обработка входных данных повышает качество прогнозирования фондового и валютного рынка развитых стран по сравнению с искусственными нейронными сетями без обработки;

- предварительная обработка входных данных, нацеленная на формирование библиотеки контекстной информации, приводит к более высоким результатам при

IV

Е {*£ (ну,'*)}- Е ^'(иу/х)}^

-I

(2)

прогнозировании фондового и валютного рынков развитых стран, чем снижение размерности;

- на основании доли верно спрогнозированных знаков будущей доходности выдвинуто предположение о том, что построенные модели искусственных нейронных сетей с предварительной обработкой данных могут фиксировать наибольшие абсолютные доходности в финансовых временных рядах;

- при помощи построенных моделей искусственных нейронных сетей с предварительной обработкой входных данных валютный рынок поддаётся более результативному прогнозированию на коротких временных интервалах (15-минутные котировки), а фондовый рынок, напротив - на длинных (дневные котировки).

В целом, при прогнозировании доходности на финансовых рынках продемонстрирована недостаточная эффективность метода главных и метода независимых компонент как инструмента снижения размерности и задания библиотеки контекстной информации (виды предварительной обработки входных данных) в искусственных нейронных сетях. Это обуславливает необходимость искать более эффективные механизмы предварительной обработки данных, чему посвящена Глава 3.

В третьей главе продолжено исследование инструментов предварительной обработки входных данных, в основе которых лежат конкурентные механизмы. Научная гипотеза состояла в том, что использование моделей искусственных нейронных сетей, где предварительная обработка данных и обучение осуществляется на основе конкуренции и самоорганизации способно повысить качество прогнозирования финансовых рынков развитых стран по сравнению с другими методами. С точки зрения принятия инвестиционных решений репрезентативным агентом на рынке применение конкурентных механизмов

означает формирование субъективно полной картины будущего (self-attribution) на основе сценарной интерпретации прошлой информации.

Для проверки указанной научной гипотезы было построено две оригинальных моделей. Первая модель — самоорганизующаяся искусственная нейронная сеть Кохонена - Хакена с внедрением конкурентных механизмов обработки входных данных на основе методов главных и независимых компонент, а также применением относительной энтропии Кульбака - Ляйблера (Kullback -Leibler divergence).

Для построения данной модели мы внесли в базовый вариант сети Кохонена несколько существенных модификаций, включая исключение случайной компоненты при задании начальных отображений (важная проблема в нейросетёвом анализе); обучение на данных, фиксирующих максимумы и минимумы ценовой динамики; расчет отображения-«победителя» и формирование функции топологической окрестности на основе величины относительной энтропии Кульбака - Ляйблера и теории перспектив (3); соединение сети Кохонена - Хакена для отбора оптимизированных векторов-отображений по значимости их вклада в процесс ценообразования (логическая доработка модели Хакена из-€лавы 2).

Я =/>(*,/?,*)* \o%1{p{x'^Z))dx, (3)

где Н - величина относительной энтропии Кульбака - Ляйблера, р(х,р,%) и р(х,(3,%) - два случайных процесса, р,х - корректирующие множители, добавленные в модель, к - параметр, задающий пределы интегрирования.

Адаптивная подстройка весов в модели Кохонена - Хакена происходила в соответствии с (4):

) 3 т 1 /

и> = и» + т} * е * А п п-1 п

Х-ю1 , л-1

где X - исходный эмпирический вектор, - вектор-отображение, j - номер вектора-отображения, п - номер итерации, на которой производится обучение сети, Ь„ — функция топологической окрестности, которая формировалась на основе расстояния Кульбака - Ляйблера из (3), т) - параметр, влияющий на скорость обучения сети, - временная константа.

После этого набор векторов весов использовался в качестве библиотеки контекстной информации в сети Хакена из (1).

Вторая предложенная в главе модель - система из нескольких независимых искусственных нейронных сетей (роевая модель), построенная автором, соединила в себе сеть прямого прохода (5) с вмонтированным стохастическим блоком «имитации отжига» (6), а также дополнительное обучение с помощью самоорганизующихся карт - так в рамках одной модели были соединены два типа нейросетевого обучения — «с учителем» и самоорганизация.

2-5 2

/"",г>= У^[/3Н*Л[№'*Г'.г + н'2*г2,г)+и,б*-/"2(и'3*ги+и'4*г2,г)1~>,7-11 - Шп (5) /=2—1

где Г|_, г2, - входные данные, предъявляемые сети, \у(\у1,\у2,шЗ,'№4,'Л'5,ш6)- вектор весов сети, у — бинарный обучающий скользящий вектор (1 — положительная доходность финансового инструмента, 0 — отрицательная), П,£2,П - нелинейные логистические функции с областью значений [0;1], ъ - номер торгового периода.

если Error (w ) < Error (w ,)

\ (6) w. если runif [a... 1] < e "

w , иначе

где w — вектор весов, с которым работает стохастическая нейронная сеть (его начальное значение задаётся как оптимизированный вектор весов w из (5)), Error -суммарная квадратичная ошибка сети, п - номер итерации, N - общее число итераций, runif [а...1] - случайное число из равномерного распределения в диапазоне от а до 1, а,к - константы.

Предварительно в исходных эмпирических данных по критерию энтропии Дженсона-Шеннона были выделены кластеры, которые были соотнесены с повторяющимися режимами функционирования финансовых рынков. В аналитическом виде расстояние Йенсона-Шеннона (JS) задавалось как (7):

JS (р ,Pl) : ^ (р'(х)' р*{х)) + ^ (7)

где р|, р2 - нормальные распределения, КЬ - расстояние Кульбака - Ляйблера между этими двумя распределениями.

Обучение в модели происходило в соответствии с роевым механизмом, заимствованным из сети Кохонена (4) - так происходил определённый естественный отбор наиболее эффективной сети.

Результаты прогнозирования фондового и валютного рынков развитых стран с помощью двух построенных моделей обобщены в табл. 1.

Табл. 1. Результаты прогнозирования валютного и фондового рынков с помощью искусственной нейронной сети Кохонена — Хакена и роевой модели.

Модель РСА-портфель 1СА-портфель Портфель сети прямого прохода Портфель авторегрессии- Рыночный портфель

Кохонен - Хакен (среднее 1,11 (55%) 1,11 (55%) 0,99 (53%) 0,97 (56%) 1,00

по 6-ти валютным парам)

Кохонен - Хакен (среднее 6,58 (48%) 7,84 (47%) 1,17 (49%) 0,89 (50%) 1,29

по 6-ти фондовым

индексам)

Роевая модель (среднее по 1,09 (59%) 0,99 (53%) 0,86 (54%) 1,01

6-ти валютным парам)

Роевая модель (среднее по 6,05 (58%) 1,26(49%) 0,63 (47%) 1,56

7-ми фондовым индексам)

Примечания В таблице указаны значения виртуальных инвестиционных портфелей на конец торговой сессии. РСА-портфель — портфель искусственной нейронной сети с использованием метода главных компонент, 1СА-портфель - с использованием Метода независимых компонент. Начальные значения портфелей равнялись 1. В скобках указан процент правильного прогноза знака доходности в следующем торговом периоде.

Для валютного рынка использовались 15-минутые логарифмические доходности за январь-февраль 2012 г., для фондового - дневные логарифмические доходности за 2000-2013 гг.

В ходе анализа полученных результатов на разных финансовых рынках была выстроена иерархия результатов прогнозирования доходности на фондовом и валютном рынках развитых стран с помощью предложенных в работе искусственных нейронных сетей в зависимости от применяемых инструментов обработки входных данных. Было показано, что применение самоорганизующихся нейронных сетей с конкурентной предварительной обработкой входных данных обеспечивает лучшие результаты по сравнению с предварительной обработкой в виде снижения размерности и формирования статичной библиотеки контекстной информации, по сравнению с искусственными нейронными сетями без

предварительной обработки входных данных, а также простыми авторегрессионными моделями.

Были сделаны следующие важные выводы, касающиеся прогнозирования финансовых рынков:

- использование свойств самоорганизации в модели Кохонена - Хакена и роевой модели позволяет увеличить результативность прогноза фондового рынка по сравнению с моделями искусственных нейронных сетей, построенных в Главе 2; это говорит о том, что конкурентные и эволюционные алгоритмы, в т.ч. доказавшие свою эффективность в природных системах, могут быть успешно заимствованы для решения задач финансовой математики, поскольку эти характеристики отражают важные механизмы принятия решений агентами на финансовых рынках!

- модель Кохонена - Хакена более результативно предсказывает фондовый рынок во время и после мирового финансового кризиса, что может объясняться сменой режима функционирования рынка после 2008 года и/или изменением механизма принятия решений агентами на рынке - их способности эффективно обрабатывать поступающую информацию и повышать навыки этой обработки (т.е. обучатьбя);

- роевая модель искусственных нейронных сетей более эффективно прогнозирует фондовый рынок, когда его распределение содержит «толстые хвосты» (доля больших амплитуд приростов высока) и отклоняется от нормального закона, причём выдаёт прогнозы с определённым временным лагом по отношению к возникновению подобной «аномалии» на рынке; в свою очередь, это свойство модели может быть задействовано в системах финансового риск-менеджмента для получения ранних предупреждений о возможных аномальных событиях на рынке (в т.ч., кризисах); кроме этого, это свидетельствует о том, что финансовые рынки поддаются более результативному прогнозированию именно в

те временные периоды, когда происходит их отклонение от состояния информационной эффективности;

- разные результаты прогнозирования фондового и валютного рынков с помощью построенных искусственных нейронных сетей с предварительной обработкой входных данных, представленные в табл.1, могут быть объяснены различной структурой этих временных рядов; доля шумовой, несущественной составляющей на фондовом рынке значительно выше, и построенные модели, оказываются способны её эффективно отфильтровать и вычленить наиболее важные факторы ценообразования; данный вывод, в целом, согласуется с другим важным выводом работы, который заключается в том, модели искусственных нейронных сетей способны фиксировать и предсказывать наиболее сильные движения на рынке (тренды).

В заключении приводятся основные выводы, полученные в диссертации. Ключевым для работы стало выявление важных особенностей ценообразования и сложности прогнозирования финансовых рынков с помощью построенных моделей искусственных нейронных сетей; был проведён подробный сравнительный анализ результатов прогнозирования на эмпирических данных фондовых индексов развитых стран и ключевых мировых валютных пар.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Работы, опубликованные автором в перечне ведущих рецензируемых научных журналов и изданий, рекомендованных ВАК:

1. Головачев, С.С. Кластеризация данных и роевые методы обучения искусственных нейронных сетей в прогнозировании рынка ценных бумаг [Текст] / С.С. Головачев// Финансовый журнал - 2013. - №2 (16). -С. 85-96. (0,82 п.л.)

2. Головачев, С.С. Использование искусственных нейронных сетей для прогнозирования американского фондового рынка в период кризиса [Электронный ресурс] / С.С. Головачев // Управление экономическими системами. - 2012. - №11(47). Режим доступа: http://www.uecs.rU/instrumentalnii-metody-ekonomiki/item/l 644-2012-1109-08-08-12 (1,44 п.л.).

3. Головачев, С.С. Прогнозирование динамики притока ПИИ в Россию с помощью моделей искусственных нейронных сетей [Текст] / С.С. Головачев// Вестник федерального бюджетного учреждения «Государственная регистрационная палата при Министерстве юстиции Российской Федерации». - 2013 - №6. - С.58-68. (0,52 п.л.)

В других изданиях:

1. Golovachev, S. Forecasting the U.S. Stock Market via Levenberg-Marquardt and Haken Artificial Neural Networks Using ICA and PCA Pre-processing Techniques [Text] / S. Golovachev // Proceedings of PreMI 2011: Pattern Recognition and Machine Intelligence - 4th International Conference (Springer). - 2011. - P. 351-358. (объём 0,38 п.л.).

2. Головачев, С.С. Прогнозирование американского фондового рынка с помощью нейронных сетей [Текст] / С.С. Головачев // Вестник НАУФОР - 2010. -№7-8. - С. 93-103. (объём 0,82 пл.).

Лицензия ЛР№ 020832 от «15» октября 1993 г. Подписано в печать «»£?» /./х^У/г/ ЛС'/Уу г. Формат 60x84/16 Бумага офсетная. Печать офсетная. Усл. печ. л. 1.

Тираж 100 экз. Заказ № ¿^Типография издательства НИУ-ВШЭ, 125319, г. Москва, Кочновский пр-д., д. 3.

""725/

Диссертация: текстпо экономике, кандидата экономических наук, Головачев, Сергей Сергеевич, Москва

Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет

Высшая школа экономики»

На правах рукописи

04201460927

Головачев Сергей Сергеевич

Прогнозирование доходности на фондовом и валютном рынках на основе моделей искусственных нейронных сетей

Специальность 08.00.10 - Финансы, денежное обращение и кредит

Диссертация на соискание ученой степени кандидата экономических наук

Научный руководитель: д.э.н. Евстигнеев В.Р.

Москва - 2014

Оглавление

Введение.................................................................................................................................................3

Глава 1. Роль искусственных нейронных сетей в прогнозировании финансовых рынков.13

1.1.Самоорганизация в искусственных нейронных сетях и на финансовых рынках..........13

1.2.Принятие решений репрезентативным агентом на основе ограниченной рациональности и самоорганизации: имитация с помощью искусственных нейронных сетей..................................................................................................................19

1.3. Основные характеристики, типология и принципы построения искусственных нейронных сетей при прогнозировании финансовых рынков.................................................24

Глава 2. Инвестиционные решения на фондовом и валютном рынках на основе упрошенной картины мира и контекстной памяти - представление в форме искусственных нейронных сетей с предварительной обработкой входных данных............34

2.1.Предварительная обработка входных данных искусственными нейронными сетями при прогнозировании финансовых рынков с помощью метода главных компонент и метода независимых компонент......................................................................................................34

2.2.Прогнозирование финансовых рынков с помощью искусственной нейронной сети, обученной по методу Левенберга-Марквардта и использующей снижение размерности входных данных (упрощение картины мира)..............................................................................43

2.3. Прогнозирование фондового и валютного рынков с помощью искусственной нейронной сети Хакена, использующей предварительную обработку входных данных в виде формирования контекстной памяти.....................................................................................68

Глава 3. Иллюзия субъективной полноты картины мира, свойственная репрезентативному инвестору, и ее воспроизведение посредством искусственных нейронных сетей, использующих конкурентные механизмы предварительной обработки входных данных................................................................................................................................100

3.1.Прогнозирование финансовых рынков с помощью искусственной нейронной сети Кохонена-Хакена, использующей конкурентную обработку входных данных...................101

3.2.Прогнозирование фондового и валютного рынков с помощью роевой архитектуры искусственных нейронных сетей, использующей кластеризацию данных в качестве инструмента предварительной обработки..................................................................................128

Заключение........................................................................................................................................160

Библиография...................................................................................................................................166

Приложение.......................................................................................................................................186

Введение

Актуальность диссертационного исследования имеет как теоретические, так и практические основания. В условиях глобализации зависимость реального сектора экономики и благосостояния физических лиц от процессов, происходящего на финансовых рынках, очень велика. Особенно сильно это можно было ощутить в ходе мирового финансового кризиса 2008 года, когда обвал финансового сектора повлек за собой рецессию во многих мировых экономиках. Теоретическое описание массовых ожиданий участников финансового рынка и прогнозирование на этой основе котировок требуют применения всё более продвинутых формальных методов.

В финансовом анализе искусственные нейронные сети рассматриваются как механизм реконструкции репрезентативного агента, принимающего решения, и благодаря своим отличительным характеристикам могут быть использованы для прогнозирования доходности на фондовом, валютном и других рынках.

В диссертации рассматриваются фондовый и валютный рынки развитых стран, поскольку именно эти рынки бывают наиболее близки к состоянию информационной эффективности. Это состояние заявлено в качестве цели для суверенных регуляторов финансовых рынков и отражено, в частности, в документах Международной организации комиссий по ценным бумагам (IOSCO), что делает именно развитые рынки наиболее интересным, «чистым» объектом исследования.

Отдельная важная проблема в рамках исследований искусственных нейронных сетей и повышения эффективности их прогнозных способностей - это различные способы обработки входных данных. Это объясняется тем, что в последние годы массивы данных, доступные финансовым аналитикам, существенно возросли, а взаимосвязи между ними, в том числе причинно-следственные, усложнились. Поэтому в рамках данной работы основное внимание будет уделено исследованию и применению различных инструментов обработки

и сравнительному анализу их возможностей для прогнозирования доходности на фондовом и валютном рынках развитых стран. В частности, будут подробно рассмотрены метод главных и метод независимых компонент, которые используются во многих научно-исследовательских работах по финансовой математике.

Следует добавить, что полезность исследований с помощью искусственных нейронных сетей нельзя связывать только с финансово-экономической сферой. Полученные исследовательские результаты могут дать важный синергетический эффект для других отраслей науки. В числе наиболее перспективных можно выделить когнитивную психологию, теории принятия решений индивидуумами и группами лиц, а также поведения больших социальных систем.

Степень разработанности темы в научной литературе. На протяжении последних лет можно выделить большое количество исследований по теоретическим и по практическим аспектам применения искусственных нейронных сетей, на изучении которых сделан акцент в данной работе. Разброс публикаций по данной тематике достаточно широк. Первыми стали труды У. Мак-Каллокка и В. Питтса, Д.Хебба и Ф.Розенблатта. К попыткам систематизировать информацию (прежде всего, типологию) в данной области можно отнести работы С.Хайкина, К.Бишопа, К.Файфа, П. Макнелиса, В.Круглова. Используемые в работе методы предварительной обработки данных перед предъявлением искусственным нейронным сетям широко рассматриваются в работах Й. Джолиффа, А. Хюваринена, А. Бека и А. Вайгенда, Й. Горрица и др., Л. Делатавера и др., П. Комона.

Существует обширная литература, где описывается построение полноценных моделей искусственного интеллекта с помощью искусственных нейронных сетей и экспериментального взаимодействия агентов в больших имитационных системах. Отметим публикации Б. Лебейрона, М.Митчелл, Б. Макмуллина, Р. Да Силва и др., С.Альфарано и др., А. Баравиера и др., Р. Конта и

Ж -Ф Кптттр

Кроме этого можно выделить широкий спектр публикаций, связанных именно финансовыми рынками, а именно с прогнозированием доходности на фондовом и валютном рынках с помощью искусственных нейронных сетей (вплоть до сегментации по географической принадлежности). В числе интересных работ можно отметить исследования П. Тенти, М. Амин и др., Й. Боллен и др., Й,-К. Квон и др., Х.-Г. Циммерманна и др.

Однако во многих опубликованных работах наблюдается следующая дихотомия: с одной стороны, в крупных фундаментальных трудах проводится детальный разбор типов искусственных нейронных сетей, принципов их построения и особенностей обучения, зачастую без практического применения предлагаемых моделей (особенно на финансовых рынках); с другой стороны, в практических статьях в большинстве случаев главной целью ставится финансовая результативность исследуемой модели (доходность виртуального инвестиционного портфеля), но при этом не проводится достаточно глубокий разбор теоретических выводов. Важной особенностью данной работы является синтез практического применения построенных моделей и теоретического анализа полученных результатов.

Основная научная гипотеза. Основными характеристиками способа формирования ожиданий репрезентативным агентом считаются ограниченная рациональность, самообучение, а также формирование субъективно полных картин будущего (self-attribution) на основе сценарной интерпретации прошлой информации. Эти особенности способа принятия инвестиционных решений эффективно имитируются с помощью конкурентных механизмов предварительной обработки входных данных (по сравнению с другими методами обработки, а также методами, не использующими предварительную обработку входных данных) в самоорганизующихся искусственных нейронных сетях Кохонена - Хакена и роевой архитектуры. В результате может быть существенно повышено качество прогнозирования доходности на финансовых рынках

ПЯЧИИТМУ РТПЯК ПО КТШТРПИЮ ПОРТЯ ДИПТУЯ ИЬНПГП ИШЧРРТИТШОНКОГО ПОПТГЬРТТЯ

В рамках исследования предполагается, что распределения логарифмических доходностей на финансовых рынках порождаются механизмом, систематически отклоняющимся от центральной предельной теоремы, что соответствует состоянию неполной информационной эффективности. Под состоянием неполной информационной эффективности подразумевается определённая временная задержка в обработке данных агентами на финансовых рынках и соответствующая отложенная реакция цен на поступающую информацию. В свою очередь, это служит естественной предпосылкой для прогнозирования динамики финансовых рынков с помощью аналитических моделей, обращающихся к прошлым значениям временных рядов (в том числе моделей искусственных нейронных сетей). Это также позволяет подходить к прогнозированию финансовых рынков с позиции поведенческих финансов, для которых критически важен механизм принятия решений репрезентативным агентом.

Объект исследования - фондовые рынки развитых стран и валютный рынок. Предмет исследования - прогнозирование доходности на фондовых рынках развитых стран и валютном рынке с помощью моделей искусственных нейронных сетей с предварительной обработкой входных данных.

Цель диссертационного исследования - предложить способы прогнозирования доходности на фондовом и валютном рынках развитых стран с помощью моделей искусственных нейронных сетей с предварительной обработкой входных данных, которые соответствуют типичным реакциям лиц, принимающих решения, по критерию роста виртуального инвестиционного портфеля, построенного на основе прогнозов сети.

В соответствии с этой целью в работе ставятся и решаются следующие задачи:

• показать возможность прогнозирования доходности на финансовых

рынках с помощью моделей искусственных нейронных сетей как

Ал^уяимчдла ТЛ Л/ТЫТЫГЛЛ/и~\Т1Т£»Г"Г* ппниатнр ГЛ£»ТТТ<=>1ЛЛТЛ гл^ттгл^к^итяттлоит-тлл ^ г^итгллл'

• сравнить использование метода главных компонент (principal component analysis) и метода независимых компонент (independent component analysis) в качестве различных форм предварительной обработки входных данных для искусственных нейронных сетей при прогнозировании доходности на финансовых рынках;

• показать, что предварительная обработка входных данных с помощью методов главных и независимых компонент, которая сводится только к сокращению размерности входного пространства или заданию контекстной памяти, недостаточна для получения эффективного результата при прогнозировании доходности на финансовых рынках;

• предложить новую спецификацию искусственной нейронной сети для прогнозирования доходности на финансовых рынках, в которой предварительная обработка входных данных осуществляется на основе конкурентных механизмов взаимодействия - как внутри одной сети, так и между несколькими независимыми сетями;

• решить типичные технические проблемы в построении искусственных нейронных сетей, такие как интерпретация результатов обработки входных данных с помощью метода независимых компонент и подбор начальных значений сети при прогнозировании доходности на финансовых рынках;

• на основе полученных результатов сделать выводы о сравнительной сложности прогнозирования доходности на фондовом и валютном рынках развитых стран, определить применимость определенных видов искусственных нейронных сетей на финансовых рынках различного типа.

Теоретической и методологической основой исследования служат труды известных учёных в области экономики и финансовой математики, среди которых С.Хайкин, К.Бишоп, К.Файф, Г.Хакен, Т. Кохонен, Б. Крозе и П. Смагт, а также

Большое значение для выбора автором методов исследования и формирования подходов к анализу искусственных нейронных сетей имели работы Г.Г. Малинецкого, А.Б. Потапова, И.Р. Пригожина, В.Р. Евстигнеева, Я. Хейгемана, А. Хюваринена, И.Фойта, А.А. Ежова и С.А.Шумского, а также многие работы в области поведенческих финансов.

Информационная база. Для практического тестирования построенных в работе моделей искусственных нейронных сетей были использованы реальные котировки фондового и валютного рынков. Источником статистических данных послужили официальные данные американских и европейских фондовых бирж, Федеральной резервной системы США, а также информационно-аналитического агентства Bloomberg.

Научная новизна диссертации заключается в разработке новых или совершенствовании уже существующих методов прогнозирования доходности финансовых инструментов на фондовом и валютном рынке развитых стран на основе моделей искусственных нейронных сетей, а именно:

• была установлена связь между качеством прогнозирования фондового рынка с помощью предложенных в работе искусственных нейронных сетей по критерию роста виртуального инвестиционного портфеля и наличием «выбросов» в распределении доходностей; была доказана способность таких моделей фиксировать наиболее существенные движения цен на финансовом рынке;

• были выявлены особенности ценообразования на фондовом и валютном рынке (доля «шумовой» компоненты), которые обуславливают качество их прогнозирования с помощью искусственных нейронных сетей по критерию роста виртуального инвестиционного портфеля;

• была адаптирована модель распознавания образов Хакена на основе метода главных и метода независимых компонент и использована в качестве искусственной нейронной сети с контекстной памятью для прогнозирования

• была разработана модель искусственной нейронной сети на основе адаптированной для финансовых рынков модели Хакена и самоорганизующихся карт (сети Кохонена) для прогнозирования доходности на фондовом и валютном рынках;

• была построена модель из комитета искусственных нейронных сетей, соединяющая кластеризацию входных данных и обучение нескольких независимых, конкурирующих, искусственных нейронных сетей для прогнозирования доходности на фондовом и валютном рынках.

Следует отметить, что в диссертационном исследовании равное внимание было уделено как методическим особенностям построения, так и практическому тестированию моделей искусственных нейронных сетей. Полученные результаты могут стать важным вкладом в российскую научную литературу по тематике искусственных нейронных сетей, где наблюдается относительная нехватка исследований, соединяющих концептуальный анализ и обзор прикладных результатов применительно к финансовым рынкам, и в целом в развитие методологии прогнозирования доходности финансовых инструментов.

В ходе работы над диссертацией были получены следующие научные результаты:

• при прогнозировании доходности на финансовых рынках продемонстрирована недостаточная эффективность метода главных и метода независимых компонент как инструмента снижения размерности и задания библиотеки контекстной информации (виды предварительной обработки входных данных) в искусственных нейронных сетях;

• выстроена иерархия результатов прогнозирования доходности на фондовом и валютном рынках развитых стран с помощью предложенных в работе искусственных нейронных сетей в зависимости от применяемых инструментов обработки входных данных: показано, что применение самоорганизующихся нейронных сетей с конкурентной предварительной обработкой входных данных

виде снижения размерности и формирования статичной библиотеки контекстной информации, по сравнению с искусственными нейронными сетями без предварительной обработки входных данных, а также простыми авторегрессионными моделями;

• сделаны выводы о степени сложности прогнозирования доходности на финансовых рынках с помощью предложенных в работе искусственных нейронных сетей с предварительной обработкой входн�