Асимптотические свойства повторяющихся игр с неполной информацией и моделирование динамики финансовых рынков тема диссертации по экономике, полный текст автореферата

Ученая степень
кандидата физико-математических наук
Автор
Сандомирский, Федор Алексеевич
Место защиты
Москва
Год
2013
Шифр ВАК РФ
08.00.13

Автореферат диссертации по теме "Асимптотические свойства повторяющихся игр с неполной информацией и моделирование динамики финансовых рынков"

На правах рукописи

Сандомирский Федор Алексеевич

АСИМПТОТИЧЕСКИЕ СВОЙСТВА ПОВТОРЯЮЩИХСЯ ИГР С НЕПОЛНОЙ ИНФОРМАЦИЕЙ И МОДЕЛИРОВАНИЕ ДИНАМИКИ ФИНАНСОВЫХ РЫНКОВ

Специальность: 08.00.13 — "Математические и инструментальные методы экономики"

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

2 8 НОЯ 2013

Москва 2013

005540510

Работа выполнена в Федеральном государственном бюджетном учреждении науки Центральном экономико-математическом институте РАН (ЦЭМИ РАН)

Научный руководитель: доктор физико-математических наук,

Пресман Эрнст Львович

Официальные оппоненты: Кошевой Глеб Алексеевич,

Защита состоится «16» декабря 2013 г. в 13 час. на заседании диссертационного соиета Д 002.013.02 при Федеральном государственном бюджетном учреждении науки Центральном экономико-матсматичсском институте РАН по адресу: 117418, Москва, Нахимовский пр., д. 47, ауд. 520.

С диссертацией можно ознакомиться в библиотеке ЦЭМИ РАН Автореферат разослан Ау » ноября 2013 г.

Ученый секретарь диссертационного совета Д 002.013.02,

доктор физико-математических наук, Федеральное государственное бюджетное учреждение науки Центральный экономико-математический институт РАН, главный научный сотрудник

Хаметов Владимир Минирович, доктор физико-математических наук, Национальный исследовательский университет Высшая школа экономики, профессор

Ведущая организация: Федеральное государственное бюджетное

учреждение науки Санкт-Петербургский экономико-математический институт РАН

к.ф.-м.н.

Общая характеристика работы

Актуальность темы исследования. Социально-экономические взаимодействия людей или групп людей связаны с неопределенностью, а значит, с неполнотой информации у участников. Причем неполнота информации может меняться от участника к участнику. Ее источником может являться как различная информированность о свойствах самого взаимодействия и различные способности предвидеть будущее, так и невозможность знать достоверно все свойства оппонентов: цели, к которым они стремятся, и имеющуюся у них приватную информацию — их собственные представления о свойствах взаимодействия, о будущем и о других агентах.

Социально-экономические взаимодействия происходят во временной перспективе, и, соответственно, анализ поведения оппонентов в прошлом позволяет уточнять представления об их целях и имеющейся у них информации, а уточненные представления могут быть использованы, чтобы скорректировать поведение в будущем. Это обуславливает сложную информационную, а следовательно, и стратегическую природу продолжительных взаимодействий: выбирая план действий, необходимо учитывать не только сиюминутную выгоду, которую принесет то или иное действие, но и информацию, которую оно сообщит другим участникам.

Математическим моделированием информационных аспектов многошаговых социально-экономических взаимодействий занимается теория повторяющихся игр с неполной информацией — раздел теории игр, возникший в работах Нобелевского лауреата по экономике Р. Ауманна и М. Машлера. Центральную роль в теории играют асимптотические постановки при большой продолжительности взаимодействия, так как в силу сложной стратегической природы явные решения удается найти лишь в очень редких случаях. Основная часть известных результатов относится к ситуации, когда взаимодействуют лишь два игрока с полностью противоположными интересами, и неполная информация имеется лишь у одного из них (Р. Ауманн, М. Машлер, Ш. Замир, Ж.-Ф. Мертенс, А. Нейман, Б. Де Мейер, Ф. Генсбиттель). Однако, даже несмотря на полувековую историю дисциплины, для антагонистических игр с

неполной информацией у одного из игроков остается масса открытых вопросов, на ряд из которых нам удается ответить. В частности, в диссертации даются ответы на вопросы, поставленные в недавней статье А. Неймана1.

В последние годы источником новых задач и методов анализа повторяющихся игр с неполной информацией стали игры, описывающие влияние асимметричности информации на динамику финансового рынка (Б. Де Мейер, X. М. Салей, А. Марино, В. Доманский, В. Крепе). Из этого круга задач возникли вопросы, на которые отвечает диссертационное исследование, а также используемый в диссертации новейший метод анализа повторяющихся игр — метод редукции игры к мартингальной оптимизационной задаче (Б. Де Мейер, Ф. Генсбиттель).

Объектом исследования являются повторяющиеся антагонистические игры с неполной информацией у Игрока 2. В них два игрока N раз участвуют в антагонистической игре, заданной одношаговой функцией выигрыша Ак. Функция Ак зависит от состояния к, которое выбирается случаем из множества состояний К в соответствии с распределением р 6 Д(К) перед началом игры. При этом оба игрока знают р, но лишь Игрок 1 информирован о к. На шаге п = О,1...N— 1 обоим игрокам известна история действий на предыдущих шагах, что позволяет Игроку 2 уточнять свои представления о к, анализируя действия информированного Игрока 1. Пошаговые выигрыши не наблюдаются до шага N — 1, после которого Игрок 1 получает от оппонента их сумму. Оба игрока рациональны и знают это описание.

Предмет исследования составляют асимптотические свойства повторяющихся игр с неполной информацией при продолжительности игры N, стремящейся к бесконечности.

Назовем ценой информации в повторяющейся игре с неполной информацией разницу между выигрышем информированного игрока (Игрока 1) в ней и выигрышем, который бы он получил, забыв всю имеющуюся у него информацию. В случае конечного К из классических результатов следует, что цена информации не может по порядку превосходить s/N при

'Neyman A. The maximal variation of martingales of probabilities and repeated gamee with incomplète information // J. Theor. Prob. 2013. W26(2) C.557-567.

продолжительности Ы, стремящейся к бесконечности. Этот результат тесно связан с оценками максимальной вариации — величины, характеризующей максимальную изменчивость представлений в процессе байесовского обучения продолжительности N с заданным априорным распределением р £ Д(К). В случае бесконечного К и р с тяжелыми хвостами классические оценки теряют смысл, и встает вопрос о возможности "аномального роста" и максимальной вариации, и цены информации — быстрее -//V при N —► оо. Другой вопрос связан с противоположной ситуацией. Для дискретных моделей финансового рынка с асимметричной информацией было установлено, что цена информации остается ограниченной при N -> со (Б. Де Мейер и А. Марино, В. Доманский). Однако вопрос о природе этого эффекта остался без ответа. Диссертационное исследование было вдохновлено этими вопросами и дает на них исчерпывающие ответы.

Цель исследования состоит в описании экстремальных асимптотических режимов для цены информации при большом числе повторений N — наименьшей и наибольшей возможных скоростей ее роста при N —> оо, а также в анализе свойств игры, ответственных за появление этих режимов.

Для этой цели в диссертации решаются следующие задачи:

• Объяснение феномена ограниченности цены информации для дискретных моделей динамики финансового рынка с асимметричной информацией. Нахождение условий, обеспечивающих ограниченность цены информации в классе "почти-честных" игр — игр, для которых единственным преимуществом Игрока 1 является его информация (этот класс содержит модели финансового рынка). Разработка подхода, позволяющего свести вопрос о поведении цены информации в общей почти-честной игре к анализу модельной задачи;

• Получение оценок для максимальной вариации, сохраняющих смысл для дискретного априорного распределения р с тяжелыми хвостами. Анализ эффекта аномального роста максимальной вариации. Исследование максимальной вариации для континуального множества состояний К;

• Анализ максимальной скорости роста цены информации при N —* оо в случае счетного К и распределения р с тяжелыми хвостами. Разработка подхода, позволяющего учитывать условия регулярности одношаговой функции выигрыша в случае континуального К при исследовании асимптотического поведения цены информации.

Методы исследования. В работе использована комбинация методов теории игр, теории вероятностей и, в частности, теории стохастического оптимального управления. Для анализа асимптотического поведения цены информации применяется подход, основанный на связи игровых постановок с задачами о максимальной вариации и их обобщениями, в том числе метод редукции игры к мартингальной оптимизационной задаче (Б. Де Мейер, Ф. Генсбиттель). Также используются стратегический анализ, теория возмущений для матричных антагонистических игр, методы выпуклой геометрии и методы теории аппроксимации в метрических пространствах. Оценки максимальной вариации основаны на двойственном представлении для вариации скалярных мартингалов, введенном Б. Де Мейером, и оценках больших уклонений.

Теоретическая и практическая значимость. Работа носит теоретический характер и ставит своей целью развитие теоретико-игровых методов. Полученные результаты являются существенным продвижением в понимании эффектов, возникающих в теоретико-игровых моделях финансового рынка с асимметричной информацией. Материалы диссертации могут быть использованы при разработке курсов лекций по теории динамических игр и теории игр с неполной информацией с целью демонстрации мартингальных методов в многошаговых задачах с неполной информацией и, в частности, эффективности редукции игровых постановок к задачам мартингальной оптимизации — новейшего метода, возникшего при анализе моделей финансового рынка, который, несмотря на свою универсальность, был применен пока лишь к весьма ограниченному кругу задач.

Научная новизна. Игры с ограниченной ценой информации, как класс игр, ранее не рассматривались (изучались лишь конкретные модели финансового рынка, обладающие этим свойством), а общие свойства игр этого класса не анализировались. Не объяснялась и природа эффекта

6

ограниченности цены информации в дискретных моделях финансового рынка. Общие результаты, относящиеся к играм с неполной информацией и счетным множеством состояний, ранее отсутствовали, а эффект аномального роста цены информации не отмечался и не изучался. Все результаты диссертации получены автором лично и обоснованы строгими математическими доказательствами. Основные результаты исследования:

• Для дискретных моделей финансового рынка с асимметричной информацией получено исчерпывающее объяснение эффекта ограниченности цены информации. Установлен критерий ограниченности цены информации в классе почти-честных игр и описаны возможные асимптотические поведения цены информации в этом классе.

• Для дискретного априорного распределения р охарактеризована скорость роста максимальной вариации в степенной шкале в терминах семейства величин, измеряющих неопределенность р, включающего энтропию Шеннона. Продемонстрирована возможность аномального роста максимальной вариации для р с тяжелыми хвостами, и построен соответствующий пример. В случае непрерывного р установлен линейный рост максимальной вариации.

• Показано, что максимальная скорость роста цены информации совпадает со скоростью роста максимальной вариации, а значит, эффект аномального роста имеется и для цены информации. Построен соответствующий пример. Для игр с регулярными одношаговыми функциями выигрыша получены оценки на скорость роста цены информации в терминах асимптотики колмогоровской е-энтропии. Показано, что для игр с условиями регулярности эффект аномального роста может отсутствовать.

Апробация результатов исследования. Результаты диссертационного исследования были представлены на следующих конференциях и семинарах:

• Семинар лаборатории Теории игр и принятия решений СПб ЭМИ РАН (Санкт-Петербург, 20 января 2012);

• Семинар лаборатории Чебышева 'Теория вероятностей" (Санкт-Петербург, 15 мая 2012);

• 8-ая Международная петрозаводская конференция "Вероятностные методы в дискретной математике" и 13-ый Всероссийский симпозиум по прикладной и промышленной математике (Петрозаводск, 2-9 июня 2012);

• Международная конференция "Games and Strategy in Paris" в честь шестидесятилетия С. Сорена (Париж, 11-13 июня 2012);

• 6-ая Международная конференция "Теория Игр и Менеджмент" GTM2012 (Санкт-Петербург, 27-29 июня 2012);

• Семинар "Вероятностные проблемы управления и стохастические модели в экономике, финансах и страховании" (ЦЭМИ РАН) (Москва, 20 ноября 2012);

• "Городской семинар по теории вероятностей и математической статистике" (ПОМИ РАН) (Санкт-Петербург, 14 декабря 2012);

• Международная конференция "4th Nordic Triangular Seminar in Applied Stochastics" (Хельсинки, 6-8 марта 2013);

• Международная конференция 'The 5th Israeli Game Theory conference" (Тель-Авив, 3 июня 2013);

• Семинар Центра изучения рациональности Еврейского университета (Center for the Study of Rationality) (Иерусалим, 4 июня 2013);

• Международная конференция "Сетевые игры и менеджмент" NGM2013 (Петрозаводск, 23-25 июня 2013);

• 7-ая Международная конференция 'Теория Игр и Менеджмент" GTM2013 (Санкт-Петербург, 26-28 июня 2013).

Публикации по теме диссертации. Основные результаты диссертации отражены в шести публикациях общим объемом 2,5 печатных листа. Из них 1 публикация объемом 0,4 печатных листа в журнале, входящем в список журналов, рекомендованных ВАК Министерства образования и науки Российской Федерации для публикации основных результатов диссертационных исследований; 1 препринт объемом 1,5 печатных листа; остальные публикации являются расширенными тезисами международных конференций.

Структура работы. Диссертация содержит 93 страницы и состоит из введения, четырех глав, заключения и списка литературы из 34 наименований.

8

Содержание работы

Введение включает обоснование актуальности выбранной темы диссертации, формулировку целей исследования, описание используемых методов и перечисление основных положений.

Первая глава является кратким введением в теорию повторяющихся игр с неполной информацией. В этой главе:

► Даются основные определения:

1) Повторяющаяся антагонистическая игра rV(p) с неполной информацией у Игрока 2 задается: набором Г = (K,I, J, А), где /^-множество состояний, I и J — множества действий игроков, А: К х I х J R — одношаговая функция выигрыша; априорным распределением р 6 числом повторений N. Схема игры была кратко изложена при описании объекта исследования. Стратегиями игроков являются стратегии поведения. Значение игры val[Гдг(р)] определяется стандартным образом.

2) Нераскрывающей игрой Г^^р) называется одношаговая антагонистическая игра с функцией выигрыша А(р) = EpAfc, где математическое ожидание берется по распределению состояния к. Игра ГНр) соответствует версии одношаговой игры Ti(p), где Игрок 1 "забыл" к. Обозначим val[rfR(p)] через щ~(р).

3) Ценой информации называется величина

price[Г/Др)] = уа1[Гдг(р)] - NCav [ur](p),

где Cav обозначает взятие минимальной выпуклой вверх мажоранты.

► Приводятся известные результаты о связи асимптотического поведения цены информации с задачами о максимальной вариации. Пусть М&(к)(р) — множество мартингалов fi = (/^п,^п)п>о, принимающих значения в вероятностных мерах на Л" и таких, что [¿о = Р неслучайно. Максимальная вариация длины N определяется формулой

Фл(р) = sup Е IK+i - Vnhv) ,

где || ■ ||tv обозначает полную вариацию меры со знаком (заряда).

9

Величина Флг(р) может интерпретироваться как максимальная возможная изменчивость представлений Статистика о ненаблюдаемом состоянии к с априорным распределением р в процессе последовательных наблюдений за случайными величинами Xi,Xi(предполагается, что Статистику известно совместное распределение (к,Х...Х^) и он обновляет свои представления о распределении к байесовским образом).

Р. Ауманн и М. Машлер показали, что

О < рпсе[Глг(р)] < sup k,ij

Также для конечного К ими установлено, что $n{p) < Cy/N, а значит, в этом случае цена информации не может расти быстрее %/iV. Имеются примеры игр с такой скоростью роста (Ш. Замир).

► Описывается метод редукции игры к мартингальной оптимизационной задаче, возникший при исследовании моделей финансового рынка с асимметричной информацией (Б. Де Мейер, Ф. Генсбиттель). Он является основой результатов, полученных в Главах 2 и 3.

► Излагаются известные результаты, относящиеся к моделированию динамики финансового рынка с асимметричной информацией. Описывается класс непрерывных и дискретных моделей финансового рынка. Обсуждается эффект, мотивирующий исследование игр с ограниченной ценой информации: для непрерывных моделей цена информации растет как VN, тогда как для их дискретизации она остается ограниченной (Б. Де Мейер с А. Марино, В. Доманский).

Вторая глава посвящена объяснению феномена ограниченности цены информации, наблюдаемому для дискретных моделей финансового рынка. Будем говорить, что игра Tjv(p), отвечающая набору Г, является почти-честной, если ир{р) = 0. Модели финансового рынка удовлетворяют этому требованию. Для почти-честных игр val[r^(p)] = price[rw(p)]. Назовем игру Г'n(p) ступенчатой, если в нераскрывающей у Игрока 2 имеется

оптимальная стратегия, кусочно-постоянная как функция р 6 А (А"). Это свойство имеет место для дискретных моделей финансового рынка.

Теорема 2.1. Если в наборе Г = (К, 1,3, А) множества К, I и 3 конечны, а отвечающая этому набору повторяющаяся играТ^(р) с неполной информацией является ступенчатой и почти-честной, то цена информации рпсе[Г^(р)] равномерно ограничена по N и р.

С точностью до условия невырожденности из следующей теоремы (условие 3), свойство ступенчатости дает критерий ограниченности цены информации для почти-честных игр.

Теорема 2.2. Рассмотрим набор Г = (К, I, 7, А) с конечными множествами К, I и 3, которому отвечает почти-честная повторяющаяся игра с неполной информацией Т^(р). Предположим, что на К существует однопараметрическое семейство мер и(0) = и + вб, такое что для некоторого Л > 0 и всех в е (-Н, Н)

1. и (в) принадлежит Л (К);

2. в нераскрывающей игре Г,1,Е(1/(б)) не существует оптимальной

стратегии Игрока 2, кусочно-постоянной по в;

3. оптимальная стратегия Игрока 2 в Г^Е(1/(0)) единственна.

Тогда для любого р е с полным носителем (т.е. рк > 0 при всех

к £ К) выполнено

Ит.п£рпсе[ад]>а

ЛГ-юо

Как мы предполагаем, условие 3 носит технический характер. С учетом этого замечания сформулированные теоремы дают характеризацию возможных асимптотических поведений цены информации для почти-честных игр при N —► оо: цена информации либо растет, стремясь к конечному пределу, если игра является ступенчатой, либо растет как ч/77, если свойство ступенчатости отсутствует.

Приводятся примеры применения сформулированных теорем.

В третьей главе исследуется асимптотическое поведение максимальной вариации при N оо для больших множеств состояний К:

Описываются проблемы расходимости, возникающие в известных оценках максимальной вариации в случае счетного К и р с тяжелыми хвостами. Например, для оценки А. Неймана через энтропию Шеннона

ф*(р) < у/шщ, 5(/») = у"Л1пГ-У

ксК

правая часть обращается в бесконечность, если К = М, а рк ~ А;"1 (1п к)~2 при к —> оо. Это подсказывает возможность аномального роста Фл'(р) — быстрее для р с тяжелыми хвостами. Вопрос о точном классе р с классическим поведением максимальной вариации был сформулирован в статье А. Неймана.

► Устанавливается неулучшаемость константы 2 в оценке А. Неймана.

► Выводится семейство оценок Флг(р), сохраняющих смысл для дискретных априорных распределений р 6 Д(Л') с тяжелыми хвостами. Рассмотрим семейство величин, характеризующих неопределенность распределения р:

кеК yHk/ J

Теорема 3.3. Пусть К конечно или счетно upe. Д(АТ). Тогда для любого е € [0,1/2] выполнено

Ф«(р) < CoN&ZtW),

где Со = V2 (1 + < ч/б. Определим показатель

. In (Флг(р))

аф(р) = lim sup ———.

оо In j\

Следующая теорема утверждает, что после минимизации по е, для которых оценка из Теоремы 3.3 имеет смысл, мы получаем точное значение для скорости роста максимальной вариации в степенной шкале.

Теорема 3.4. Если К конечно или счетно, а р € Д (К) невырождено, то а*(р) = \ + £*(Р). £*(Р) = inf {£ 6 [0,1/2] | Z¿p) < .

Таким образом, ответ на вопрос А. Неймана о классер, для которых ^n(p) растет как л/JV, дается условием 2о(р) = YlknK Р/с у In < оо, более слабым, чем требование конечности энтропии. Если же это условие не выполнено, то из Теоремы 3.4 следует появление аномального роста максимальной вариации, скорость которого охарактеризована в терминах тяжести хвостов р.

Рассматривается случай континуального К. Если р 6 Д(А') имеет нетривиальную непрерывную компоненту рс, то поведение Флг(р) описывается следующей теоремой. Напомним, что топологически полное сепарабельное топологическое пространство, наделенное борелевской сигма-алгеброй, называется польским пространством.

Теорема 3.5. Пусть К — польское пространство upe Тогда

VN(p)=2pc{K)N + o{N), N —t оо.

Отметим, что если р € Д (К) дискретно, то в качестве множества Л" можно взять множество атомов р, сводя вопросы о поведении максимальной вариации к ситуации, описанной Теоремами 3.3 и 3.4.

Четвертая глава посвящена максимальной скорости роста цены информации. В этой главе:

► Устанавливается эффект аномального роста цены информации для счетного

множества состояний К. Определим показатель

/ N V In (price[I"V(p)]) аг(р)= sup lim sup — ——-

ree(AT) N-nx ln/V

характеризующий максимальную скорость роста цены информации в степенной шкале. Здесь супремум берется по всевозможным наборам Г с множеством состояний К, таким что множества действий I и J не более чем счетны, одношаговая функция выигрыша А ограничена, а у игр Гдг(р) и Г^а(р) существуют значения.

Теорема 4.1. Предположим, что К конечно или счетно, а р € Д(Л") невырождено. Тогда выполнено следующее соотношение

аг (р) = \ + е'(р) = М/з)>

где £'{р) = inf{e е [1/2,1] | Zc(p) < оо}.

13

Иными словами, максимальная скорость роста цены информацйи совпадает со скоростью роста максимальной вариации. Следовательно, для р с тяжелыми хвостами цена информации может расти как № с а > т.е. аномально быстро. Отметим, что ранее аномальный рост цены информации в повторяющихся играх не отмечался.

Доказательство Теоремы 4.1 основано на явной конструкции повторяющейся игры 0м(р) с аномальным ростом цены информации. Каждый шаг п = 0,1, ...ЛГ — 1 этой игры удобно разделить на два этапа:

1. на первом этапе Игрок 1 выбирает конечное подмножество Хп С К, а Игрок 2 — конечное подмножество Уп С К, после чего ХпГ]Уп сообщается Игроку 2;

2. на следующем этапе они играют в матричную игру А1, если к 6 Хп, и в игру А0, иначе:

Оказывается, что для этой игры

In (рпсе[©лг(р)1) 1 ,, ч

Ilmsup 1л ЛГ = 9 + £ {р)

w-too m N 2

для любого невырожденного р.

Отметим, что игра с множеством состояний {0,1} и одкошаговыми выигрышами, заданными А1 и А0, является классическим примером так называемых нормальных игр, для которых цена информации растет как \fN (Ж.-Ф. Мертенс, Ш. Замир).

► Рассматривается случай континуального К. Конструкция игры &n(p) обобщается на случай К = [0,1] (или произвольного несчетного польского пространства), демонстрируя возможность линейного роста цены информации для р с нетривиальной непрерывной компонентой. Однако эта игра обладает патологическим свойством: одношаговая функция выигрыша оказывается разрывной в каждой точке к £ [0,1]. Это наблюдение подсказывает, что линейный рост цены информации также является патологическим эффектом,

14

и мотивирует исследование игр с регулярными одношаговыми функциями выигрыша.

► Разрабатывается подход к учету условий регулярности одношаговой функции выигрыша. Пусть К — полное сепарабельное метрическое пространство с метрикой && и конечным диаметром зир^*, сПя^/с, к'). Тогда dist порождает метрику Канторовича (Пег! на пространстве борелевских вероятностных мер Д{К) по формуле dist^р.р') = Ы^^Е^дкЦк,к')), где инфимум берется по классу всевозможных совместных распределений случайных элементов к и к' с маргиналами р и р', соответственно.

Рассмотрим введенную А. Вершиком е-энтропию тройки {К, р)

•НДЯГ.сМ.р) = ш£{5(ре) | (118Ь(р,ре) < е},

где инфимум берется по всем дискретным вероятностным мерам ре на К с конечной энтропией Шеннона Я.

Теорема 4.2. Рассмотрим набор Г = (К, I, А). Предположим, что

• множество состояний К — полное сепарабельное метрическое пространство с метрикой с^ и конечным диаметром;

• множества действий 1 и 3 являются польскими пространствами;

• одношаговая функция выигрыша

- 1 -липшщева по к е К в метрике с!^: - А£| < <1Ы{к,к') для всех к, к' е К, г е / и е 3;

- ограничена: ЦАЦ», = зир*^,- < оо;

• для любого N € N и всех р е Д(К) у игр Гн(р) и существуют значения.

Тогда при любом р е Д(ДГ) и N е N цена информации в Гя(р) допускает оценку:

рпсе[Г^(р)] < Ш 2Ые + 15

Отметим, что оценивается сверху через е-энтропиЮ

Колмогорова (Я,^), однако в отличие от нее, величинаЧ£{К, с^.р) конечна в условиях Теоремы 4.2. Ряд примеров применения этой теоремы:

• Пусть К — [-1,1]'; множества I и 3 — произвольные польские пространства; функция А ограничена единицей по модулю и 1-липшицева по к в метрике сНв^ где (Ш^ам/) = тах^1,...1 \х{ - значения игр Гц(р) и Г^а(р) существуют. Тогда

рпсе[1>(р)] < Зу/ШЩШ).

• Пусть множества действий I и 3 конечны; К произвольно; функция А ограничена единицей по модулю. Тогда игры Г^(р) и Г^р) имеют значения и выполнено

рпсе[Г*(р)] < 3^|/||7|ЛГ1п(4ЛГ).

То есть для игр с функциями выигрыша, регулярными по к, как и для игр с конечными множествами действий, не бывает аномального роста цены информации в степенной шкале.

Заключение содержит краткое обсуждение основных результатов, полученных в диссертации, и перспектив дальнейшего исследования.

Заключение

Полученные результаты убедительно демонстрируют эффективность метода редукции игры к мартингальной оптимизационной задаче при исследовании повторяющихся игр с неполной информацией. Этот метод, введенный Б. Де Мейером при изучении моделей динамики финансового рынка и развитый Ф. Генсбиттелем, позволяет свести проблему стратегического анализа игры к задачам, для исследования которых могут быть успешно применены методы теории вероятностей.

Для дискретных моделей финансового рынка с асимметричной информацией этот подход позволил нам ответить на вопрос о природе эффекта ограниченности цены информации, ранее не находившего удовлетворительного объяснения. Для этой цели исследовано асимптотическое поведение цены

информации в почти-честных играх — широком классе игр, содержащем модели финансового рынка. Установлено, что при выполнении технического предположения о невырожденности игры возможны лишь два поведения: с ростом числа повторений N цена информации, возрастая, стремится к конечному пределу; цена информации растет как \/~Ы. Получены легко проверяемые условия принадлежности игры к одному из двух классов.

За ограниченность значения оказывается ответственно введенное в диссертации свойство ступенчатости игры. Этот результат позволяет сформулировать интересный открытый вопрос. Установлено, что для ступенчатых игр цена информации оказывается ограниченной, как и для дискретных моделей рынка. Но присутствует ли для ступенчатых игр другой эффект, свойственный рыночным моделям: эффект раскрытия информации за конечное время?

Метод редукции к мартингальной оптимизационной задаче является основным инструментом для получения другой серии результатов, относящихся к повторяющимся играм с большим множеством состояний К. Здесь удается описать новый эффект, названный нами аномальным ростом цены информации: в случае априорного распределения р с тяжелыми хвостами цена информации может расти быстрее у/И — максимальной скорости роста в ситуации с конечным множеством К. При этом мы характеризуем максимальную скорость роста цены информации в степенной шкале в терминах тяжести хвостов р. При исследовании аномального роста цены информации важную роль играет максимальная вариация — характеристика максимальной изменчивости представлений в процессе байесовского обучения. Для нее мы также устанавливаем эффект аномального роста и находим точный класс априорных распределений, для которых применимы классические результаты, утверждающие рост максимальной вариации как у/ЪГ, тем самым отвечая на открытый вопрос из статьи А. Неймана.

Стоит отметить, что как для повторяющихся игр с неполной информацией, так и для задач о максимальной вариации остается еще масса открытых вопросов. Ряд вопросов связан с существованием пределов и модельным поведением. Например, верно ли, что если цена информации

в игре Глг(р) растет как \fÑ, т.е. оценивается через VÑ с положительными константами снизу и сверху, то существует предел рпсе[Глс(р)]/\/]У при N —» оо? Действительно ли для повторяющихся игр с конечными К, I и J бывает лишь три возможных сценария для поведения цены информации при N —» оо: ограниченность, логарифмический рост, рост как VÑ? Частичный ответ на второй вопрос дается в диссертации для класса почти-честных игр.

Мы предполагаем, что ответы на эти и другие открытые вопросы могут быть получены благодаря применению вероятностных методов для анализа теоретико-игровых задач.

Список публикаций автора по теме диссертации

Публикации в ведущих рецензируемых журналах, входящих в перечень ВАК

1. Сандоммрский Ф.А. Вариация мартингалов со значениями в вероятностных мерах и повторяющиеся игры с неполной информацией // Доклады академии наук. 2012. Т.447. Вып.З. С.274-276. (0,4 п.л.)

Препринты

2. Sandomirskiy F. Repeated games of incomplete information with large sets of states [Электронный ресурс] arXiv:1205.6791. 2013. URL: http://arxiv.org/abs/1205.6791 (дата обращения: 9.11.2013) (1,5 п.л.)

Тезисы докладов на международных научных конференциях

3. Сандомирсхий Ф.А. Вариация последовательности апостериорных вероятностей и повторяющиеся игры с неполной информацией со счетным множеством состояний // Обозрение прикладной и промышленной математики. 2012. Т.19. Вып.2. С.220-222. (0,15 п.л.)

4. Sandomirskii F. Repeated incomplete information games with countable state space: broken VÑ-lccw // The Sixth Int. Conf. Game Theory and Management GTM2012. Abstraite / Eds. by L. Petrosjan and N. Zenkevich. St.Petereburg. 2012. P.234-237. (0,15 п.л.)

5. Sandomirskii F. Repeated games with incomplete information and slowly growing value // Extended Abstracts of Int. Workshop Networking Games and Management. Petrozavodsk. 2013. P.90-92. (0,15 п.л.)

6. Sandomirskii F. Repeated games with incomplete information and slowly growing value // The Seventh Int. Conf. Game Theory and Management GTM2013. Abstracts / Eds. by L. Petrosjan and N. Zenkevich. St.Petereburg. 2013. P.207-209. (0,15 п.л.)

Сандомирский Федор Алексеевич

АСИМПТОТИЧЕСКИЕ СВОЙСТВА ПОВТОРЯЮЩИХСЯ ИГР С НЕПОЛНОЙ ИНФОРМАЦИЕЙ И МОДЕЛИРОВАНИЕ ДИНАМИКИ ФИНАНСОВЫХ РЫНКОВ

Специальность: 08.00.13 — "Математические и инструментальные методы экономики"

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата физико-математических наук

Заказ №36

Объем 1 п.л.

ЦЭМИ РАН

Тираж 100 экз.

Диссертация: текстпо экономике, кандидата физико-математических наук, Сандомирский, Федор Алексеевич, Москва

\

Федеральное государственное бюджетное учреждение науки Центральный экономико-математический институт Российской академии наук

На правах рукописи

04201364847

Сандомирский Федор Алексеевич

АСИМПТОТИЧЕСКИЕ СВОЙСТВА ПОВТОРЯЮЩИХСЯ ИГР С НЕПОЛНОЙ ИНФОРМАЦИЕЙ И МОДЕЛИРОВАНИЕ ДИНАМИКИ ФИНАНСОВЫХ РЫНКОВ

Специальность: 08.00.13 — Математические и инструментальные методы экономики (физ.-мат. науки)

Диссертация на соискание ученой степени кандидата физико-математических наук

Научный руководитель: доктор физико-математических наук Пресман Эрнст Львович

Москва 2013

Содержание

Введение 4

1 Базовые факты теории повторяющихся игр

с неполной информацией 11

§1.1 Основные определения и классические результаты..................11

1.1.1 Цена информации при большом числе повторений

и максимальная вариация......................................13

1.1.2 Случай бесконечных К, I и 7..................................17

§ 1.2 Сведение игры к мартингальной оптимизационной задаче..........20

§ 1.3 Повторяющиеся игры с неполной информацией и моделирование

финансовых рынков....................................................21

1.3.1 Непрерывные модели ..........................................22

1.3.2 Дискретные модели ............................................23

2 Повторяющиеся игры с ограниченной ценой информации 25

§ 2.1 Мотивировка............................................................25

§ 2.2 Достаточное условие ограниченности ................................26

2.2.1 Модельная одномерная задача................................31

2.2.2 Модельная задача как редукция 2 х 2-игры..................32

§ 2.3 Необходимое условие ограниченности цены информации ..........34

2.3.1 Модельная одномерная задача................................35

2.3.2 Завершение доказательства Теоремы 2.2......................37

3 Максимальная изменчивость мнения при длительном байесовском обучении 42

§ 3.1 Определение максимальной вариации................................44

§ 3.2 Классические оценки максимальной вариации и проблема

расходимости............................................................45

§ 3.3 Энтропийные оценки максимальной вариации ......................47

3.3.1 Неулучшаемость оценки А. Неймана..........................47

3.3.2 Другие оценки максимальной вариации через энтропию Шеннона..........................................................50

§ 3.4 Оценки максимальной вариации сверху: счетное множество

состояний................................................................51

3.4.1 Оценки вариации скалярных ограниченных мартингалов . 52

3.4.2 А(А')-значные мартингалы....................................57

§ 3.5 Аномальный рост максимальной вариации..........................58

3.5.1 Мартингал диадических расщеплений для р 6 Д(К) .... 60

§ 3.6 Случай континуального множества состояний ......................65

3.6.1 Оценки максимальной вариации сверху......................66

3.6.2 Линейный рост максимальной вариации для р с нетривиальной непрерывной компонентой....................67

4 Максимальная скорость роста цены информации в

повторяющихся играх при N —> оо 69

§ 4.1 Повторяющиеся игры со счетным множеством состояний:

аномальный рост цены информации..................................70

4.1.1 Игра и ее свойства......................................72

§ 4.2 Обобщение на континуальный случай: игры со всюду разрывными

платежами ..............................................................77

§ 4.3 Регулярные одношаговые функциями выигрыша: цена

информации и е-энтропия Колмогорова..............................78

4.3.1 Оценки цены информации через е-энтропию................79

4.3.2 Применение к играм с регулярными одношаговыми функциями выигрыша..........................................84

Заключение 88

Список литературы 90

Введение

Представленная диссертация посвящена теоретико-игровому анализу информационных аспектов длительных многоэтапных социально-экономических взаимодействий.

Актуальность темы исследования. Социально-экономические взаимодействия людей или групп людей связаны с неопределенностью, а значит, с неполнотой информации у участников. Причем неполнота информации может меняться от участника к участнику. Ее источником может являться как различная информированность о свойствах самого взаимодействия и различные способности предвидеть будущее, так и невозможность знать достоверно все свойства оппонентов: цели, к которым они стремятся, и имеющуюся у них приватную информацию — их собственные представления о свойствах взаимодействия, о будущем и о других агентах.

Социально-экономические взаимодействия происходят во временной перспективе, и, соответственно, анализ поведения оппонентов в прошлом позволяет уточнять представления об их целях и имеющейся у них информации, а уточненные представления могут быть использованы, чтобы скорректировать поведение в будущем. Это обуславливает сложную информационную, а следовательно, и стратегическую природу продолжительных взаимодействий: выбирая план действий, необходимо учитывать не только сиюминутную выгоду, которую принесет то или иное действие, но и информацию, которую оно сообщит другим участникам.

Математическим моделированием информационных аспектов многошаговых социально-экономических взаимодействий занимается теория повторяющихся игр с неполной информацией — раздел теории игр, возникший в работах Нобелевского лауреата по экономике Р. Ауманна и М. Машлера (см. [9]). Центральную роль в теории играют асимптотические постановки при большой продолжительности взаимодействия, так как в силу сложной стратегической природы явные решения удается найти лишь в очень редких случаях. Основная часть известных результатов относится к ситуации, когда взаимодействуют лишь два игрока с полностью противоположными интересами, и неполная информация имеется лишь у одного из них (например,

см. работы Р. Ауманна, М. Машлера, Ш. Замира, Ж.-Ф. Мертенса, А. Неймана, Б. Де Мейера, Ф. Генсбиттеля из списка литературы). Однако, даже несмотря на полувековую историю дисциплины, для антагонистических игр с неполной информацией у одного из игроков остается масса открытых вопросов, на ряд из которых нам удается ответить. В частности, в диссертации даются ответы на вопросы, поставленные в недавней статье А. Неймана [27].

В последние годы источником открытых вопросов и новых методов анализа повторяющихся игр с неполной информацией стали игры, описывающие влияние асимметричности информации на динамику финансового рынка (Б. Де Мейер, X. М. Салей, А. Марино, В. Доманский, В. Крепе). В частности, из этого круга задач возник метод редукции игры к мартингальной оптимизационной задаче, введенный в работе Б. Де Мейера [12] и развитый Ф. Генсбиттелем в [21] — новейший метод анализа повторяющихся игр, активно используемый в диссертации.

Объектом исследования являются повторяющиеся антагонистические игры с неполной информацией у Игрока 2. В них два игрока N раз участвуют в антагонистической игре, заданной одношаговой функцией выигрыша Ак. Функция А^ зависит от состояния к, которое выбирается случаем из множества состояний К в соответствии с распределением р Е перед началом игры.

При этом оба игрока знают р, но лишь Игрок 1 информирован о к. На шаге п = 0,1,...А/" — 1 обоим игрокам известна история действий на предыдущих шагах, что позволяет Игроку 2 уточнять свои представления о к, анализируя действия информированного Игрока 1. Пошаговые выигрыши не наблюдаются до шага АГ — 1, после которого Игрок 1 получает от оппонента их сумму. Оба игрока рациональны и знают это описание.

Предмет исследования составляют асимптотические свойства повторяющихся игр с неполной информацией при продолжительности игры ТУ, стремящейся к бесконечности.

Назовем ценой информации в повторяющейся игре с неполной информацией разницу между выигрышем информированного игрока (Игрока 1) в ней и выигрышем, который бы он получил, забыв всю имеющуюся у него информацию. В случае конечного К из классических результатов следует, что цена информации не может по порядку превосходить при

N —>■ сю. Этот результат тесно связан с оценками максимальной вариации — величины, характеризующей максимальную изменчивость представлений в процессе байесовского обучения продолжительности N с заданным априорным распределением р £ А (К). В случае бесконечного Кире тяжелыми хвостами известные оценки теряют смысл, и встает вопрос о возможности "аномального роста" и максимальной вариации, и цены информации — быстрее у/Й при N —>■ оо. Другой вопрос связан с противоположной ситуацией. Для дискретных моделей финансового рынка с асимметричной информацией в работах Б. Де Мейера с А. Марино [13, 15] и В. Доманского [17] было установлено , что цена информации остается ограниченной при N —У оо. Однако вопрос о природе этого эффекта остался без ответа. Диссертационное исследование было вдохновлено этими вопросами и дает на них исчерпывающие ответы.

Цель исследования состоит в описании экстремальных асимптотических режимов для цены информации при большом числе повторений N — наименьшей и наибольшей возможных скоростей ее роста при N —>■ оо, а также в анализе свойств игры, ответственных за появление этих режимов.

Для этой цели в диссертации решаются следующие задачи:

• Объяснение феномена ограниченности цены информации для дискретных моделей динамики финансового рынка с асимметричной информацией. Нахождение условий, обеспечивающих ограниченность цены информации в классе "почти-честных" игр — игр, для которых единственным преимуществом Игрока 1 является его информация (этот класс содержит модели финансового рынка). Разработка подхода, позволяющего свести вопрос о поведении цены информации в общей почти-честной игре к анализу модельной задачи.

• Получение оценок максимальной вариации, сохраняющих смысл для дискретного априорного распределения р с тяжелыми хвостами. Анализ эффекта аномального роста максимальной вариации. Исследование максимальной вариации для континуального множества состояний К]

• Анализ максимальной скорости роста цены информации при N —> оо в

случае счетного К и распределения р с тяжелыми хвостами. Разработка подхода, позволяющего учитывать условия регулярности одношаговой функции выигрыша в случае континуального К при исследовании асимптотического поведения цены информации.

Методы исследования. В работе использована комбинация методов теории игр, теории вероятностей и, в частности, теории стохастического оптимального управления. Для анализа асимптотического поведения цены информации применяется подход, основанный на связи игровых постановок с задачами о максимальной вариации и их обобщениями, в том числе метод редукции игры к мартингальной оптимизационной задаче из [12] и [21]. Также используются стратегический анализ, теория возмущений для матричных антагонистических игр, методы выпуклой геометрии и методы теории аппроксимации в метрических пространствах. Оценки максимальной вариации основаны на двойственном представлении для вариации скалярных мартингалов, введенном в [11], и оценках больших уклонений.

Теоретическая и практическая значимость. Работа носит теоретический характер и ставит своей целью развитие теоретико-игровых методов анализа социально-экономических взаимодействий. Полученные результаты являются существенным продвижением в понимании эффектов, возникающих в теоретико-игровых моделях финансового рынка с асимметричной информацией. Результаты диссертации могут быть использованы при разработке курсов лекций по теории динамических игр и теории игр с неполной информацией с целью демонстрации мартингальных методов в многошаговых задачах с неполной информацией и, в частности, эффективности редукции игровых постановок к задачам мартингальной оптимизации — новейшего метода, который, несмотря на свою универсальность, был применен пока лишь к весьма ограниченному кругу задач.

Научная новизна. Игры с ограниченной ценой информации, как класс игр, ранее не рассматривались (изучались лишь конкретные модели финансового рынка, обладающие этим свойством), а общие свойства игр этого класса не анализировались. Не объяснялась и природа эффекта ограниченности цены информации в дискретных моделях финансового рынка. Общие результаты, относящиеся к играм с неполной информацией и счетным

множеством состояний, ранее отсутствовали, а эффект аномального роста цены информации не отмечался и не изучался. Все результаты диссертации получены автором лично и обоснованы строгими математическими доказательствами.

Структура работы и основные положения. Диссертация содержит 93 страницы и состоит из введения, четырех глав, заключения и списка литературы из 34 наименований.

Кратко перечислим основные результаты исследования по главам:

• В Главе 2 получено исчерпывающее объяснение эффекта ограниченности цены информации для дискретных моделей финансового рынка с асимметричной информацией. Установлен критерий ограниченности цены информации в классе почти-честных игр и описаны возможные асимптотические поведения цены информации в этом классе.

• В Главе 3 для дискретного априорного распределения р охарактеризована скорость роста максимальной вариации в степенной шкале в терминах семейства величин, измеряющих неопределенность /?, включающего энтропию Шеннона. Продемонстрирована возможность аномального роста максимальной вариации для р с тяжелыми хвостами, и построен соответствующий пример. В случае непрерывного р установлен линейный рост максимальной вариации.

• В Главе 4 показано, что максимальная скорость роста цены информации совпадает со скоростью роста максимальной вариации, а значит, эффект аномального роста имеется и для цены информации. Построен соответствующий пример. Для игр с регулярными одношаговыми функциями выигрыша получены оценки на скорость роста цены информации в терминах асимптотики колмогоровской ^-энтропии. Показано, что для игр с условиями регулярности эффект аномального роста может отсутствовать.

Апробация результатов исследования. Результаты

диссертационного исследования были представлены на следующих конференциях и семинарах:

Семинар лаборатории Теории игр и принятия решений СПб ЭМИ РАН (Санкт-Петербург, 20 января 2012);

Семинар лаборатории Чебышева "Теория вероятностей" (Санкт-Петербург, 15 мая 2012);

8-ая Международная петрозаводская конференция "Вероятностные методы в дискретной математике" и 13-ый Всероссийский симпозиум по прикладной и промышленной математике (Петрозаводск, 2-9 июня 2012);

Международная конференция "Games and Strategy in Paris" в честь шестидесятилетия С. Сорена (Париж, 11-13 июня 2012);

6-ая Международная конференция "Теория Игр и Менеджмент" GTM2012 (Санкт-Петербург, 27-29 июня 2012);

Семинар "Вероятностные проблемы управления и стохастические модели в экономике, финансах и страховании" (ЦЭМИ РАН) (Москва, 20 ноября 2012);

"Городской семинар по теории вероятностей и математической статистике" (ПОМИ РАН) (Санкт-Петербург, 14 декабря 2012);

Международная конференция "4th Nordic Triangular Seminar in Applied Stochastics" (Хельсинки, 6-8 марта 2013);

Международная конференция "The 5th Israeli Game Theory conference" (Тель-Авив, 3 июня 2013);

Семинар Центра изучения рациональности Еврейского университета (Center for the Study of Rationality) (Иерусалим, 4 июня 2013);

Международная конференция "Сетевые игры и менеджмент" NGM2013 (Петрозаводск, 23-25 июня 2013);

7-ая Международная конференция "Теория Игр и Менеджмент" GTM2013 (Санкт-Петербург, 26-28 июня 2013).

Публикации по теме диссертации. Основные результаты диссертации отражены в шести публикациях. Из них одна публикация [6] — в журнале, входящем в список ВАК; один препринт [31]; остальные публикации [7, 28, 29, 30] являются расширенными тезисами международных конференций.

1 Базовые факты теории повторяющихся игр

с неполной информацией

§ 1.1 Основные определения и классические результаты

Опишем Л^-шаговую повторяющуюся антагоничтическую игру Гдг(р) с неполной информацией у Игрока 2 (детальное изложение теории повторяющихся игр с неполной информацией может быть найдено в книгах [9, 26]). Для этого нам понадобится 4-элементный набор Г = (К, /, А), число повторений N £ N и априорное распределение р £ Д(/Г). Здесь К — множество состояний; I и 7 — множества действий Игрока 1 и Игрока 2, соответственно; А : KxIxJ-J>R — одношаговая функция выигрыша; А(К) обозначает множество всех вероятностных распределений на К. Пока будем считать, что К, I и 7 конечны (бесконечный случай обсуждается в пункте 1.1.2).

Игра устроена следующим образом. Перед ее началом случай выбирает состояние природы к £ К в соответствии с распределением р, после чего к сообщается Игроку 1. Оба игрока знают р. Далее на каждом шаге игры п = 0,1,... N — 1 игроки одновременно выбирают свои действия гп £ / и jn Е «/, основываясь на имеющейся у них к этому шагу информации, и выбранные действия публично оглашаются перед следующим шагом игры п + 1. Вклад шага игры п в полный выигрыш Игрока 1 (или же проигрыш Игрока 2) равен А^ то есть зависит не только от действий игроков на этом шаге но и от к. В процессе игры наблюдаемы только действия игроков, и, таким образом, пошаговые выигрыши остаются неизвестны Игроку 2 до последнего шага игры N - 1.

Стратегией поведения (ранд�