Экономико-математическое моделирование коммерческого успеха высокорисковых проектов в киноиндустрии тема диссертации по экономике, полный текст автореферата
- Ученая степень
- кандидата экономических наук
- Автор
- Антипов, Евгений Александрович
- Место защиты
- Санкт-Петербург
- Год
- 2015
- Шифр ВАК РФ
- 08.00.13
Автореферат диссертации по теме "Экономико-математическое моделирование коммерческого успеха высокорисковых проектов в киноиндустрии"
На правах рукописи
АНТИПОВ ЕВГЕНИЙ АЛЕКСАНДРОВИЧ
ЭКОНОМИКО-МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ КОММЕРЧЕСКОГО УСПЕХА ВЫСОКОРИСКОВЫХ ПРОЕКТОВ В КИНОИНДУСТРИИ
Специальность 08.00.13 - Математические и инструментальные методы
экономики
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата экономических наук
11 МАР 2015
Санкт-Петербург - 2015
005560450
005560450
Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего образования «Санкт-Петербургский государственный экономический университет».
Научный руководитель -
доктор экономических наук, профессор Чернов Виктор Петрович
Официальные оппоненты:
Перекрест Владимир Терентьевич,
доктор физико-математических наук, ФГБУН «Санкт-Петербургский экономико-математический институт Российской академии наук», заведующий лабораторией
математических методов анализа данных Евстратчик Светлана Васильевна, кандидат экономических наук, доцент, ФГБОУ ВПО «Санкт Петербургский государственный университет», доцент кафедры экономической кибернетики
Ведущая организация -
Международный центр социально-
экономических исследований «Леонтьевский центр»
Защита диссертации состоится «31» марта 2015 года в /7 часов на заседании диссертационного совета Д 212.354.06 при Федеральном государственном бюджетном образовательном учреждении высшего образования «Санкт-Петербургский государственный экономический университет» по адресу: 191023, Санкт-Петербург, ул. Садовая, д. 21, ау
С диссертацией можно ознакомиться в библиотеке и на сайте http://www.unecon.ru/dis-sovety Федерального государственного бюджетного образовательного учреждения высшего образования «Санкт-Петербургский государственный экономический университет».
Автореферат разослан «_» февраля 2015 г.
Ученый секретарь
диссертационного совета /^гп — М.И. Барабанова
I. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования. По данным отчета «Theatrical Market Statistics 2014» Американской ассоциации кинокомпаний в 2013 году суммарные кассовые сборы всех вышедших в мировой кинотеатральный прокат фильмов достигли $35,9 млрд., что на 4% больше, чем в 2012 году. На долю США и Канады приходится треть всех кассовых сборов ($10,9 млрд.). Однако наиболее быстрорастущими оказались китайский (+27%), мексиканский (+16%) и российский рынки (+11%). Суммарные кинотеатральные сборы в России составили в 2013 году $1,4 млрд., что является 6-м результатом среди стран мира. Объем всего кинорынка может быть в разы выше кинотеатрального, т.к. включает в себя сборы от продаж фильмов на дисках, в форме мобильного контента, а также сборы от продаж прав на показ кинопродуктов телевизионным каналам. Кроме непосредственного вклада киноиндустрии в экономику, она стимулирует многочисленные внешние эффекты: потребление определенных товаров, посещение стран, показанных в кинокартинах и т.п.
Несмотря на то, что киноиндустрия характеризуется достаточно большим размером и высоким темпом роста, производство кинофильмов - один из наиболее рискованных видов предпринимательства. Ряд фильмов имеют колоссальные бюджеты в несколько сотен миллионов долларов -соответствующими должны быть и доходы от показа фильма в кинотеатрах и продаж DVD, но инвесторы отмечают, что предсказать финансовый успех фильма крайне сложно даже для опытных участников рынка. По различным данным лишь порядка 30-40% фильмов окупает затраты на их производство и приносит прибыль. Расширение знаний относительно факторов успеха фильмов можно рассматривать как важнейший вклад в уменьшение доли неудачных инвестиций в кинопроизводство. Предварительная оценка будущего коммерческого успеха кинофильмов может позволить инвесторам сузить круг проектов, требующих более тщательного последующего анализа их инвестиционной привлекательности. Разработка достаточно точных экономико-математических моделей также позволила бы кинотеатрам количественно обосновывать принятие решений о покупке прав на показ определенных фильмов. Умение предсказывать показатели успеха кинофильмов в последнее время стало актуальным и для людей, не участвующих в производстве и показе фильмов, в связи с существованием букмекерских контор, принимающих ставки на исход различных событий, и появлением бирж ставок, фактически являющихся частным случаем так называемых рынков предсказаний - особого вида финансовых рынков, на которых заключаются контракты, владельцы которых в случае наступления определенного события (например, превышения кассовыми сборами кинофильма определенной планки) получают выигрыш, в противном случае - нет. Как организатор торгов или букмекерской конторы, так и игроки могут быть заинтересованы в разработке моделей для расчета вероятности того или иного исхода.
Наличие большого объема свободно доступной исторической информации о характеристиках кинофильмов делает возможным и обоснованным использование эконометрических методов для понимания
факторов, повышающих и понижающих вероятность успеха фильма и его кассовые сборы.
Предлагаемые в данной работе экономико-математические подходы к спецификации, интерпретации, диагностике и повышению точности моделей могут быть использованы в целом классе систем принятия экономических и управленческих решений, связанных с оценкой перспективности различного рода инновационных проектов, спецификой которых являются высокие риски неудачной реализации. Использование предлагаемых математических подходов позволяет обеспечить большую реалистичность моделей и улучшить их интерпретацию, что особенно важно при обосновании и принятии управленческих решений в маркетинге и финансах.
Степень разработанности научной проблемы. На протяжении последних 30 лет происходил рост числа академических исследований, посвященных киноиндустрии. Сложность производственного процесса, уникальные особенности дистрибуции и показа, а также неопределенность спроса поставили перед учеными ряд весьма значимых и, в то же время, интересных проблем. Доступность значительного числа источников эмпирических данных по киноиндустрии (как открытых, так и закрытых) стала дополнительным фактором привлекательности этой темы для исследователей.
Исследованиями киноиндустрии на микроуровне занимались такие зарубежные ученые, как С. Сочей, X. Фогель, У. Уолс, Б. Литман, Б. Чанг, Д. Делен, Р. Шарда, П. Кумар, А. Элберс, И. Элиашберг, А. Дэ Вэни, Ф. Цуфриден, С. Басурой, С. Рэвид и др. Среди российских исследователей проблемами маркетинга кинопроектов занимались И.А. Звегинцева, И.В. Неволин, Н.В. Ноакк, С.К. Сарымсаков, A.C. Татарников, М.А. Ульянова и др. Работы по изучению киноиндустрии на макроуровне, т.е. посвященные проблемам, относящимся к индустрии в целом, принадлежат таким авторам, как Д. Бай, М. Вестерман, Д. Гайлс, Р. Девентер, П. Макмиллан, И. Смит, К. Хэнд и др.
Обзор исследований спроса на кинофильмы позволил нам выявить некоторые ограничения существующих в этой области работ и пути совершенствования моделей спроса на кинофильмы:
1. Авторы большинства исследований не учитывают характеристики, описывающие состояние рынка в момент выхода фильма в прокат, среди которых особо важной представляется интенсивность конкуренции со стороны других фильмов.
2. Исследователи, как правило, делают попытку получить единую формулу успеха для всех фильмов, не принимая во внимание тот факт, что, например, рейтинг R (лицам до 17 лет обязательно присутствие взрослого) может положительно влиять на кассовые сборы боевиков и триллеров, но отрицательно влиять на кассовые сборы семейных комедий.
3. Сила актерского состава и режиссера, их «звездность» оценивается с помощью субъективных показателей и/илй показателей, которые были измерены уже после выхода фильма в прокат, что создает проблему
обратной причинности (актер мог стать звездой после того, как фильм вышел в прокат).
4. Исследователям не удается в сколько-нибудь значительной степени учесть художественную составляющую фильма, поскольку для решения этой проблемы в существующих исследованиях используется классификация фильмов только по жанру.
5. В существующей литературе мало внимания уделяется диагностике точности получаемых моделей. В то же время, модель может давать хороший прогноз на одном сегменте выборки, но плохой - на другом. Цель и задачи диссертационного исследования. Целью данной работы
является развитие методов экономико-математического моделирования будущего коммерческого успеха высокорисковых кинопроектов на основе информации, имеющейся в открытом доступе на ранних этапах кинопроизводственного цикла.
Для достижения этой цели были поставлены и решены следующие задачи:
■ Разработка концептуальной модели коммерческого успеха кинофильмов;
■ Разработка оригинальных количественных показателей, отражающих силу актерского состава и режиссера кинофильма, интенсивность конкуренции в момент выхода фильма в прокат;
■ Формализация доступной о кинофильмах текстовой информации с использованием интеллектуального анализа текстов и метода главных компонент для дальнейшего использования этой информации в экономико-математических моделях;
■ Проведение описательного и сегментационного анализа рынка кинофильмов;
■ Построение и интерпретация робастных регрессионных моделей кассовых сборов кинофильма, построенных по историческим данным;
■ Построение и интерпретация регрессионной модели с латентными классами, которые различаются параметрами модели кассовых сборов;
■ Разработка сегментационного подхода к диагностике однородности качества предсказания между сегментами наблюдений для задач регрессии и классификации;
■ Сравнительный анализ и диагностика прогнозных моделей кассовых сборов и относительной рентабельности;
■ Оценка важности различных предикторов кассовых сборов кинофильма. Объект и предмет исследования. Объектом исследования являются
предприятия киноиндустрии, занимающиеся производством кинофильмов для широкого кинотеатрального проката. Предметом исследования является процесс формирования кинотеатральных кассовых сборов, являющихся основой для расчета показателей коммерческого успеха кинофильмов.
Теоретическая и методологическая основа исследования. Теоретической и методологической основами исследования послужили труды отечественных и зарубежных экономистов-математиков в области концептуального и экономико-математического моделирования коммерческого
успеха кинофильмов, методы эконометрики и машинного обучения. При обработке данных использовались пакеты прикладных программ Stata 12, Statistica 8 и IBM SPSS Statistics 20.
Информационная база работы. В работе использованы данные компании Nash Information Services, LLC, известной на международном рынке информационных услуг для киноиндустрии. В набор данных вошли все фильмы с известным производственным бюджетом, вышедшие в широкий американский прокат в 1999-2012 гг.
Обоснованность и достоверность результатов диссертационного исследования. Обоснованность и достоверность результатов исследования обеспечивается высоким уровнем адекватности используемого информационного обеспечения и научной обоснованностью выбора инструментов исследования.
Соответствие диссертации Паспорту научной специальности. Диссертационная работа соответствует Паспорту научной специальности 08.00.13 — «Математические и инструментальные методы экономики», а именно следующим пунктам части 1 «Математические методы»:
■ 1.1. Разработка и развитие математического аппарата анализа экономических систем: математической экономики, эконометрики, прикладной статистики, теории игр, оптимизации, теории принятия решений, дискретной математики и других методов, используемых в экономико-математическом моделировании.
■ 1.4. Разработка и исследование моделей и математических методов анализа микроэкономических процессов и систем: отраслей народного хозяйства, фирм и предприятий, домашних хозяйств, рынков, механизмов формирования спроса и потребления, способов количественной оценки предпринимательских рисков и обоснования инвестиционных решений. Научная новизна результатов исследования. Научная новизна
результатов исследования состоит в разработке совокупности оригинальных моделей, подходов и методик, способствующих проведению многофакторного экономико-математического анализа коммерческого успеха кинофильмов, позволяющего сделать количественно обоснованные выводы об их коммерческом потенциале.
Наиболее существенные результаты исследования, обладающие научной новизной и полученные лично соискателем:
1. Разработана концептуальная модель коммерческого успеха кинофильмов, систематизирующая детерминанты спроса на кинокартины и формирующая основу для экономико-математического моделирования коммерческого успеха кинопроектов.
2. Получена расширенная система факторов, основанная на формализации текстовой информации о причинах присвоения фильму того или иного рейтинга Американской ассоциации кинопроизводителей (ААК), что существенно дополнило перечень объясняющих переменных, используемых в моделировании коммерческого успеха фильмов. Было показано, что использование полученного набора снижает проблему
мультиколлинеарности в регрессионном моделировании за счет низкой корреляции получаемых переменных с жанром и художественным типом фильмов, при этом сохраняя долю объясняемой дисперсии на том же уровне, что и при использовании самих рейтингов ААК.
3. Разработан и применен подход к анализу жанровой специализации дистрибьюторов кинопродукции, основанный на количественном анализе соответствий, позволивший сделать обоснованный вывод о наличии у дистрибьюторов сравнительных преимуществ, несмотря на то, что крупные дистрибьюторы берутся за реализацию фильмов разных жанров. Данный подход можно использовать для отслеживания жанровой специализации дистрибьюторов во времени.
4. Предложены методики расчета показателей силы актерского и режиссерского состава фильмов, а также интенсивности конкуренции на рынке в момент выхода фильма в прокат, особенностью которых является опора на объективные количественные данные. Эмпирически подтверждена статистическая значимость этих объясняющих переменных.
5. Проведена кластеризация рынка кинофильмов, позволившая выделить 7 крупных групп кинопроектов, между которыми доля рентабельных фильмов существенно варьируется. Кластеризация подтверждает гипотезу о различиях вероятности успеха кинофильмов в разных сегментах кинорынка.
6. Выявлены на основе робастной регрессионной модели устойчивые статистически значимые закономерности, описывающие характер влияния атрибутов кинофильмов на их кассовые сборы.
7. Разработана модель кассовых сборов, в которой впервые учтена неоднородность предельных эффектов характеристик кинофильмов в зависимости от сегмента, к которому относится фильм. Модель позволила выявить 2 латентных класса кинофильмов, в которых наблюдается различное влияние управляемых менеджером кинопроекта характеристик на кассовые сборы, и в значительной степени объяснить получаемые исследователями различия в выводах о влиянии характеристик кинопроекта на его коммерческий успех.
8. Обоснована применимость метода Random Forest для прогнозирования коммерческого успеха кинофильмов, и эмпирически показаны его преимущества в предсказании кассовых сборов и рентабельности кинофильмов на тестовой выборке в сравнении с двумя другими методами.
9. Предложен и применен сегментационный подход к диагностике однородности качества предсказания в моделях регрессии и классификации, позволяющий выявить сегменты кинофильмов, различающиеся по качеству предсказания, в т.ч. и сегменты, в которых определенная прогнозная модель недостаточно адекватна данным.
10. Количественно оценена важность каждого предиктора кинотеатральных сборов, и подтвержден значительный вклад детерминант коммерческого
успеха кинофильмов, которые были впервые измерены и использованы автором в качестве объясняющих переменных.
Теоретическая значимость работы заключается в разработке концептуальной модели коммерческого успеха кинофильмов, а также в развитии и расширении методологической базы исследований, направленных на изучение детерминант коммерческого успеха кинофильмов.
Практическая ценность результатов диссертационного исследования обусловлена возможностью их использования для создания систем поддержки принятия решений об инвестициях в новые кинофильмы. Часть разработок, в частности, сегментационный подход к диагностике однородности качества предсказания в моделях регрессии и классификации, могут быть использованы в широком классе экспертных систем. В частности, результаты диссертации были внедрены в деятельность консалтинговой компании ООО «Пальмира Интернешнл» для повышения обоснованности управленческих решений при реализации проектов, связанных с прогнозированием коммерческого успеха новых продуктов до вывода их на рынок, что подтверждается справкой о внедрении. Также результаты исследования могут быть использованы при разработке учебно-методических материалов по курсам, связанным с оценкой инвестиционного потенциала проектов, а также организацией и анализом данных количественных маркетинговых исследований.
Апробация результатов исследования. Результаты исследования прошли апробацию на следующих конференциях и семинарах:
■ Российский экономический конгресс (Москва), декабрь 2009 г.
■ Городской семинар по экономико-математическим методам и моделям (Санкт-Петербургский экономико-математический институт РАН), 19 мая 2010 г.
■ II Всероссийская научная конференция с международным участием «Социально-экономические системы: вопросы развития и управления» (Самара), ноябрь 2010 г.
■ Научный семинар факультета экономики НИУ ВШЭ - Санкт-Петербург, 15 декабря 2010 г.
■ 5-я Ежегодная конференция Европейского университета в Санкт-Петербурге и Санкт-Петербургского экономико-математического института РАН «Современные подходы к исследованию и моделированию в экономике, финансах и бизнесе» (ЕУ СПб и СПб ЭМИ РАН), 15-16 апреля 2011 г.
■ Научная конференция «Инновационная экономика: реалии и перспективы» (НИУ ВШЭ — Санкт-Петербург), 27 сентября 2011 г.
■ Всероссийская конференция «Моделирование в задачах городской и региональной экономики» (ЦЭМИ, ЭМИ РАН, Леонтьевский Центр), 2425 октября 2011 г.
■ IV международная конференция «Государство и бизнес. Вопросы теории и практики: моделирование, менеджмент, финансы» (Санкт-Петербург), 23-25 апреля 2012 г.
Работа, основанная на некоторых результатах, изложенных в диссертации, стала лауреатом конкурса научно-исследовательских работ среди магистрантов НИУ ВШЭ в 2010 году.
Публикации результатов исследования. Важнейщие результаты исследования отражены в 4 научных работах, опубликованных в рекомендованных ВАК РФ журналах, среди которых 3 англоязычные статьи в международных рецензируемых журналах, индексированных в базе SCOPUS, а также в 4 статьях из материалов конференций. Общее количество публикаций по теме диссертации — 8 (общий объем — 4 п.л., вклад автора — 3,4 п.л.).
Структура диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы, включающего 99 источников на русском и английском языках. Общий объём диссертационной работы - 126 страниц. В диссертации содержится 24 таблицы и 8 рисунков.
II. ОСНОВНЫЕ ПОЛОЖЕНИЯ И РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ, ВЫНОСИМЫЕ НА ЗАЩИТУ
1. Разработана концептуальная модель коммерческого успеха кинофильмов, систематизирующая детерминанты спроса на кинокартины и формирующая основу для экономико-математического моделирования коммерческого успеха кинопроектов.
В концептуальной модели, представленной в диссертационном исследовании в графической форме, предполагается, что на успех фильма влияют происхождение сценария и технические особенности фильма, звездность актерского состава и режиссера, бюджет, маркетинговые переменные, содержание и целевая аудитория, а также жанровые особенности фильма. Эти 6 групп факторов делятся на частично или полностью управляемые менеджерами проекта переменные и предопределенные переменные, под которыми подразумевается то, что они предопределены идеей фильма и не могут быть изменены менеджерами проекта. В частности, мы полагаем, что жанр и метод производства предопределены проектом фильма, тогда как на рейтинг ААК, бюджет или силу актерского состава можно повлиять в ходе реализации проекта. В модели учтено возможное влияние художественных особенностей на выбор целевых значений управляемых переменных: например, в случае боевика может не иметь смысла стремиться получить рейтинг G по классификации ААК, так как любители боевиков, скорее всего, посчитают такой фильм неинтересным. В то же время, в случае семейных комедий, вероятно, следует позаботиться о получении фильмом максимально открытого рейтинга.
2. Получена расширенная система факторов, основанная на формализации текстовой информации о причинах присвоения фильму того или иного рейтинга Американской ассоциации кинопроизводителей (ААК), что существенно дополнило перечень объясняющих переменных, используемых в моделировании коммерческого успеха фильмов.
Существующие градации рейтинга ААК позволяют частично учесть
содержание фильма, а также тот факт, что люди по-разному реагируют на разные рейтинги: так, родители вряд ли пойдут с ребенком в кинотеатр на фильм с рейтингом R, в то время как рейтинг G повышает вероятность похода в кинотеатр всей семьей, а значит и кассовые сборы. Однако кинозрители обращают внимание не только на рейтинг, но и на аннотацию к фильму и трейлеры, из которых можно понять, ожидать ли в фильме сцен насилия, секса, ненормативной лексики и т. п. Эта информация может быть извлечена из доступных для большинства фильмов формулировок причины присвоения того или иного рейтинга.
В файл с данными были добавлены 32 бинарные переменных (по количеству слов), принимающих значение 1, если слово присутствует в причине присвоения рейтинга, и 0, если отсутствует. Затем по добавленным переменным был проведен анализ методом главных компонент (метод вращения - варимакс). В результате были получены 12 главных компонент, объясняющих от 4,0% до 6,8% исходной дисперсии. Общая доля объясненной дисперсии составила почти 62%, что можно считать хорошим результатом с учетом того, что число переменных снизилось более чем в 2,5 раза (12 главных компонент по сравнению с 32 исходными переменными). В работе показано, что использование полученной расширенной системы факторов снижает проблему мультиколлинеарности в регрессионном моделировании за счет меньшей корреляции новых переменных с жанром и художественным типом фильмов, при этом сохраняя долю объясняемой дисперсии на том же уровне, что и при использовании рейтингов ААК.
3. Разработан и применен подход к анализу жанровой специализации дистрибьюторов кинопродукции, основанный на количественном анализе соответствий, позволивший сделать обоснованный вывод о наличии у дистрибьюторов сравнительных преимуществ, несмотря на то, что крупные дистрибьюторы берутся за реализацию фильмов разных жанров.
Для ответа на вопрос «Существует ли и, если существует, то какое, соответствие между дистрибьюторами и успехом фильмов разных жанров?» данные были предварительно преобразованы в двухвходовую таблицу частот, отражающую совместное распределение переменных «дистрибьютор», «рентабельность фильма (рентабельный/нерентабельный)» и «художественный тип фильма». В результате анализа соответствий были получены стандартизованные остатки, основанные на сравнении теоретических и наблюдаемых частот. Анализ стандартизованных остатков показал, что на рынке существует достаточно четкая специализация. Так, для 2(fh Century Fox число нерентабельных драм меньше, чем ожидаемое, тогда как дистрибуция успешных комедий и, особенно, боевиков, для этого производителя характерна. С практической точки зрения из характерности определенного жанра следует значимо более высокая доля успешных фильмов этого жанра среди всех фильмов этого жанра, выпущенных данным дистрибьютором. Lionsgate относительно более успешен в выводе фильмов ужасов на рынок (85% фильмов ужасов были успешны). MGM преуспел в дистрибуции рентабельных комедий
(59% комедий успешны) и фильмов ужасов (100% успешны). Для Miramax характерны успешные романтические комедии (73% успешны) и нерентабельные драмы (62% нерентабельны). Для Paramount Pictures — успешные приключенческие фильмы (65% рентабельны). В случае Sony Pictures и Universal использованный нами критерий позволяет сделать вывод лишь о нехарактерности нерентабельных драм (51% и 57% драм рентабельны). Наконец, Walt Disney выводит на рынок как рентабельные, так и нерентабельные приключенческие фильмы (42% нерентабельные, 58% -рентабельные). Нерентабельные драмы для этого дистрибьютора нехарактерны (61% драм рентабельны). Warner Bros, чаще других выпускает успешные приключенческие фильмы (61% успешны) и нерентабельные боевики (39% боевиков нерентабельны). В работе аналогичный анализ проводится также для нахождения соответствий между художественным типом и успехом фильмов разных жанров, между дистрибьюторами и успехом фильмов разных художественных типов, а также между рейтингом ААК и успехом фильмов разных жанров.
4. Предложены методики расчета показателей силы актерского и режиссерского состава фильмов, а также интенсивности конкуренции на рынке в момент выхода фильма в прокат, особенностью которых является опора на объективные количественные данные. Эмпирически подтверждена статистическая значимость этих объясняющих переменных.
Предлагается измерять ценность актеров и режиссеров на основе их известности аудитории, которая, в свою очередь, пропорциональна дисконтированным кинотеатральным сборам кинофильмов, в которых эти актеры и режиссеры были задействованы ранее. Мы предлагаем рассчитывать взвешенные кумулятивные скорректированные на инфляцию кассовые сборы для различных значений дисконтирующего множителя (Sstar для актеров и Sd,rector для режиссеров). Приведем формулу для расчета данного показателя применительно к задаче оценки силы актера, находящегося в строке i (actor,) в таблице, предварительно отсортированной по имени актера и - для каждого актера - по дате выхода фильма в прокат (от ранней к поздней):
{szr'~year"' (IAR,, + WCIAK'°:), если actor = actor,, WCIAR*'ar=\ 5"'r V "' ' ' ", (1)
[О, если actor, Ф actor,
где WCIAR — взвешенные кумулятивные кассовые сборы, скорректированные на инфляцию (weighted cumulative inflation-adjusted revenue);
IAR — кассовые сборы, скорректированные на инфляцию (inflation-adjusted revenue).
Ценность режиссера фильма рассчитывается по тому же принципу, что и ценность актера:
(gyear.-year,., t IAR , WCIAR'1'"'""), если director = director . WCIAR r = i "r V 1-1 1-1 ' (2)
[0, если director, ^ director,
Для расчета «звездности» актерского состава фильма {^¡агро\\'ег), аналитику следует сложить все показатели \VCIAR, соответствующие данному фильму. В случае расчета ценности режиссера фильма (сИгес/огрои<ег) следует найти максимальный 1¥С1АЯ, соответствующий кинофильму. Например, если фильм был снят двумя режиссерами, учитывается только тот режиссер, чьи предыдущие фильмы собрали в прокате больше денег. По результатам регрессионного анализа была эмпирически подтверждена статистическая значимость этих объясняющих переменных на 1% {¿Ьагроууег) и 10% ((ИгесШгракег) уровнях значимости.
Предложенная в работе мера интенсивности конкуренции (количество фильмов, вышедших в прокат за 2 недели до и 2 недели после выхода рассматриваемого фильма в прокат) также оказалась статистически значимой на 1% уровне значимости.
5. Проведена кластеризация рынка кинофильмов, позволившая выделить 7 крупных групп кинопроектов, между которыми доля рентабельных фильмов существенно варьируется. Кластеризация подтверждает гипотезу о различиях вероятности успеха кинофильмов в разных сегментах кинорынка.
Перед построением объясняющих моделей для лучшего понимания имеющихся закономерностей была проведена кластеризация кинофильмов, позволившая выделить сегменты, максимально различающиеся по доле рентабельных фильмов. Для решения этой задачи был использован алгоритм СНАШ (автоматическое обнаружение взаимосвязей на основе критерия хи-квадрат), на каждом шаге выбирающий переменную, которая позволяет разбить выборку на максимально различающиеся по значению зависимой переменной группы. Зависимой переменной в нашем анализе выступила рентабельность кинофильма, определяемая как не менее чем двукратное превышение кассовых сборов в США над производственным бюджетом фильма. Выяснилось, что в 7 крупных сегментах доля рентабельных кинофильмов варьируется от 7,9% до 46,4%. Таким образом, у инвестора может существовать возможность отсечь сегменты, в которых успех наименее вероятен, и вложить деньги в более привлекательные сегменты. Сегменты различаются жанром, бюджетом, силой актерского состава, а также типом фильма (игровой/неигровой), что указывает на высокую классифицирующую способность этих переменных. Достаточно большой размер каждого сегмента говорит о наличии ряда фундаментальных факторов, ограничивающих переток капитала из одного сегмента в другой.
6. Выявлены на основе робастной регрессионной модели устойчивые статистически значимые закономерности, описывающие характер влняния атрибутов кинофильмов на их кассовые сборы.
Для оценки влияния характеристик фильма на его кассовые сборы был использован робастный регрессионный анализ, так как на рынке кинофильмов встречаются наблюдения, которые можно отнести к выбросам, однако с экономической точки зрения не все из них следует удалять — многим уместнее
просто придать меньший вес. Эластичность кассовых сборов по бюджету составила 0,126, что заметно ниже оценок, полученных всеми другими авторами и любых других известных нам оценок, полученных ранее. Мы связываем это с переоценкой другими авторами эластичности спроса по производственному бюджету, вызванной смещением из-за пропуска таких регрессоров, как количество кинотеатров, в которых фильм был показан в первую неделю показа, и переменных, отражающих содержание фильма. В нашей регрессии эти переменные включены в состав объясняющих переменных, тогда как в других исследованиях использовался менее полный набор объясняющих переменных. Каждый фильм-конкурент, вышедший за 2 недели до или после релиза рассматриваемого фильма, отбирает примерно 1,3% его кассовых сборов. Наиболее выигрышный метод производства - сочетание актерской игры и анимации. Нарисованные от руки мультфильмы собирают, при прочих равных условиях, на 38% меньше, а игровые фильмы - на 28% меньше. Среди жанров повышенными кассовыми сборами выделяются драмы и комедии, тогда как остальные жанры незначимо отличаются от боевиков, взятых за эталонную категорию. Выход фильма в последние 8 недель года приносит дополнительные кассовые сборы (примерно 28%), что можно связать с праздничным сезоном, который начинается в США со Дня Благодарения и длится до конца года. Наконец, каждый дополнительный кинотеатр в первую неделю проката приносит прирост в размере 0,01% к итоговым кассовым сборам в США и Канаде. Рост дисконтированной суммарной выручки от предыдущих фильмов с участием актера (в главной роли) или режиссера на 100 млн. долларов повышает кассовые сборы фильма примерно на 0,014%.
7. Разработана модель кассовых сборов, в которой впервые учтена неоднородность предельных эффектов характеристик кинофильмов в зависимости от сегмента, к которому относится фильм.
Мы построили двухкомпонентную регрессионную модель кассовых сборов первой недели проката, которая по статистическим критериям заметно превзошла однокомпонентную. Между величинами и значимостями оценок параметров в двух латентных классах наблюдаются существенные различия. Это указывает на то, что рынок кинофильмов образован двумя достаточно непохожими друг на друга группами фильмов. Примерно 24% принадлежат первой группе. Их эластичность кассовых сборов по производственному бюджету выше средней, наличие грубости, насилия и других несвойственных для детско-юношеского кино элементов незначимо влияет на кассовые сборы (кроме, быть может, грубого юмора, которого фильмам из первого сегмента следует все же избегать). Фильмы этой категории нечувствительны к выходу одновременно с ними других фильмов, но не следует выпускать их в прокат в последние недели года. Сила актеров или режиссера не играет роли для таких фильмов. Успех таких фильмов сильнее, чем успех второй группы фильмов, зависит от количества кинотеатров, в которых покажут фильм в первую неделю проката. Можно предположить, что всем указанным особенностям удовлетворяют, например, фильмы ужасов и боевики.
Остальные 76% фильмов имеют низкую эластичность спроса по бюджету, их кассовые сборы снижаются в случае присутствия грубого юмора, наличия в кадре обнаженных тел и обилия крови, а также ненормативной лексики. Эти фильмы испытывают более сильные потери в случае выхода других фильмов в то же время. Сила актерского состава и режиссера в успехе таких фильмов играет существенную роль.
Получив апостериорные вероятности принадлежности каждого фильма к первому латентному сегменту, мы оценили регрессию данной вероятности на художественные и технические характеристики фильма. По результатам оценки этой взаимосвязи выяснилось, что маловероятно попадание в первый сегмент драм, комедий, романтических комедий и исторических художественных фильмов. Попадание боевиков, напротив, наиболее вероятно. Если в основе сюжета лежат реальные события, это повышает шансы фильма на попадание в первый сегмент. Модель, объясняющая апостериорную вероятность принадлежности к первому классу, обладает невысокой объясняющей способностью (R2=0,04), но значимость модели не вызывает сомнений (F(14, 1624)=4,86, p-value<0,001). Таким образом, наше предположение о модерирующем эффекте художественных особенностей фильма нашло подтверждение. Невысокий коэффициент детерминации мы связываем со сложной природой сегментированности рынка, требующей дополнительного изучения для создания более точных прогнозных моделей.
8. Обоснована применимость метода Random Forest для прогнозирования коммерческого успеха кинофильмов, и эмпирически показаны его преимущества в предсказании кассовых сборов и рентабельности кинофильмов на тестовой выборке в сравнении с двумя другими методами.
Принимая во внимание особенности данных о кинорынке, был сформулирован ряд требования к прогнозным моделям коммерческого успеха. Метод Random Forest удовлетворяет всем требованиям, что является теоретическим обоснованием его применимости. По результатам сравнительного анализа трех методов прогнозирования кассовых сборов (Random Forest, пошаговая линейная регрессия и многослойный перцептрон), Random Forest оказался лучшим по критерию средней симметричной процентной ошибки как на обучающей, так и на тестовой выборке. Этот же метод имеет минимальное стандартное отклонение и 95-ю персентиль ошибки.
По результатам сравнительного анализа трех методов классификации фильмов на рентабельные и нерентабельные (Random Forest, пошаговая логистическая регрессия и многослойный перцептрон), лучшим методом по всем показателям на тестовой выборке стал Random Forest. Он обеспечил наибольшую долю верно классифицированных фильмов (83,3% на тестовой выборке). Причем, если модель предсказывала успех фильма, он с вероятностью 85,7% действительно оказывался успешен.
9. Предложен и применен сегментационный подход к диагностике однородности качества предсказания в моделях регрессии и классификации, позволяющий выявить сегменты кинофильмов, различающиеся по качеству предсказания, в т.ч. и сегменты, в которых определенная прогнозная модель недостаточно адекватна данным.
Помимо средних показателей точности предсказания очень важна, особенно в рассматриваемой нами предметной области, однородность точности оценки. Если существуют сегменты объектов, для которых модель систематически завышает или занижает предсказанное значение, такую модель нельзя признать удовлетворительной. Для проблемных сегментов разумно дополнять автоматическую классификацию кинопроектов экспертными оценками, более тщательным анализом кинофильма или просто использовать экспертную систему только для предсказания успеха фильмов из наиболее надежных сегментов.
Бинарные классификаторы используют набор объясняющих переменных, чтобы предсказать класс, к которому принадлежит каждое наблюдение. Пусть Х{,...,ХМ - это объясняющие переменные, включенные в модель классификации; У, - наблюдаемый класс, к которому принадлежит наблюдение / (0 или 1); Г, — предсказанный класс для данного наблюдения. Тогда переменная С, отражает, верно ли было классифицировано наблюдение:
Для выявления сегментов с высокой и низкой ошибкой предсказания для задачи классификации с обучением:
1. На обучающей выборке строится дерево классификации с использованием алгоритма СНАШ, в котором С, является зависимой переменной и Хх,...,Хм— объясняющие переменные. Выбирается уровень значимости, который считаем подходящим. Вершины дерева показывают сегменты, которые различаются долей верно классифицированных наблюдений. Если в дереве нет разбиений, то точность классификации, скорее всего, является однородной во всех сегментах наблюдений.
2. Если выявленные сегменты значимо различаются по уровню точности классификации (и со статистической, и с практической точек зрения), разбиваем набор данных на несколько достаточно крупных непересекающихся поднаборов в соответствии с информацией, полученной из вышеупомянутого дерева классификации.
Методика переносится на случай задачи регрессии, однако в качестве зависимой переменной на первом шаге используется абсолютная процентная ошибка предсказания.
(3)
10. Количественно оценена важность каждого предиктора кинотеатральных сборов, и подтвержден значительный вклад
детерминант коммерческого успеха кинофильмов, которые были впервые измерены и использованы автором в качестве объясняющих переменных.
Во время построения каждого дерева в алгоритме Random Forest после каждого разбиения рассчитывается прирост объясненной суммы квадратов, полученный благодаря переменной, по которой это разбиение было произведено (ДRSSi). Усреднив приросты объясняющей способности модели по всем деревьям ансамбля для соответствующей переменной, получаем меру ее важности ДRSSi. Процентный вклад /'-й переменной (percentage_contribution{), был рассчитан следующим образом:
AR S S
percentage_contributionl = —-'■—100% (4)
ЁЩ
у=1
Для оценки вклада каждой объясняющей переменной в предсказание кассовых сборов мы применили метод Random Forest ко всей имеющейся у нас выборке кинофильмов. Разделив переменные на 3 группы на основе уникальности их для литературы по предсказанию кассовых сборов, мы оценили вклад каждой группы переменных в объяснение кассовых сборов. Вклад типичных для моделей кассовых сборов регрессоров составил 34,7%, вклад уникальных данных, собираемых компанией Nash Information Services, LLC, не использовавшихся в исследованиях других авторов, составил 21,4%, тогда как вклад впервые рассчитанных и использованных автором в качестве регрессоров переменных - 43,9%. Анализ важности предикторов подтвердил значительный вклад детерминант коммерческого успеха кинофильмов, которые были впервые измерены и использованы автором в качестве объясняющих переменных.
III. ВЫВОДЫ И РЕКОМЕНДАЦИИ (ЗАКЛЮЧЕНИЕ)
В процессе проведения исследования разработаны методики, подходы и модели, позволившие повысить обоснованность принятия решений в кинопроизводстве за счет эффективного использования количественных данных о характеристиках кинопроектов. Результаты нашли практическое применение в деятельности консалтинговой компании.
В работе предложены новые показатели, объясняющие коммерческий успех кинофильмов: сила актерского состава, сила режиссера и интенсивность конкуренции в момент выхода фильма в прокат. В отличие от других исследователей мы отказались от экспертных оценок в пользу объективных и воспроизводимых количественных показателей.
Сегментация рынка кинофильмов по рентабельности показала существование различающихся по рентабельности крупных сегментов, в которых вероятность успеха варьируется от 7,9% до 46,4%. Мы объясняем этот результат низкой мобильностью режиссеров между жанрами; наличием у дистрибьюторов определенной специализации и устоявшихся предпочтений; технологическими ограничениями на производство отдельных категорий фильмов; наличием спроса на разные фильмы среди населения в сочетании с
ограниченной платежеспособностью и наличием целевой частоты посещения кинотеатров; сохранением главенствующей роли интуиции предпринимателей и инвесторов относительно факторов успеха кинофильма и критериев успеха, а не формальных моделей коммерческого успеха.
Оригинальное приложение анализа соответствий к данным кинорынка позволило выяснить, для каких сочетаний «дистрибьютор-жанр», «дистрибьютор-художественный тип», «художественный тип-жанр» и «жанр-рейтинг ААК» более характерен коммерческий успех, а для каких - напротив, выше среднего вероятность нерентабельности. Данный подход можно использовать, среди прочего, для выявления жанровой специализации дистрибьюторов, которая неочевидна в связи с тем, что большинство дистрибьюторов берется за реализацию самых разнообразных фильмов.
В работе проведена формализация содержания кинофильмов с учетом текстовой информации, позволившая обогатить набор данных более детальной информацией о содержании фильма и решить проблему коррелированное™ рейтингов американской киноассоциации с жанрами и художественными типами.
Построение робастных регрессий позволило получить эмпирические факты, характеризующие наблюдавшиеся на американском кинорынке в 19992012 гг. закономерности. С помощью модели кассовых сборов, учитывающей наличие латентных классов, удалось в значительной мере объяснить различия в результатах, получаемых разными авторами. Выяснилось, что в двух латентных классах, принадлежность к которым частично объясняется художественными характеристикам фильмов, наблюдаются разные значения параметров нормальной регрессионной модели, что с экономической точки зрения означает существование двух принципиально разных типов стратегии управления кинопроектом.
Сравнительный анализ нескольких методов регрессии и классификации применительно к раннему прогнозированию коммерческого успеха кинофильмов подтвердил превосходство впервые примененного к задаче прогнозирования кассовых сборов и рентабельности кинофильмов алгоритма Random Forest над двумя другими методами, использовавшимися в литературе ранее.
Предложенный в работе сегментационный подход к диагностике однородности качества предсказания в моделях регрессии и классификации позволил выявить сегменты кинофильмов, кассовые сборы в которых труднопредсказуемы на основе свободно доступной информации. Данный диагностический подход может применяться в широком классе систем поддержки принятия решений для выявления границ их применимости.
Оценка вкладов отдельных переменных в предсказание кассовых сборов показала, что предложенные нами оригинальные показатели силы актерского состава и режиссеров, интенсивности конкуренции, а также факторы, основанные на причине присвоения рейтинга ААК и характеризующие содержание фильма, в сумме вносят почти 44% вклад в предсказание кассовых
сборов и являются, таким образом, практически полезными для моделирования
кассовых сборов.
IV. ОСНОВНЫЕ НАУЧНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИОННОГО ИССЛЕДОВАНИЯ
1. Антипов Е.А. Регрессионный анализ кассовых сборов кинофильмов с учетом эффектов модерации / Е.А. Антипов // Известия Санкт-Петербургского государственного экономического университета. - 2014. - № 2. - С. 89-92. - 0,3 п.л.
2. Antipov Е. Applying CHAID for logistic regression diagnostics and classification accuracy improvement / E. Antipov, E. Pokryshevskaya // Journal of Targeting, Measurement and Analysis for Marketing. - 2010. - № 18. - C. 109-117. - 0,6 п.л./0,4 пл.
3. Antipov Е.А. Accounting for latent classes in movie box office modeling / E. Antipov, E. Pokryshevskaya // Journal of Targeting, Measurement and Analysis for Marketing. - 2011. - № 19. - C. 3-10. - 0,7 п.л./0,5 п.л.
4. Antipov Е.А. Mass appraisal of residential apartments: An application of Random forest for valuation and a CART-based approach for model diagnostics / E. Antipov, E. Pokryshevskaya // Expert Systems with Applications. - 2012. - № 39. - C. 1772-1778. -1,0 п.л./0,8 п.л.
5. Антипов Е.А. Использование общедоступной текстовой информации при моделировании коммерческого успеха кинофильмов // Моделирование в задачах городской и региональной экономики: Материалы Всероссийской конференции, посвященной 75-летию со дня рождения первого директора СПб ЭМИ РАН, заместителя председателя Президиума СПб НЦ РАН, профессора Бориса Львовича Овсиевича 24-25 октября 2011 года / Е.А. Антилов. — СПб.: Нестор-История, 2011. - С. 14-17. — 0,2 п.л.
6. Антипов Е.А. Построение и диагностика прогнозных моделей коммерческого успеха кинофильмов // Современные подходы к исследованию и моделированию в экономике, финансах и бизнесе: Материалы 5-й Ежегодной конференции Европейского университета в Санкт-Петербурге и Санкт-Петербургского экономико-математического института РАН Вып. 5. / Е.А. Антипов. - СПб.: Европейский университет в Санкт-Петербурге, 2011. - С. 14-15. - 0,2 п.л.
7. Антипов Е.А. Формализация содержания кинофильмов с использованием текстовой информации // Государство и бизнес. Вопросы теории и практики: моделирование, менеджмент, финансы: тезисы докладов IV Международной конференции. Санкт-Петербург, 23-25 апреля 2012 г. / Е.А. Антипов. - СПб.: Издательство СЗИ РАНХиГС, 2012. - С. 35-37. - 0,4 п.л.
8. Антипов Е.А. Американский кинопрокат в 2000-2010 годах: эмпирические факты и «парадокс фильмов ужасов» // Инновационная экономика: реалии и перспективы: научная конференция, Санкт-Петербург, 27 сентября 2011 г. / Е.А. Антипов. - СПб.: Отдел оперативной полиграфии НИУ ВШЭ - Санкт-Петербург, 2012. - С. 139-146. - 0,6 пл.
Подписано в печать 29.01.2015 Формат 60x84 7i6 Цифровая Печ. л. 1.0 Тираж 100 Заказ № 24/01 печать
Типография «Фалкон Принт» (197101, г. Санкт-Петербург, ул. Большая Пушкарская, д. 54, офис 2)