Модели и методы комбинированного прогнозирования спроса на продукцию фирмы тема диссертации по экономике, полный текст автореферата
- Ученая степень
- кандидата экономических наук
- Автор
- Давыденко, Андрей Владимирович
- Место защиты
- Санкт-Петербург
- Год
- 2008
- Шифр ВАК РФ
- 08.00.13
Автореферат диссертации по теме "Модели и методы комбинированного прогнозирования спроса на продукцию фирмы"
08-3 4160
На правах рукописи
Давыденко Андрей Владимирович
МОДЕЛИ И МЕТОДЫ КОМБИНИРОВАННОГО ПРОГНОЗИРОВАНИЯ СПРОСА НА ПРОДУКЦИЮ ФИРМЫ
Специальность 08.00.13 - Математические и инструментальные методы
экономики
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата экономических наук
Санкт-Петербург - 2008
Работа выполнена в Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет экономики и финансов».
Научный руководитель - кандидат технических наук, профессор
Иванов Евгений Евгеньевич
Официальные оппоненты:доктор экономических наук, профессор
Давние Валерий Владимирович
кандидат экономических наук Вохидов Рашид Содикович
Ведущая организация - Федеральное государственное образовательное учреждение высшего профессионального образования «Санкт-Петербургский государственный университет».
Защита состоится «_»_2008 г. в « » часов на
заседании диссертационного совета Д 212.237.03 при Государственном образовательном учреждении высшего профессионального образования «Санкт-Петербургский государственный университет экономики и финансов» по адресу: 191023, Санкт-Петербург, ул. Садовая 21, ауд._.
С диссертацией можно ознакомиться в библиотеке Государственного образовательного учреждения высшего профессионального образования «Санкт-Петербургский государственный университет экономики и финансов».
Автореферат разослан «_»_2008г.
Учёный секретарь диссертационного совета
Завгородняя А.В.
1. ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Применяемые в настоящее время системы прогнозирования спроса не удовлетворяют предъявляемым требованиям по точности и надежности прогнозов, вследствие чего компании-производители и поставщики товаров массового спроса несут значительные убытки и теряют свои позиции на рынках. Анализ источников возникающих прогнозных ошибок позволил установить, что основными причинами неэффективной работы систем прогнозирования спроса являются несовершенство алгоритмов прогнозирования, основывавшихся лишь на статистических данных и невозможность учета воздействия ряда экзогенных конъюнктурообразующих факторов спроса, имманентно присущих рыночной экономике. Чтобы компенсировать ошибки в системах прогнозирования, базирующихся на экстраполяционных методах обработки предшествующих данных спроса, приходится прибегать к различным способам учета мнений экспертов. При этом процесс комбинирования не основывается на математических методах оптимизации качества комбинированного прогноза, либо использует их редуцированные формы в виде простейших процедур осреднения или внесения коррекционных процентных поправок. Создавшаяся ситуация характеризуется противоречием между применением дорогостоящих систем прогнозирования, реализующим сложные статистические методы для получения эсктраполяционного прогноза и эвристическими методами комбинирования, не опирающимися на адекватные математические модели и в результате приводящие к решениям, зачастую далеким от оптимальных. В итоге обнаруживается насущная необходимость снабдить экономиста-аналитика удобным и эффективным математическим и программным инструментарием, позволяющим на основе обработки данных предшествующих периодов и имеющихся в его распоряжении априорных сведений реализовать максимально обоснованные алгоритмы комбинирования. Таким образом, актуальность темы исследования обусловлена острой практической востребованностью эффективного математического инструментария для решения задачи комбинирования разнородных прогнозов с целью повышения достоверности прогнозирования спроса.
Вопрос о том, как наилучшим способом обработать совокупность имеющихся статистических и экспертных данных, чтобы сделать максимально обоснованные прогнозы, является предметом интенсивного исследования в последнее время. Существенный вклад в развитие теоретических основ построения методов комбинирования прогнозов внесли отечественные ученые Головченко В.Б., Крянев A.B., Лукашин А.П., Давние В.В. и др. Постоянно возрастает количество публикаций, свидетельствующих о многочисленных исследованиях данной проблемы за рубежом.
Со времени, когда основополагающую работу по комбинированию прогнозов опубликовали J.M. Bates и C.W.J. Granger, вопросы развития методов комбинирования и анализа эффективности их применения исследовались многими ведущими экономистами, в числе которых J.S.Armstrong, R.T. Clemen, F.X.Diebold, R. Fildes, P. Goodwin, P.Newbold и др. Однако, в связи со сложностью проблемы и многообразием путей ее решения, эти исследования нельзя считать завершенными. Значительные трудности применения традиционных методов комбинирования и реализующих их процедур оптимизации обусловлены особенностью динамики спроса, как объекта прогнозирования.
Объект исследования. Совместная обработка экспертных и фактографических данных для прогнозирования спроса на товары массового производства.
Предмет исследования. Оптимизация алгоритмов функционирования комбинированных предикторов для прогнозирования спроса на основе применения наиболее адекватных математических моделей и методов.
Целью работы является изыскание путей повышения достоверности результатов прогнозирования спроса на продукцию фирмы в результате применения адекватных характеру априорной информации оптимальных математических процедур обработки разнородных данных, поступающих от различных источников.
Для достижения указанной цели были решены следующие задачи.
1. Обоснование наиболее целесообразных методов объединения разнородных данных и построения комбинированных предикторов для прогнозирования спроса на потребительские товары.
2. Развитие и усовершенствование традиционных методов комбинирования на основе учета особенностей характера изменения спроса.
3. Разработка решений по построению математических моделей для объединения разнородной информации в единой модели.
4. Отыскание наиболее эффективных математических методов и процедур для вычисления оптимальных значений комбинированных прогнозов применительно к имеющимся наборам данных.
5. Разработка алгоритмических схем, позволяющих выполнить программную реализацию предложенных методов.'
6. Исследование работоспособности комбинированных предикторов и оценка достигаемого положительного эффекта за счет внедрения разработанных алгоритмов на основе результатов моделирования.
Методы исследований. Для решения поставленных задач используются методы экстраполяции временных рядов, математической статистики, корреляционно-регрессионного анализа, оптимальной линейной фильтрации, имитационного моделирования.
Достоверность и обоснованность диссертации. Работа базировалась на законах и положениях фундаментальных наук и методах исследования, адекватных её предмету, цели и задачам. Достоверность обеспечивалась опорой и на теоретические положения, получившие развитие и обоснование в трудах по теории стохастической фильтрации, регрессионного анализа, методов оптимизации. Выводы и рекомендации по всем разделам органически вытекают из материалов теоретических исследований и результатов моделирования. Проведенный анализ с использованием реальных данных и прогнозов подтвердил правильность теоретических выводов. Достоверность полученных в диссертации решений и выводов подтверждена также сопоставлением результатов моделирования работы алгоритмов комбинирования прогнозов с аналогичной информацией из научной литературы и данных других источников.
На защиту выносятся следующие результаты выполненных автором научных исследований
1. Обобщенная комбинированная экспертно-статистическая прогнозная модель спроса, позволяющая использовать адекватные виды стохастических процессов для описания прогнозируемых временных рядов и учитывать при этом экспертную информацию в форме точечных или интервальных прогнозов.
2. Спецификация составляющих компонентов обобщенной модели по результатам исследования рядов спроса на различные виды товаров.
3. Алгоритмы прогнозирования, базирующиеся на применении байесовского подхода к нахождению оптимальных оценок с использованием методологии марковских цепей Монте-Карло (МСМС) для численного оценивания значений прогнозной функций плотности распределения вероятностей (ФПВ) в соответствии с предложенными спецификациями моделей.
4. Модификации метода непосредственного обращения выборочной ковариационной матрицы невязок за счет компенсации систематических ошибок вследствие смещенности прогнозных оценок.
5. Адаптивный алгоритм предсказания вектора весовых коэффициентов (ВВК) в линейной свертке прогнозов на основе метода оптимальной линейной фильтрации.
6. Адаптивный рекуррентный алгоритм оценивания параметра регуляризации методом невязок.
7. Усовершенствованный алгоритм оптимального линейного предсказания ВВК путем параметрической идентификации элементов переходной матрицы состояния методом расширения вектора состояния.
Вклад автора в исследование проблемы. Теоретические и методологические положения, выводы и практические рекомендации, содержащиеся в диссертации, являются результатом самостоятельного исследования автора.
Научную новизну представляет совершенствование математического аппарата комбинирования данных в системах прогнозирования спроса на потребительские товары с учетом реальных условий функционирования фирмы, в том числе:
1. Адаптация комбинированной экспертно-статистической прогнозной модели на классы нелинейных и стохастических функций, позволяющих адекватным способом выполнять аппроксимацию трендовой составляющей при моделировании динамики изменения спроса.
2. Оценка прогнозных значений спроса на основе методологии баей-совского подхода в соответствии с предложенными спецификациями комбинированных моделей.
3. Алгоритмы вычисления прогнозной функции плотности вероятности (ФПВ) на основе использования методов марковских цепей Монте-Карло (МСМС) применительно к моделям комбинирования разнородных данных.
4. Модели на основе метода переменных состояния для синтеза предикторов в виде весовых сумматоров, позволяющих находить решения задач динамической оптимизации вектора весовых коэффициентов (ВВК).
Теоретическая и практическая значимость. Полученные в работе теоретические результаты позволяют определить приоритетные пути совершенствования технологии комбинированного прогнозирования для решения задачи повышения качества прогнозирования спроса на товары и услуги в рыночных условиях работы фирмы (предприятия) и снабдить исследователя математическим и программным инструментарием для комбинирования альтернативных прогнозов.
Внедрение разработанных алгоритмов позволило повысить качество прогнозов, что, в свою очередь, дало возможность сократить убытки от ошибок в определении объемов партий товаров и оптимизировать нагрузку на элементы торговой сети.
Результаты работы в виде алгоритмов комбинированного прогнозирования и соответствующих программных модулей внедрены в составе ПО автоматизированных систем прогнозирования спроса в ЗАО «Ниен-шанц», Группе Компаний «Элтис», ЗАО «НПК Руспромремонт», ООО «НПК ВЭТО», что подтверждено соответствующими актами. В ходе эксплуатации автоматизированных систем прогнозирования спроса были получены положительные результаты, свидетельствующие о целесообразности использования разработанных алгоритмов комбинирования для повышения достоверности прогнозов спроса на поставляемые товары.
Апробация работы н публикации. По теме диссертации опубликовано 13 печатных трудов объемом 2,2 п.л.
Основные результаты работы докладывались на научно-практических международных конференциях и симпозиумах [3, 4, 5, 6, 9, 10, 11, 13] и опубликованы в статьях [1, 2, 7, 8, 12].
Структура н объем диссертации. Диссертация состоит из введения, трех разделов и заключения. Общий объем диссертации составляет 153 машинописных листа, включая 18 рисунков, 12 таблиц. Библиография содержит 135 источников информации.
2. КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ. ОСНОВНЫЕ ИДЕИ И ВЫВОДЫ ДИССЕРТАЦИИ
Во введении определен объект исследования, обоснована актуальность проблемы, ее состояние в настоящее время, существующие подходы в разрешении проблемы, изложены суть поставленной научной задачи, цель собственного исследования, направления и методы решения, содержание работы по главам.
В первой главе рассматриваются методологические аспекты применения математических методов оптимизации в задачах синтеза алгоритмов комбинирования прогнозов.
Приводится используемая в работе терминология и необходимые определения. Под прогнозированием в дальнейшем понимается предсказание значения случайного процесса (в данном случае спроса) в некоторый будущий момент времени по наблюдённым значениям суммы прогнозируемого процесса с искажающими наблюдения случайными помехами (шумом) и статистически связанными с ним процессам в прошлом и настоящем. Предполагается, что для решения поставленных задач в распоряжении аналитика имеется совокупность данных - сведений, представленных в форме, пригодной для постоянного хранения, передачи и обработки. Это фактографические данные в виде баз или массивов, полу-
ченных путем наблюдений и вычислений, а также экспертные данные, полученные путем опроса специалистов. Обработка данных - процесс выполнения последовательности операций над данными, приводящий к поставленной цели в соответствии с заданным алгоритмом. Алгоритм является формой решения любой экономико-математической задачи и представляет собой точное предписание относительно последовательности действий (шагов), преобразующих исходные данные в искомый результат. Под синтезом алгоритма понимается определение его оптимальной (или близкой к ней) структуры, доставляющей экстремум заданному критерию качества.
Оптимальное экстраполяционное прогнозирование обычно основывается на методах нахождения функции от данных наблюдений такой, что для неё средний квадрат её отклонения от данных наблюдений меньше, чем для всех других функций. Экспертная оценка основана на субъективном представлении эксперта о возможном развитии прогнозируемого процесса. Вместе с тем, она учитывает многие факторы, если и неподдающиеся непосредственному измерению и формализации, то допускающие объективную интерпретацию в рамках научного обоснования эксперта Поэтому организацию и статистический анализ экспертных оценок обычно включают в состав математического инструментария прогнозирования.
Фундаментальным в задаче прогнозирования является понятие «адаптивный предиктор». Предиктором называется любая вычислительная схема, которая позволяет в соответствии с заданным алгоритмом по значениям входных данных получать значения выходных, значения которых принимаются в качестве прогнозов. Кроме входных данных, для расчетов прогнозов также используются настроечные коэффициенты (параметры алгоритма), которые могут изменяться с помощью некоторой процедуры. При решении задачи прогнозирования временного ряда адаптивным предиктором активно применяется процедура настройки или обучения. Цель настройки заключается в подборе таких значений настроечных коэффициентов предиктора, которые позволили бы оптимизировать его свойства (в смысле некоторого заданного критерия). Существенным для определения адаптивности в применяемом здесь смысле является наличие цикла обратной связи между средой и поведением прогнозной системы, которая позволяет системе путем анализа получаемых результатов принимать решения относительно своего поведения. Под комбинированием частных (сингулярных) прогнозов, полученных, с помощью п предикторов-индивидуумов, будем понимать процесс нахождения оптимального в некотором смысле прогноза V, являющегося функцией всей совокупности имеющихся к настоящему времени прогнозов Х1,Х2,...,ХП, а также наблюденных фактических значений О прогнозируемого показателя:
У = Л(Х1>Х2,..,Хп>0). (1)
Такой прогноз далее называется комбинированным прогнозом. Коллектив предикторов организуется так, чтобы надежность комбинированных прогнозов была выше надежности лучшего из предикторов-индивидуумов - членов коллектива. Это достигается тем, что, во-первых, для элиминации мультиколлинеарности факторов и не поддающихся содержательной экономической интерпретации прогнозных данных в коллектив включаются самые "лучшие" и самые "непохожие" между собой предикторы-индивидуумы, являющиеся носителями нетривиальных тенденций прогнозируемого процесса, во-вторых, при построении комбинированных прогнозов экстремум показателей качества ищется не только по параметрам отдельного предиктора и не только путем выбора лучшего среди заданного набора отдельных предикторов, но и по всевозможным их суперпозициям. Выявлены особенности прогнозирования спроса на продукцию фирмы, определяющие концепцию прогнозно-аналитических технологий. Основными из них являются:
-выраженная чувствительность спроса к колебаниям большого числа разнообразны факторов с весьма сложными и взаимообусловленными механизмами влияния, для которых построение регрессионных моделей в крайне затруднено,
-достаточно быстрые (относительно скорости изменения прогнозируемых параметров спроса) изменения во времени параметров аппроксимирующих математических моделей,
- зашумленность и неполнота данных,
-старение исходной для комбинированного прогнозирования информации из-за изменений конъюнктуры рынков и фаз жизненного цикла товаров, приводящих к невозможности использования большого периода основания прогноза.
На основании проведенного анализа делается вывод о необходимости комбинирования экстраполяционных и экспертных прогнозов, подтверждаемой многочисленными сведениями о практике деятельности ряда ведущих фирм.
Обоснованы принципы построения и функционирования автоматизированной системы комбинирования прогнозов:
-концепция наиболее полного использования всех типов имеющейся априорной информации, включая фактографические и экспертные данные,
- интерактивный режим работы системы,
-конкурирование комбинированных прогнозов, для чего в составе математического обеспечения целесообразно иметь набор предикторов с возможностью сопоставления результатов в соответствии с выбранным критерием качества прогнозирования. Для оценки аппроксимирующей
способности моделей применен метод инверсной верификации путем ретроспективного прогнозирования, в рамках которого правильность прогнозной модели проверяется ее способностью воспроизводить фактические данные в прошлом.
Определены направления реализации адаптивной комбинированной обработки разнородных прогнозных данных. Проведенный анализ позволил выделить два основных подхода к синтезу алгоритмов комбинирования методов прогнозирования, которые могут быть применены в данном случае: построение агрегированной вероятностно-статистической модели и комбинирование на основе весового сложения альтернативных прогнозов.
Приводится критический систематизированный обзор научной литературы по отечественным и зарубежным источникам информации за последние десятилетия, которые прямо и непосредственно относятся к теме диссертации и отражают состояние и оценку достигнутых результатов другими исследователями в рамках обоих из указанных подходов.
Сформулированы вопросы, составляющие предмет исследования в последующих разделах.
Во второй главе рассматриваются вопросы построения комбинированных прогнозных моделей спроса и соответствующих алгоритмов прогнозирования, основанных на использовании объединенного экспертно-статистического массива данных.
Предложенная модель объединения данных имеет следующий общий вид.
Пусть известны наблюденные значения спроса х, для интервалов времени г = 1 Фактографические данные представляются в виде совокупности точек х = (хь х2,..., х„); х/= (*,, /',), /=1 где (', - временные периоды, - фактические значения показателя.
Кроме того, в распоряжении имеется экспертная информация, задаваемая,в виде совокупности точек у = (уь у2, ..., у/), у; = (/';,у} ),./=1,.../, где - временные интервалы, для которых делаются экспертные оценки, У] - экспертные оценки значений суммарной регулярной составляющей анализируемого ряда динамики для интервала С).
Предполагается, что фактические значения х, представляют собой временной ряд, генерируемый стохастическим процессом, который может быть в общем виде описан с помощью разложения на суммарную регулярную составляющую и случайную компоненту. Экспертные прогнозы у) рассматриваются как оценки регулярной составляющей ряда с соответствующей последовательностью ошибок. Исходя из этих соображений система регрессионных уравнений, соответствующая совокупности имеющихся исходных данных, может быть представлена в виде
где е/ - значение случайной составляющей ряда наблюдений для временного интервала /'/; символом Д/) обозначается значение интегрированной регулярной составляющей временного ряда наблюдений, соответствующее временному интервалу gJ - значение ошибки экспертного прогноза для интервала
Предложены следующие варианты спецификации компонентов комбинированной модели (2).
Регулярная составляющая/{/) включает в себя трендовую и сезонные компоненты в виде соответствующих функций _£(') и_/ё(Г). Сезонность при этом может носить мультипликативный или аддитивный характер и моделируется на основе вектора индексов сезонности.
Примененная методология нахождения прогнозов в виде апостериорных оценок на основе байесовского анализа допускает использование широкого класса возможных моделей для представления трендовой составляющей. Предложенные алгоритмы статистического оценивания позволяют описывать тренд с помощью нелинейных неслучайных функций или на основе динамических линейных моделей.
Проведенный анализ временных рядов, относящихся к некоторым видам непродовольственных товаров, показывает, что изменения спроса, обусловленные различными стадиями жизненного цикла товара, как правило, могут быть хорошо аппроксимированы с помощью функций из семейства кривых роста. При отсутствии адекватной и эффективной в прогнозировании модели в классе неслучайных функций высокое качество прогнозов для исследованных рядов в рамках рассматриваемого подхода было достигнуто при аппроксимации тренда на основе стохастического процесса Тейла-Вейджа, который в данном случае позволяет описать тренд в следующем виде:
где /{() - значение трендовой составляющей временного ряда в момент /; а(1) - прирост уровня от момента /-1 к моменту /; v(t) - временная последовательность независимых нормально распределенных случайных величин с нулевым математическим ожиданием и постоянной дисперсией я2„.
Используются следующие допущения о механизме генерации ненаблюдаемых случайных ошибок. Все е, считаются нормально и независимо распределенными, каждое с нулевым математическим ожиданием и общей дисперсией, равной о2. Все g^ также нормально и независимо распределе-
а(0 = а(М) + у(/),
(3)
(4)
ны, каждое с нулевым математическим ожиданием и дисперсией, равной
Значение дисперсии наблюдений а предполагается неизвестным. Значения о^, характеризующие точность экспертных прогнозов относительно тренда, могут задаваться субъективно или оцениваться на основе имеющихся данных наблюдений в соответствии с моделью
¿¡=сст + р, cc.fi> 0 (5)
где г - количество шагов, на которые делается прогноз, а, Р - дополнительные неизвестные параметры.
Для вычисления прогнозов на основе рассмотренных моделей применен байесовский подход к статистическому оцениванию. При этом точечных и интервальных прогнозы находятся на основе прогнозных функций плотности распределения вероятностей. Байесовские методы позволяют находить оптимальные решения в соответствии с задаваемой функцией потерь. Кроме того, получаемые результаты оценивания являются точными в условиях малых выборок. Требуемая сложность анализируемых моделей обеспечивается за счет применения численных алгоритмов для вычисления стохастических интегралов.
В ходе постановки задачи в терминах баейсовского анализа было выполнено обоснование априорных допущений относительно значений неизвестных параметров модели для каждого из предложенных вариантов спецификации. Поскольку примененные алгоритмы численного оценивания основаны на допущении о сходимости вероятностных интегралов, для представления расплывчатой априорной информации были использованы собственные локально равномерные априорные ФПВ.
При неслучайной функции тренда вывод априорной совместной ФПВ базируется на предположении, что параметры распределены независимо, а априорная ФПВ для каждого параметра выбирается неинформативной в соответствии с областью допустимых значений рассматриваемого параметра.
В случае моделировании трендовой составляющей на основе динамических линейных моделей (ДЛМ) вектор параметров комбинированной модели дополняется за счет переменных, описывающих состояние ДЛМ во все рассматриваемые периоды времени. Для переменных, выражающих состояние ДЛМ в начальный момент времени, а также для дисперсий шумов ДЛМ выбираются неинформативные априорные ФПВ.
Далее вся совокупность параметров анализируемой модели, за исключением дисперсии ошибок наблюдений о2, обозначается как вектор
Указанные ваше процедуры позволяют получить вид априорной совместной ФПВ р(Ч?, (/) при заданной модели тренда.
Для нахождения вида функции правдоподобия р(х, у | ст2) используются предположения о свойствах остаточных компонент, а также уравнения модели (2).
Апостериорная совместная ФПВ для параметров записывается как
р(Ч>, х, у) ~ pQ¥, о>) р(х, у | % Д (6)
Согласно байесовскому подходу, прогнозы вычисляются на основе прогнозной ФПВ, под которой понимается ФПВ для ещё не наблюдавшихся событий. Пусть х обозначает значение спроса в определенный будущий период времени /*, являющийся горизонтом прогнозирования. Тогда для рассматриваемой модели данная ФПВ в общем виде может быть записана как
00
/?(х,/ + |х,у) = J jp(x,t* I*?,ст2, х,y)pOF,ст2 |x,у)с/ст2сЛР ( (7)
R^ 0
— * I 2
где p(x,t |T,cr ,x,y) - условная ФПВ для задаваемых ? и /* при данных 4х, а1, х и у, Лч> - область существования Ч*.
В соответствии с допущениями относительно случайных остатков е, условная ФПВ будущих значений наблюдений принимает вид
р(х/1V, <т2, х, у) = Щх 1/(0,/*), Ст2), (8)
где в- вектор параметров интегрированной регулярной составляющей в модели (2), элементы которого являются компонентами вектора Ч*.
Л
В качестве точечного прогноза x(t*) принимается мера центральной тенденции исходя в соответствии прогнозной ФПВ (7), такая как мода или математическое ожидание.
В связи с тем, что в общем случае аналитическое нахождение искомой прогнозной ФПВ применительно к рассматриваемой модели не представляется возможным, для вычисления интеграла (7) был предложен численный алгоритм, основанный на моделировании методом Монте-Карло с использованием цепей Маркова (Markov chain Monte Carlo, MCMC) для генерирования выборок с требуемым апостериорным распределением.
В данном случае принцип действия методов МСМС состоит в задании марковской цепи, которая начиная с некоторой итерации В позволяет генерировать реализации случайных значений параметров СР», Л>) со стационарным распределением pQV, х, у). При этом, согласно центральной предельной теореме, процедура оценивания интеграла (7) заключается в усреднении значений условных прогнозных ФПВ
|Ч'и,,<72(Л,*,у), вычисленных для сгенерированных реализаций (Ч^, ст2^). В результате оценка значения прогнозной ФПВ F = />(*,/*|х,у) находится как
Л W
F = (N-B)~l X Pix/^ ,aiiJ),x,y)t (9)
j=B+1
где N - общее количество выполненных итераций, В - количество итераций, необходимых для обеспечения сходимости алгоритма.
Для генерирования выборок значений параметров а2(Л) предложен МСМС-алгоритм, реализующий следующие методы. В силу известного вида апостериорной условной ФПВ р(<?\ Ч* х, у) разыгрывание случайных значений дисперсии наблюденй выполняется с помощью процедуры сэмплирования Гиббса. Элементы вектора генерируются помощью алгоритма Метрополиса-Гастингса.
Получаемые в результате многократного повторения итераций наборы случайных значений параметров OF
«о*») используются для восстановления прогнозной ФПВ * |х, у) в соответствии с формулой (9).
Для целей определения величины В используется критерий определения сходимости МСМС-алгоритмов Gelman and Rubin diagnostics, основанный на сравнении свойств нескольких цепей с различными начальными значениями параметров для одного и того же апостериорного распределения. Общее количество итераций N определяется исходя из задаваемой погрешности оценивания.
Применение предложенной модели и соответствующего алгоритма прогнозирования может быть проиллюстрировано с помощью следующего примера.
В рассматриваемом случае анализируется динамика спроса по месяцам. Сценарий составления прогнозов предполагает, что экспертный прогноз делается на три шага вперед в начале каждого квартала. Предполагается, что точность экспертных прогнозов неизвестна, однако не изменяется во времени, т.е. «Л -а12 ... =«г/ =с?3. На рис. 1 показана аппроксимация тренда, сделанная с учетом экспертных оценок, в момент времени к=21. При этом тренд моделируется с помощью процесса Тейла-Вейджа на основе формул (3-4), сезонная составляющая не учитывается. В данном примере на текущий момент времени известно 8 экспертных прогнозов, для 7-ми из которых известны также фактические значения спроса.
Для сравнения на рис. 2 показана аппроксимация трендовой составляющей, сделанная в момент времени к= 21 на основе только реализованной части временного ряда без использования экспертных оценок.
I, мес.
-границы 95% интервала для оценок Щ
-оценка ((1)
—О— известные данные наблодений к моменту к=21 • Д• • данные наблюдений, полученные после момента к=21 —о— экспертные прогнозы, составленные на три шага вперед
Рис. 1. Оценивание трендовой составляющей временного ряда с учетом экспертных прогнозов
Ъ мес.
-границы 95% интервала для оценок ((О
-оценка 1(4
--о— известные данные наблодений к моменту к=21 ■ - д • • данные наблодений, получетые после момента к=21
Рис. 2. Оценивание трендовой составляющей временного ряда без учета экспертных прогнозов
Качество прогнозов за счет обработки дополнительной экспертной информации существенно повышается, что выражается как в направлении экстраполированной части тренда, так и в более узких соответствующих доверительных интервалах или прогнозных областях.
Полученные в момент ¿=23 маргинальные апостериорные ФПВ для параметров модели показаны на рис. 3. Моделирование на основе МСМС-алгоритмов выполнялось в среде >МпВ1Ю8 1.4.
2.0 4.0
о2! О'4
2.0 1.5 1.0 0.5 0.0
Мо-у210-4|х,у)
-2.5 0.0 2.5 5.0 7.5
о-ЛО"4
Рис. 3. Маргинальные апостериорные ФПВ для параметров комбинированной модели
Применение предложенных алгоритмов комбинирования данных для большинства проанализированных рядов, характеризующих динамику спроса на ряд непродовольственных товаров, позволило повысить точность прогнозов по критерию Мс!АРЕ по сравнению с наиболее распространенными методами краткосрочного прогнозирования, базирующимися на анализе авторегрессионных зависимостей уровней ряда. В частности, для рассмотренного в примере ряда по сравнению с методами экспоненциального сглаживания комбинирование данных повышение точность выразилось в снижении значения Мс1АРЕ с 23% до 18%.
В третьей главе рассматривается задача синтеза комбинированных предикторов на основе оптимизации весовых функций в линейной свертке прогнозов.
Комбинированный прогноз определяется в виде .уу = УУ;тХу, где
= {XyJ,x2J.....х^) - вектор прогнозов для у-того периода времени,
XV; =(и'и,>с2у.....м>п])- вектор весовых коэффициентов (ВВК), и - количество прогнозов, подлежащих комбинированию.
Методы оптимизации ВВК базируются на предположении о наличии данных уровней интервальных эквидистантных рядов динамики спроса и частных прогнозов за к предшествующий период, т.е. матрицы регрессо-ров (Х,,Х2,...,Х11).
Анализируются соотношения для нахождения оптимального ВВК на основе следующих алгоритмов.
1. Непосредственное обращение выборочной ковариационной матрицы (НО ВКМ) ошибок, минимизирующее квадратичную форму у = гтп (метод Бэйтса-Грэйнджера).
2. Рекуррентное обращение ВКМ по мере поступления новых данных (РО ВКМ).
3. Градиентный метод (ГМ).
4. Метод наименьших квадратов для уравнения линейной регрессии (МНК), и включающего свободный член в регрессионной модели (МНК-СЧ)
5. Алгоритм МНК, учитывающий тенденций изменения ВВК вследствие старения данных (информационную ценность уровней ряда) путем введения векторов дисконтирующих коэффициентов (МНК-ДК)
6. Модифицированный алгоритм НО ВКМ на основе предложенного метода компенсации смещенности экспертных прогнозов (НО ВКМ - С), основанного на включении в модель уравнений, аппроксимирующих зависимость фактического значения спроса от прогнозного.
7. Алгоритм рекуррентного пошагового предсказания на основе метода оптимальной линейной фильтрации (фильтра Калмана- ФК).
8. Рекуррентный алгоритм оценивания параметра регуляризации на основе метода невязок.
9. Алгоритм параметрической идентификации элементов переходной матрицы методом расширения вектора состояния.
10. Алгоритм оптимизации ВВК на основе динамических линейных моделей и байесовского подхода (ДЛМ-Б). В данном случае предложена постановка задачи байесовского анализа, которая соответствует описанию
состояния"ВВК на основе динамических линейных моделей, допускающих нестационарный характер изменения ВВК во времени с неизвестными параметрами шумов состояния и наблюдения. При этом прогнозы вычисляются как характеристики прогнозной ФПВ, восстанавливаемой с помощью МСМС-методов численного оценивания стохастических интегралов. Исходя из свойств апостериорных условных распределений параметров предложен алгоритм вычисления прогнозной ФПВ, основанный на схеме сэмплирования Гиббса, в которой для генерирования случайных реализаций параметров используется метод предварительной аналитической фильтрации с последующим разыгрыванием случайных величин в обратном порядке (forward filtering backward sampling, FFBS).
Анализ проводился методом ретроспективного прогнозирования на основе использования реальных данных прогнозов и сведений о продажах для различных групп товаров. Результаты моделирования приведены в таблице I. В качестве исходных данных использовались значения 23 рядов динамики спроса и соответствующих рядов экспертных прогнозов. Длина рядов составляла 24 месяца, экспертные прогнозы делались на один шаг вперед. Оценивание праксеологичности моделей выполнялось на основе последних 10 значений каждого ряда.
Таблица 1
Обобщенные показатели точности прогнозов
критерий алгоритм МАРЕ, % MdAPE, % RMSPE, % "коэффициент несовпадения" Тейла
частные прогнозы
Экспертный прогноз 24,8 20,6 26,5 0,401
ARIMA 27,4 21,5 29,9 0,413
комбинированные прогнозы
НО ВКМ 23,9 20,1 23,8 0,390
НО ВКМ - С 23,4 19,9 22,2 0,336
МНК 24,0 20,4 24,1 0,403
МНК-ДК 23,2 19,7 22,1 0,302
МНК- сч 24,3 20,5 24,9 0,419
РОВКМ 23,3 19,6 22,0 0,313
гм 24,0 20,4 • 24,1 0,403
ФК 21,3 19,3 21,3 0,293
ДЛМ-Б 20,7 18,9 20,7 0,287
Статистические прогнозы вычислялись в среде программирования R на основе реализованного в модуле forecast ("http://www.robhvndman.info/Rlibrarv/forecastA метода ARIMA с автоматическим выбором наилучшей модели.
В качестве показателей качества точности прогнозирования использованы традиционно применяемые критерии: средняя абсолютная процентная ошибка (Mean absolute percentage error - МАРЕ), медиана абсолютной процентной ошибки (Median absolute percentage error - MdAPE), корень из средней процентной ошибки в квадрате (Root mean square percentage error - RMSPE) и коэффициент несовпадения (расхождения) Тейла.
Как следует из приведенных результатов, в большинстве случаев процедура оптимизации ВВК при свертке прогнозов позволяет достигать улучшение качества прогнозов. Предложенные методы динамической оптимизации ВВК для части исследуемых рядов оказались более эффективными, однако требуют корректного задания параметров моделей. По этой причине применение более простых методов может оказаться предпочтительным. Для определения наиболее приемлемых процедур оптимизации ВВК для каждого набора исходных данных целесообразно проведение конкурирования прогнозов по результатам ретроспективного моделирования.
В результате проведенного исследования
1. Выполнен анализ перспективных направлений совершенствования методов комбинирования прогнозов применительно к особенностям характера изменения спроса на потребительские товары,
2. В рамках обоснованных направлений для поиска наиболее приемлемых решений предложены модели систем комбинирования, позволяющие применить наиболее совершенные методы поиска наилучших решений с использованием современного математического и информационно-технологического инструментария.
3. Обосновано применение математических методов поиска оптимальных решений в системах комбинирования, позволяющих улучшить их характеристики. На основе применения этих методов разработаны адаптивные алгоритмы обработки данных статистических и экспертных прогнозов. Наиболее значимыми из них являются постановки и решения задач синтеза алгоритмов нахождения комбинированных прогнозов на основе байесовского подхода и процедуры вычисления прогнозной функции плотности распределения вероятностей, а также задачи синтеза предикторов в виде адаптивных весовых сумматоров на основе методов оптимальной линейной фильтрации.
5. Усовершенствованы модели и методы комбинирования за счет введения модификаций, учитывающий свойства рядов прогнозов.
6. Проведен анализ эффективности применения разработанных алгоритмов путем моделирования с использованием различных наборов исходных данных, который подтвердил достижение положительного результата по совокупности показателей качества прогнозирования.
7. Разработаны рекомендации, которые позволяют усовершенствовать системы прогнозирования спроса за счет применения оптимальных (или субоптимальных) методов комбинирования разнородных данных и тем самым повысить качество прогнозирования спроса, лежащего в основе планирования коммерческой деятельности фирмы.
Результаты исследований внедрены на предприятиях, специализирующихся на производстве и продаже продукции в различных сегментах потребительского спроса.
По теме диссертационного исследования опубликованы следующие работы.
1. Давыденко A.B., Иванов Е.Е. Тенденции развития математического обеспечения автоматизированных систем прогнозирования спроса // Экономическая кибернетика: системный анализ в экономике и управлении: Сборник научных трудов, вып. № 12. - СПб: Изд-во СПбГУЭФ, 2005, с. 130- 132. -0,15 п.л. (личный вклад автора-0,1 пл.).
2. Давыденко A.B. Прогнозирование спроса по трендовым моделям с учетом экспертной информации // Экономическая кибернетика: системный анализ в экономике и управлении: Сборник научных трудов. - вып. №13.- СПб: Изд-во СПбГУЭФ, 2006, с. 76 - 80 - 0,18 пл..
3. Давыденко A.B. Методы агрегирования фактографических и экспертных данных в задачах синтеза алгоритмов прогнозирования спроса // Актуальные проблемы экономики и новые технологии преподавания: Материалы V Международной научно-практической конференции, 14-15 марта 2006 г. - СПб.: Изд-во МБИ, 2006. - Т. 2, - с. 158 - 163 - 0,19 пл.
4. Давыденко A.B. Применение алгоритмов линейной фильтрации для определения весовых коэффициентов в аддитивной свертке прогнозов // Экономическое прогнозирование: модели и методы: Материалы II Международной научно-практической конференции, 30-31 марта 2006 г. - Воронеж: Изд-во ВГУ, 2006. - ч.Н. - с. 272 - 274. - 0,11 пл.
5. Давыденко A.B. Алгоритмы прогнозирования спроса на основе регрессионных моделей, учитывающих априорную экспертную информацию // Сборник тезисов XIII Международной научной конференции студентов, аспирантов и молодых ученых «Ломоносов», 12-15 апреля 2006 г. - М: Изд-во МГУ, 2006. - с. 201 - 202. - 0,08 пл.
6. Давыденко A.B. Принципы построения и функционирования автоматизированной информационно-аналитической системы прогнозирования спроса на продукцию фирмы // Информационно вычислительные технологии и их приложения: Сборник статей IV российско-украинского научно-технического и методического симпозиума, 1-3 июня 2006 г. -Пенза: Изд-во МНИЦ, 2006 - с. 73 - 76. - 0,17 пл.
7. Давыденко A.B. Комбинирование как магистральное направление совершенствования методов прогнозирования спроса // Экономическая кибернетика: системный анализ в экономике и управлении: Сб. научных трудов, вып. № 14. - СПб: Изд-во СПбГУЭФ, 2006. - с. 107 - 115. - 0,44 п.л.
8. Давыденко A.B. Оптимизация весовых коэффициентов в комбинированном прогнозе // Экономическая кибернетика: системный анализ в экономике и управлении: Сб. научных трудов, вып. № 14. - СПб: Изд-во СПбГУЭФ, 2006. - с. 115- 119.-0,14 пл.
9. Давыденко A.B. Экспертно-статистическая модель прогнозирования спроса на потребительские товары. // Актуальные проблемы экономики и новые технологии преподавания: Материалы VI Международной научно-практической конференции, 13-14 марта 2007 г. - СПб: Изд-во МБИ, 2007. - Т. 2. - с. 137 - 143. - 0,15 п.л.
10. Давыденко A.B. Результаты моделирования комбинированного предиктора, реализующего алгоритмы оптимального весового сложения // Экономическое прогнозирование: модели и методы: Материалы III Международной научно-практической конференции, 5-6 апреля 2007 г. - Воронеж: Изд-во ВГУ, 2007. - ч.Н. - с. 296-300.-0,17 п.л.
11. Давыденко A.B. Особенности синтеза предикторов при прогнозировании спроса на продукцию фирмы // Материалы докладов XIV Международной конференции студентов, аспирантов и молодых ученых «Ломоносов», 11-14 апреля 2007 г. - М.: Издательский центр Факультета журналистики МГУ им. М.В. Ломоносова, 2007, [Электронный ресурс] -http://www.lomonosov-msu.ru/2007/ - 0,09 пл.
12. Давыденко A.B. Применение методов имитационного моделирования для прогнозирования спроса с использованием априорной экспертной информации II Известия Санкт-Петербургского университета экономики и финансов. - 2007. - № 2(50). - с. 184 -188. - 0,25 п.л.
13. Давыденко A.B. Вопросы устойчивости решений задачи оптимизации весов в линейной свертке прогнозов // Экономическое прогнозирование: модели и методы: Материалы IV Международной научно-практической конференции, 10-11 апреля 2008 г. - Воронеж: Изд-во ВГУ.- 2008. - ч. I. - с. 29 - 32. - 0,13 пл.
ДАВЫДЕНКО АНДРЕЙ ВЛАДИМИРОВИЧ АВТОРЕФЕРАТ
Лицензия ЛР № 020412 от 12.02.97
Подписано в печать 29.09.08. Формат 60x84 1/16. Бум. офсетная. Печ. л. 1,25. Бум. л.0,6. РТП изд-ва СПбГУЭФ. Тираж 70 эю. Заказ 553 .
Издательство Санкт-Петербургского государственного университета экономики н финансов 191023, Санкт-Петербург, Садовая ул., д. 21.
2007517UBÏC
2007517082