Оптимизация методов обработки социально-экономической информации в системах электронной торговли тема диссертации по экономике, полный текст автореферата

Ученая степень
кандидата экономических наук
Автор
Фельдман, Михаил Давидович
Место защиты
Москва
Год
2004
Шифр ВАК РФ
08.00.13

Автореферат диссертации по теме "Оптимизация методов обработки социально-экономической информации в системах электронной торговли"

На правах рукописи

ФЕЛЬДМАН МИХАИЛ ДАВИДОВИЧ

«Оптимизация методов обработки социально-экономической информации в системах электронной торговли»

08.00.13 - Математические и инструментальные методы! экономики

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук

Москва 2004

Работа выполнена в Российском Государственном гуманитарном институте на кафедре информационно-вычислительных систем факультета управления

Научный руководитель: кандидат технических наук, доцент

Клетин Виктор Александрович

Официальные оппоненты: доктор экономических наук

Дик Владимир Владимирович

кандидат экономических наук Журавлева Тамара Борисовна

Ведущая организация: Московская Международная Высшая Школа

Бизнеса (Институт)

Зашита состоится ^ мая 2004 г. в 15.00 часов на заседании диссертационного совета Д219.007.01 в Всероссийском НИИ проблем вычислительной техники и информатизации по адресу: 115114, Москва, 2-й Кожевнический пер., дом 6/4 строение 1. ауд. 213.

С диссертацией можно ознакомиться в библиотеке Всероссийском НИИ проблем вычислительной техники и информатизации Минсвязи России.

Автореферат разослан апреля 2004г.

Ученый секретарь диссертационного совета, кандидат экономических наук

Финогенов А. В.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. В настоящее время одним из мощных импульсов в развитии рыночных отношений в России может стать организация системы информационно-маркетинговых центров (ИМЦ), которые будут предназначены для продвижения товаров и услуг на национальные рынки государств - участников Содружества Независимых Государств (Программа работ утверждена Решением Совета глав правительств СНГ 29 ноября 2001 года). Основными задачами электронной коммерции, решаемыми в системе ИМЦ, являются организация маркетинговых исследований, проведение электронной торговли и рекламной деятельности по привлечению инвестиций в различные регионы и страны СНГ. Подключение к Интернету системы ИМЦ позволит участникам электронной коммерции обеспечить свое присутствие на глобальном уровне.

Первым шагом к электронной торговле для многих организаций является проведение маркетинговых исследований в интересах (или по заказам) инвесторов, производителей и иных хозяйственных субъектов ИМЦ, которые должны использовать маркетинговые данные в своих решениях. Эти задачи включают в себя определение спроса и предложений потребителей и поставщиков по видам продукций и услуг (анализ емкости рынка, прогнозирование объемов продаж, цен по определенным видам продукции и услуг); определение потенциальных потребителей и поставщиков, их финансово-экономические возможности; выявление потребительских свойств товаров и услуг, сегмент рынка и компоновка инвестиционных проектов с учетом ресурсных ограничений, логических связей (технического, технологического и организационного содержания) между вариантами привлечения исполнителей, вариантами технических решений, вариантами используемого оборудования, а так же целей.

В электронной торговле наблюдается быстрый процесс глобализации рынков, проявляющийся в том, что предприятия используют поставщиков компонентов в одной части мира, организуют сборочные операции в другой, а продают готовую продукцию в третьей. Такая деятельность должна включать в себя оптимальную процедуру, которая базируется на применении эффективных методов поиска партнеров. На практике колоссальный объем циркулирующей информации существенно усложняет проблему для покупателей и продавцов найти друг друга. Поставщики и торговые компании широко используют электронные базы данных о своей продукции. Хотя эффективное ведение баз данных отвечает интересам поставщиков, с точки зрения покупателей возникают

сложности, связанные с необходимостью осуществления поиска по многочисленным базам данных.

Еще одним направлением, способствующим развитию электронной коммерции в Интернете, является организация проведения рекламной деятельности по инвестированию различных регионов и стран СНГ. Решение этой проблемы заключается в создании крупных сетевых информационных интеграторов новостей в области экономики, которые призваны собирать и давать объективную информацию по различным регионам России с целью привлечения туда инвестиций.

Каждая интересующая пользователя тематика, например, "банковская сфера" или "торговая сфера", в сутки может охватывать тысячи документов. В этом случае необходимо осуществлять мониторинг информационных ресурсов, который тесно связан с достаточно популярным методом анализа, таким как контент-анализ. Именно этот метод является перспективным направлением развития систем сетевой интеграции и рассматривается сегодня многими экспертами как контент-мониторинг, появление которого вызвано, прежде всего, задачей систематического отслеживания тенденций и процессов в постоянно обновляемой сетевой информационной среде.

Решение рассмотренных выше проблем организации маркетинговых исследований, поиска партнеров в электронной торговле и анализа больших объёмов социально-экономической информации для проведения рекламной деятельности по инвестированию различных регионов России и стран СНГ приводит к необходимости разрабатывать быстродействующие методы обработки социальной и экономической информации.

Основу таких программных средств составляют программные реализации простых зацикленных алгоритмов, которые используют повторяющиеся процедуры: по заданному поисковому образу осуществляется поиск соответствующих данных, которые запоминаются и вновь повторяются. Помимо этих процедур в состав поисковых систем могут входить и другие проблемно-ориентированные прикладные программы, осуществляющие тот или иной целенаправленный анализ.

Крупный вклад в развитие теории и практики создания оптимизационных моделей и методов обработки социально-экономической информации внесли многие отечественные ученые. В их числе: СВ. Емельянов, К. А. Багриновский, В.Н. Бурков, О.В. Голосов, В.О. Гроппен, И.Н. Дрогобыцкий, В.А. Ириков, В.В. Кульба, Б.Е. Одинцов, А.Н. Романов, СВ. Черемных и другие.

Усилиями этих ученых сложилась база для дальнейшего обобщения результатов и теоретических разработок на одном из самых актуальных направлений - разработке математических моделей и методов обработки

больших массивов социально-экономической информации в автоматизированных информационных системах и сетях компьютеров.

Одной из основных парадигм современного программирования, таких как проблемно-ориентированное программирование и объектно-ориентированное программирование, является оптимальное программирование. Оптимальное программирование это система моделей и методов, позволяющая применительно к заданной триаде задача-алгоритм-компьютер создавать программное обеспечение, эффективно реализующее специфику этой триады.

Так, стремление к созданию универсального программного продукта противоречит концепции создания высококачественных программ, эффективно использующих ресурсы конкретных компьютеров, а сокращение трудозатрат программиста, связанное с применением виртуальной памяти, часто приводит к неэффективному использованию последней, повышающему время счета.

Традиционная технология обработки информации предполагает разработку структуры основных и вспомогательных массивов, их размещение в оперативной и внешней памяти компьютера, декомпозицию поискового алгоритма с тем, чтобы реализовать его в виде головной программы, присутствующей в оперативной памяти и взаимодействующей с ней в оверлейном режиме прикладными подпрограммами, размещенными на внешних носителях. Как правило, целью оптимизации выступает минимизация верхней либо нижней границы времени счета, затрат оперативной памяти, что определяется индивидуальностью программиста, а также его умением и навыками. Однако результаты разработок этих направлений достаточно скромные. Это связано с тем, что практические задачи имеют достаточно большую размерность и получение решений в реальном масштабе времени методами математического программирования сильно затруднено.

Попытка осуществить оптимальный выбор эффективного алгоритма организации вычислительного процесса для решения задачи обработки социально-экономической информации на имеющемся компьютере, лежит в основе предлагаемой в диссертации новой технологии проектирования программ, развитой применительно к программным реализациям простых зацикленных алгоритмов. Такие алгоритмы обработки социально-экономической информации могут быть использованы для значительного числа задач электронной коммерции.

Используя существующие подходы, в диссертационной работе разрабатываются более эффективные средства автоматизации обрабатываемой социально-экономической информации. При этом целью автоматизации является оптимизация размещения программы, осуществляющей поиск необходимой информации, и самих информационных массивов в памяти компьютера или вычислительной системы с возможностями параллельной её

обработки. К таким вычислительным системам относятся различные типы компьютеров (одно и многопроцессорные) и сетей компьютеров.

Исходя из вышесказанного, повышение эффективности алгоритмов обработки социально-экономической информации являются актуальной проблемой, требует дальнейших исследований, её решение позволит существенно улучшить качество принимаемых решений в электронной торговле.

Разрабатываемые в диссертационной работе модели и методы позволят существенно упростить технологию обработки информации, исключив некоторые процедуры, зависящие от человеческого фактора: размещение данных, декомпозицию алгоритма, создание вспомогательных массивов (при этом оптимальность и корректность самого алгоритма пользователя сомнению не подвергается). Они также дадут возможность получить некую разновидность виртуальной памяти, которая использует лишь программное обеспечение компьютера, оснащенного внешними носителями и обладающего трансляторами с языков высокого уровня.

Цель диссертации - разработка математических моделей и инструментальных методов оптимизации процессов обработки больших объемов социально-экономической информации в системах электронной торговли.

Для достижения указанной цели в диссертации поставлены и решены следующие задачи.

1. Проведен анализ современного состояния решения задач электронной коммерции, которые включают в себя маркетинговые исследования, поиск партнеров в электронной торговле, а также проведение рекламной деятельности по инвестированию различных регионов и стран СНГ в информационных системах и компьютерных сетях.

2. Исследованы традиционные технологии обработки информации и определены возможные пути их модернизации с целью повышения быстр одействия.

3. Разработаны формальные постановки задач по повышению быстродействия технологии обработки информации за счет декомпозиции основной программы и эффективного размещения основных и вспомогательных массивов.

4. Усовершенствованы традиционные и разработаны новые эффективные методы организации процесса обработки социально-экономической информации, учитывающие специфику поставленных задач.

5. Проведены экспериментальные исследования разработанных алгоритмов на примере решения задачи формирования информационного

сборника по инвестиционной привлекательности регионов России по материалам СМИ из сети Интернет.

Объект исследования - компьютерные системы и сети компьютеров, в которых циркулирует социально-экономическая информация, предназначенная для решения задач электронной торговли.

Предмет исследования - процессы обработки социально-экономической информации с помощью компьютеров и компьютерных сетей.

Методология исследования. Теоретическую и методологическую базу исследования составляет системный подход к моделированию сложных информационных систем.

В ходе проведения исследований использовались труды отечественных и зарубежных ученых в области математического и комбинаторного программирования. При решении конкретных задач были использованы научные работы в области теории вероятностей, математической статистики, теории графов, а также материалы научной периодики, конференций и семинаров.

Решение поставленных в диссертации задач потребовало применения методов комбинаторного программирования, функционального, статистического, системного и комбинаторного анализа, а также использование аппарата теории вероятностей и теории графов.

Диссертационная работа по своему содержанию соответствует пункту 2.5 паспорта специальности 08.00.13 - Математические и инструментальные методы экономики («Разработка концептуальных положений использования новых информационных и коммуникационных технологий с целью повышения эффективности управления в экономических системах»).

Научная новизна исследования заключается в решении научной задачи - повышение эффективности технологии обработки больших объемов социально-экономической информации для решения основных задач электронной коммерции.

Научную новизну содержат следующие положения.

1. Определен класс программ с повторяющимися вычислениями, которые базируются на простых зацикленных алгоритмах, используемых для обработки социально-экономической информации.

2. Разработаны формализованные постановки задач по размещению основных и вспомогательных информационных массивов в компьютере, определены граничные условия, при которых возможно было получить решение исходной задачи в аналитическом виде. Это стало возможным за счет декомпозиции обобщенной задачи.

3. Доказана теорема, определяющая нижнюю границу числа обращений к внешней памяти в общем случае, на основе которой разработаны более эффективные алгоритмы обработки социально-экономической информации.

4. Разработаны эффективные алгоритмы обработки социально-экономической информации, в которых оптимизация размещения данных осуществляется одновременно с декомпозицией основной программы.

5. Разработаны стратегии управления многопроцессорной системой по обработке социально-экономической информации, которые позволяют существенно повысить быстродействие поиска решений задач электронной коммерции.

6. Разработан комплекс программных средств, реализующих технологию автоматизированного расчета по размещению основных и вспомогательных информационных массивов в компьютере. Экспериментальное исследование, разработанных алгоритмов показало их преимущество по сравнению с традиционными методами.

Практическая ценность работы заключается в том, что основные положения, выводы и рекомендации диссертации ориентированы на широкое применение математических моделей и инструментальных методов для разработки систем автоматизированного управления обработкой больших объёмов социально-экономической информации с целью повышения эффективности принятия решений в задачах электронной торговли.

Разработка математического и инструментального обеспечения системы управления обработкой информационных массивов позволило существенно увеличить её быстродействие за счет оптимальной организации обрабатывающих программ и информационных массивов.

Проведенные исследования и полученные результаты составляют теоретическую основу построения систем автоматизированного управления обработкой социально-экономической информации. Разработанные модели и методы направлены на решение практической задачи - повышение эффективности обработки больших объемов социально-экономической информации, циркулирующей в системах и компьютерных сетях. Результаты исследований доведены до конкретных методик, алгоритмов и программных комплексов.

Основные результаты исследования, имеющие практическое значение: технология автоматизации процесса обработки социально-экономической информации, реализация которой позволила повысить качество и сократить время принятия решений в задачах электронной коммерции;

алгоритмы обработки социально-экономической информации, учитывающие специфику задач электронной торговли.

Апробация и внедрение результатов исследования. Проведенные в диссертации исследования непосредственно связаны с планами научно-исследовательских работ Всероссийского научно-исследовательского института проблем вычислительной техники и информатизации (ВНИИПВТИ). Основные выводы и предложения диссертации прошли экспериментальную проверку и были использованы в научно-исследовательских работах:

«Прогноз развития российского сегмента Интернета до 2010 года» (Шифр «Прогноз-2002»)

«Создание системы ИМЦ для продвижения товаров и услуг на национальные рынки государств - участников Содружества Независимых Государств на период до 2005 года».

Алгоритмы и программы будут использованы при разработке программного обеспечения ИМЦ для динамического оперативного размещения данных в памяти ШM-совместимых персональных компьютеров на основе накапливаемой статистики обращений.

Разработан комплекс моделей и программный макет автоматизации обработки больших объёмов социально-экономической информации для решения задачи формирования рекламного информационно-аналитического сборника регионов России, которые были использованы в НИИР Центра прикладных экономических исследований и разработок Государственного университета - Высшая школа экономики (ГУ-ВШЭ) (соответствующие акты о внедрении прилагаются к диссертации).

Результаты исследований внедрены в виде:

- пакета прикладных программ, который будет использован ВНИИПВТИ при разработке программного обеспечения ИМЦ для динамического оперативного размещения данных в памяти IBM-совместимых персональных компьютеров на основе накапливаемой статистики обращений.

Экспериментальная проверка была проведена при формировании интегрированного информационно-аналитического сборника для потенциальных инвесторов по рекламе наиболее привлекательных областей и регионов России.

Теоретические и практические результаты диссертационного исследования были также использованы при разработке компьютерной обучающей программы по курсу «Информационные технологии управления» для дистанционного образования студентов экономических специальностей Всероссийского финансово-экономического института ВЗФЭИ.

Основные положения диссертации докладывались и получили одобрение на следующих конференциях и семинарах:

1-й Международной НТК «Проблемы развития топливно-энергетического комплекса: экономика, политика, история» (Москва, Российский государственный гуманитарный университет, 2000);

П-й Международной НТК «Проблемы развития топливно-энергетического комплекса: экономика, политика, история» (Москва, Российский государственный гуманитарный университет, 2001);

УГ-й Международной НТК «Комплексная зашита информации» (Москва, Всероссийский научно-исследовательский институт проблем вычислительной техники и информатизации, 2002),

- VII Международной НТК «Комплексная защита информации» (Москва-Минск, Объединенный институт проблем информатики НАН Беларуси, 2003).

а также на семинарах РГТУ, ВНИИПВТИ, ИПУ РАН и Финансовой академии при Правительстве Российской Федерации.

Публикации. По материалам диссертации опубликовано 3 печатных работы общий объём - 1,7 п.л. (авторский объем 1,5 п. л.).

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы, и приложения содержащего акты о внедрении результатов работы. Общий объем диссертационной работы 122 страница, содержащих машинописный текст и 20 схем.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы, указана цель работы, описаны используемые методы исследований, приведены сведения о практической и научной ценности полученных результатов и апробации работы.

В первой главе рассматривается Международная программа по созданию системы информационно-маркетинговых центров (ИМЦ), которые предназначены для продвижения товаров и услуг на национальные рынки государств - участников Содружества Независимых Государств (Программа работ утверждена Решением Совета глав правительств СНГ 29 ноября 2001 года). Основными задачами электронной коммерции, решаемыми в системе ИМЦ, являются задачи организации маркетинговых исследований, проведения электронной торговли (она включает в себя поиск партнеров, заключение договора и проведения всех банковских и транспортных операций) и рекламной деятельности по привлечению инвестиций в различные регионы и страны СНГ. С технической точки зрения Интернет позволяет участникам электронной коммерции обеспечить свое присутствие в системе ИМЦ на глобальном уровне, и поэтому для многих организации маркетинг стал, безусловно, первым шагом к электронной торговле.

В рамках маркетинговых исследований в интересах (или по заказам) инвесторов, производителей и иных хозяйственных субъектов ИМЦ должно быть обеспечено решение основных маркетинговых задач. В основе этих задач лежит механизм поиска социально-экономической информации необходимой для пользователей.

Путь к налаживанию эффективных информационных потоков на внутренних и международных рынках лежит через использование общих процессов деловой деятельности. Эта деятельность должна включать в себя оптимальную практику, которая базируется также на применении эффективных методов поиска партнеров. На практике колоссальный объем циркулирующей информации существенно усложняет проблему для покупателей и продавцов найти друг друга.

Еще одним направлением, способствующим развитию электронной коммерции в Интернете, является организация проведения рекламной деятельности по инвестированию различных регионов и стран СНГ. Решение этой проблемы заключается в создании крупных сетевых информационных интеграторов новостей в области экономики, которые призваны давать объективную информацию по различным регионам России с целью привлечения туда инвестиций.

Каждая интересующая пользователя тематика, например, "банковская сфера" или "торговая сфера", в сутки может охватывать тысячи документов, которые могут быть доставлены пользователю всеми доступными средствами (электронной почтой, доступом к авторизированной ^^Ь-странице, WAP-серверу или в виде 8МБ-сообщений). Даже эксперту порой не хватает времени на просмотр одних лишь заголовков.

В этом случае необходимо осуществлять мониторинг информационных ресурсов, который тесно связан с достаточно популярным в последние десятилетия методом анализа - контент-анализом. Именно этот метод является перспективным направлением развития систем сетевой интеграции и рассматривается сегодня многими экспертами как контент-мониторинг, появление которого вызвано, прежде всего, задачей систематического отслеживания тенденций и процессов в постоянно обновляемой сетевой информационной среде.

Таким образом, основной проблемой для организации маркетинговых исследований, поиска партнеров в электронной торговле, а также анализа больших объёмов информации для проведения рекламной деятельности по инвестированию различных регионов и стран СНГ является разработка быстродействующих методов обработки социально-экономической информации в различных информационных системах и компьютерных сетях.

Основная идея оптимизации обработки больших массивов информации заключается в том, чтобы разместить данные и программную реализацию зацикленного алгоритма в иерархической памяти компьютера таким образом, чтобы минимизировать верхнюю границу числа обращений к внешней памяти компьютера. При этом полагаем, что в оперативной памяти всегда присутствуют лишь головная программа и часть данных, остальные данные и подпрограммы, реализующие блоки алгоритма, не вошедшие в головную программу, размещаются на внешних носителях и вызываются в оперативную память по мере надобности. Аналогично можно говорить о минимизации среднего числа обращений к внешним носителям, либо о минимизации нижней границы такого рода - выбор цели зависит от склада характера, лица, принимающего решения. Такие постановки задачи имеют смысл лишь при наличии на графе G(X,U) зацикленного алгоритма, вершины которого соответствуют состояниям вектора переменных,

Рис.]. Граф простейшего зацикленного алгоритма до и после преобразования.

а дуги - операторам, переводящим вектор из одного состояния в другое, в противном случае исходному графу соответствует единственный гамильтонов контур (рисЛ.а). Если преобразовать исходный граф в полный (каждой дуге которого соответствует один или несколько операторов, а вес каждой дуги -требуемый для реализаций соответствующих операторов объем оперативной памяти), то задачу можно интерпретировать, как поиск контура, содержащего наименьшее число дуг при условии, что суммарный вес его дуг не превышает выделенный для хранения программных единиц объем оперативной памяти.

Другой стороной поставленной задачи является оптимизация размеров

блоков кэширования: все данные размешаются на внешних носителях в виде блоков, по мере надобности, подкачиваются в оперативную память. Очевидно, что с ростом размеров блоков кэширования сокращается число обращений к внешним носителям, однако размеры этих блоков ограничиваются объемом оперативной памяти, выделенным для хранения данных.

Связь между приведенной выше и предшествующей ей задачей осуществляется благодаря ограничению на объем свободной оперативной памяти - этот ресурс компьютера является общим для обеих задач. Далее приводятся их формальные постановки.

Показана возможность сведения задачи оптимальной программной реализации простого зацикленного алгоритма к поиску на полном бисвязаном взвешенном орграфе такого контура, число дуг которого было бы минимально, а сумма минимального веса дуги, принадлежащей этому контуру, и аналогичной дуги с максимальным весом не превысила бы объема оперативной памяти, выделенной для хранения программных единиц

0)

где А(О) множество простых контуров графа С(Х,Ц);

ак€А(С) - к-й контур множества А(С); 11(ак) - множество дуг контура а^бА^); (У)еи(Эк) - дуга (У) из множества и(а|,);

- булевская переменная, принимающая значение, равное 1, если контур ак входит в оптимальное решение и 0 - в противном случае.

Физически целевая функция F1 соответствует минимизации числа обращений к внешним носителям программы и подпрограммы, работающих в оверлейном режиме. Аналогично формируется задача минимизации среднего числа обращений к внешним носителям при условии, что для кеширования ьш массива пользователя, размещенного на внешних носителях, объем которого равен Wi, используется ьй блок кеширования с объемом №

Н

—>т>п

и

VI, у.^^пит

где У2 - объем оперативной памяти, выделенной под блоки кеширования,

Р, - вероятность обращения к 1-у массиву пользователя за фиксированный промежуток времени.

Поскольку единицы измерения обеих целевых функций совпадают, совместное решение вышеприведенных задач можно заменить, решением одной задачи, объединяющей ограничения первых двух задач при условии, что:

а) целевая функция новой задачи Р=Р1+Р2;

б) объем свободной оперативной памяти У= VI + У2.

Очевидно, что новая задача относится к задачам смешанного программирования, причем в первой главе доказана унимодальность этой задачи. Это позволило предложить для ее решения два различных алгоритма: в основе одного из них лежит интерполяция и дихотомия, а другого -полиномиальная аналитическая аппроксимация и использование методов математического анализа для поиска экетремума.

Последний параграф первой главы посвящен многокритериальной оптимизации: возможность постановки задачи оптимизации с несколькими несоизмеримыми целевыми функциями (например, единовременная минимизация времени счета и объема используемой оперативной памяти) делает актуальным поиск оптимума по Парето.

Наличие нескольких контуров на графе в(Х,и) позволяет в качестве альтернативы задачам (1) и (2) поставить задачу минимизации числа программных единиц, реализующих операторы, отвечающие любому контуру что применительно к простым контурам и соответствует минимизации числа обращений к внешним носителям при однократном "проходе" по этому контуру.

Аналогично может быть поставлена задача минимизации величины Ь' применительно ко всем контурам множества А(в). Обозначая у(к) объем оперативной памяти к-ой программной единицы при условии, что у(0) - объем головной программы, первая из вышеназванных задач может быть сформулирована в виде:

Уа^бА(О), ^щпит .ьк)-»тт,

к«К О-^ии,)

VadeA(G), max V(k) signum^^X^'»J*^V'V(0);

А вторая может быть получена из задачи (3) путем замены функционала цели последней на следующий функционал:

VakeA(G), bk -»min (4)

В обоих случаях решения задач (3) и (4) являются оптимальными в смысле Парето, однако множества этих решений, как правило, столь велики, что их поиск сравним с проблемой выбора одного из них, являющейся не менее сложной. Чтобы сократить множества оптимальных решений многокритериальных задач, воспользуемся добавочными условиями, характеризующими функционалы цели (3) и (4).

Вторая глава посвящена подробному анализу эффективности различных методов решения первой из приведенных выше задач. Поиск решения при этом осуществляется в два этапа. На первом этапе на заданном бисвязном орграфе выделяются все контуры, а на втором этапе на множестве контуров выбирается один, удовлетворяющий ограничениям и обладающий минимальным числом дуг.

Для реализаций первого этапа анализировались два подхода:

а) выделение всех контуров последовательным возведением матрицы в степень;

б) обход всех замкнутых путей на графе ветвящейся процедурой.

Оба алгоритма были программно реализованы (язык программирования -Паскаль) и оттестированы. Для малых размерностей более эффективным явился первый подход; для задач реальных размерностей - второй. Второй этап поиска также связан с двумя возможностями. Первая - это глобальный перебор, а вторая— использование алгоритма поиска кратчайших путей на взвешенных графах. Эффективность последней процедуры очевидна, что подтверждается приводимыми примерами.

Сочетание- наиболее эффективных применительно к задаче заданной размерности процедур каждого этапа позволяет получить эффективный алгоритм минимизации числа обращений к внешней памяти в ходе одной итерации зацикленного алгоритма. Во второй главе показано, что, если целью

оптимизации является минимизация объема используемой оперативной памяти, то вышеназванная процедура является одним из шагов, решающих эту задачу.

Снижение объема перебора при поиске решения многокритериальной задачи оптимальной декомпозиции зацикленного алгоритма достигается двояко: одним из способов является лексикографическое упорядочение критериев, а вторым - их взвешивание. В последнем случае задача сводится к однокритериальной, поэтому наибольший интерес представляет предыдущая, для решения которой во второй главе предлагается разновидность методов типа ветвей и границ. Особенностью этой модификации метода ветвей и границ является то, что каждой вершине дерева ветвлений отвечает не одна оценка, а вектор оценок, каждая из которых соответствует "своему" функционалу цели.

Характерные экспериментальные зависимости времени счета программы, осуществляющей поиск оптимальной декомпозиции простого зацикленного алгоритма от числа вершин п = |Х| заданного графа С(Х,Ц) и плотности заполнения матрицы смежности вершин £=|11|/п2 приведены ниже на рис. 3 и 4.

Рис. 3. График зависимости времени решения задачи от еб размерности.

Третья глава посвящена поиску оптимальной стратегии размещения данных в иерархической памяти компьютера. Приводятся содержательные и формальные, постановки задач такого рода, последовательность рассмотрения моделей соответствует росту их адекватности. Исследование, свойств построенных моделей дает возможность доказать три теоремы, две из которых позволяют в ряде случаев определить аналитически нижнюю границу значения целевой функции задачи (2), а третья - оптимальный вектор переменных:

Рис. 4. График зависимости времени решения задачи от плотности заполнения матрицы

Теорема 3.3. Оценке снизу оптимального значения целевой функции задачи (2) при условии, что Ц <Wj , отвечают следующие значения вектора переменных:

(5)

Приводимое в диссертации доказательство отличается от доказательства аналогичной теоремы, приводимого в монографии Бержа К. «Теория конечных графов и ее применение».

На основании доказанных теорем в работе предлагаются два алгоритма решения задачи (2), первый из которых базируется на переборе целочисленных значений вектора переменных в окрестностях точки, определяемой выражением (5), а в основе второго лежит метод типа ветвей и границ. Описание этих процедур приводится ниже.

Алгоритм 1.

Шаг 1. На основании (5) ищется вектор переменных {j={U|, U2,...Un} полученной задачи (2).

Шаг 2. Если на множестве, индексов переменных I есть подмножество Г el такое, что Vie Г, U,<1, то перейти к следующему шагу, если же Г* 0, то к

шагу 7.

Шаг 3. Всем переменным, индексы которых принадлежат подмножеству Г, присваивается значение, равное единице, после чего их выдают на печать.

Шаг 4.I=I\I'.

Шаг5.У2=У2-|Г|

Шаг 6. Если 1=0 либо V2<0, перейти к шагу 25, если же |I|V2>0, то к шагу

7.

Шаг 7. Если на множестве I индексов переменных есть подмножество I" такое, Viel", U,äW„ то перейти к шагу 8, нет - к шагу 12.

Шаг 8. Всем переменным, индексы которых составляют подмножество Г*с1 присваивается значение, равное величине соответствующего массива, размещенного во внешней памяти: '

, печать размерности массивов, индексы которых принадлежат

Шаг9.1=1\Г.

Шаг 10. Величине V2 присвоить значение, равное "Vi-^U,.

Шаг 11. Если 1=0 или V2=0, то перейти к шагу 25, в противном случае - к шагу 1.

Шаг 12. Если 1=0, то перейти к шагу 25, в противном случае - к следующему шагу.

Шаг 13. Всем переменным присваиваются значения, равные их целочисленным нижним границам:

Viel, U,—]U,[, а соответствующее значение целевой функции запоминается.

Шаг 14. Организуется целочисленный массив D, содержащий |1| компонент, которые обнуляются. Каждый i-й элемент массива D ставится в соответствие массиву U,

Шаг 15. D(|I|)=D(|I|)+1

Шаг 16. Переменная j пробегает целочисленные значения от |I| до 1 с шагом -1. При каждом значении] проверяется содержимое]-ой ячейки массива D: если D(j)£ 2, то содержимое D(j) обнуляются, а величина D(j-I) увеличивается на единицу. Если в результате все компоненты D оказались нулевыми, то перейти к шагу 25, в противном случае - к следующему шагу.

Шаг 17. VI, U,= U,+D(i).

Шаг 18. Если , то перейти к шагу 16, в противном случае - к

шагу 15

Шаг 19. Вычисляется значение целевой функции:

Шаг 20. Если то перейти к шагу 21, в противном случае - к шагу 23.

Шаг 21. Величине Б присвоить значение, равное Ъ.

Шаг 22. Печать Б и вектора С

Шаг 23. У1,и,-=игО(0.

Шаг 24. Перейти к шагу 15

Шаг 25. Конец алгоритма. Последний выданный на печать вектор содержит оптимальные компоненты, которые вместе с компонентами, напечатанными на шагах 3 и 8, образуют оптимальный вектор.

Конечность алгоритма очевидна, т.к. на каждой итерации множество целочисленных переменных не уменьшается. Оптимальность решения гарантируется шагами

К недостаткам алгоритма 1 можно отнести сравнительно большой объем перебора и отсутствие учета целочисленного значения количества обращений к внешней памяти, что приводит к возможности получения не целочисленного значения величины К Последнее, однако, можно отнести к недостаткам модели (2), модификация которой, учитывающая целочисленность числа обращений к внешней памяти, имеет вид:.

Поиск решения задачи (6) предлагается осуществлять методом типа ветвей и границ, обладающим следующей спецификой:

а) реализуется фронтальный спуск по дереву ветвлений;

б) поиск прекращается, если выбранной вершине отвечает пустое подмножество новых вспомогательных массивов, размеры которых совпадают с соответствующими размерами массивов пользователя.

При этом используются следующие обозначения и определения:

Цхч) - путь из корневой вершины дерева ветвлений в вершину хч;

I - множество индексов массивов пользователя;

1(Ь(хч)) - индексы вершин, принадлежащих пути Ь(х).

Куст 0(Х,Ц) называется минимальным, если множество X состоит только

из вершины-источника и |и| вершин-стоков.

Алгоритм 2.

Шаг 1. Рекорду Я присваивается значение, равное +оо.

Шаг 2. Корневой вершиной дерева в(Х,и) является х5еХ, которой отвечает пустое множество индексов массивов Г(х5).

Шаг 3. На множестве висячих вершин построенной части дерева ветвлений выбирается вершина Хч с наименьшей оценкой. На первой итерации такой вершиной является корневая вершина дерева д=8.

Шаг 4. Если выбранной вершине отвечает пустое множество Г(хч), то перейти к шагу 8, в противном случае - к шагу 5.

Шаг 5. Генерируются вершины минимального куста, корневой вершиной которого является вершина, выбранная на предыдущем шаге, а висячие вершины отвечают индексам массивов, не отмеченных путем Цхч).

Шаг 6. Каждой висячей вершине хЛ построенного куста ставится в соответствие подмножество массивов, обладающих индексами 1(х<|)=1\1(Цха)).

Шаг 7. На множестве массивов Г(хЛ) решается задача (2), значение целевой функции которой является оценкой, отвечающей вершине хЛ. Эта процедура повторяется для всех вершин построенного куста. При решении задачи (2) следует учитывать, что величина У2 для каждой вершины х заменяется на величину Уг- . Если при этом оказывается, что полученная разность

отрицательна, то задача (2) не решается, значение целевой функции принимается равным . Перейти к шагу 3.

Шаг 8. Конец алгоритма. Индексы вершин, отвечающих пути Цхч), определяют массивы пользователя, присутствующие в оперативной памяти полностью, а оптимальные размеры вспомогательных массивов, используемых для сканирования остальных массивов пользователя, размещенных на жестком диске, определяются решением задачи (2), условия которой соответствуют вершине хч.

С учетом специфики дерева ветвлений верхняя граница числа единовременно хранимых в памяти оценок не превышает величины (Н+1)!.

Поскольку реализация обеих процедур связана с существенными затратами ресурсов компьютера, в следующей главе рассмотрены вопросы распараллеливания вычислений.

Четвёртая глава посвящена вопросам оптимизации параллельных реализаций простых зацикленных алгоритмов. Рассматривается ситуация, когда поиск решения исходной задачи обработки социально-экономической информации можно заменить параллельным решением нескольких задач, для

каждой из которых используется тот же алгоритм, что и для исходной задачи. В этих случаях исходная задача разбивается на ряд подзадач, решение каждой из которых может осуществляться параллельно с другими, и независимо от них в локальной вычислительной сети (ЛВС) или на многопроцессорном вычислительном комплексе (МВК). При этом обнаруживается, что распараллеливание вычислений влечет за собой возможность изменения целевой функции. Если минимизация времени, рассмотренная в предыдущих трех главах, однозначно определяет минимизацию стоимости решения задачи, то в параллельных вычислениях это связано с сокращением времени однократного решения исходной задачи за счет ее декомпозиции на Ъ подзадач. В этом случае, параллельное решение Ъ подзадач может привести к росту стоимости решения, так как стоимость единицы времени всех задействованных ресурсов возрастет.

Таким образом, распараллеливание вычислений приводит к различным критериям:

- минимизации стоимости решения исходной задачи;

- минимизации стоимости оборудования при условии, что время одной итерации не превышает заданной величины Т;

- минимизации времени одной итерации при ограничениях на стоимость используемого оборудования и однократное решение поставленной задачи.

В диссертации показано, что минимизация стоимости решения последней без учета ограничений может быть сведена к решению квадратного либо кубического уравнения, что зависит от детализации исходной модели. Таким образом, удалось получить аналитическое выражение, определяющее число организуемых параллельных процессоров Ъ. Более того, показано, что наличие ограничений сверху и снизу на величину Ъ не существенно усложняет задачу: обозначая целую часть корней вышеназванных уравнений р, максимальное допустимое число параллельных процессоров - Р, а стоимость организации вычислений р параллельными процессорами а((2), получим:

(5)

Анализ различных многокритериальных моделей распараллеливания циклических алгоритмов позволил выделить класс задач, для которых поиск решения может быть существенно упрощен.

Теорема 4.2. Если в многокритериальной модели распараллеливания простого зацикленного алгоритма критерии лексикографически упорядочены, то оптимальное решение зависит только от доминирующего критерия.

Иными словами теорема 4.2. позволяет свести поиск решения задачи распараллеливания к поиску решения традиционной оптимизационной задачи с одной функцией цели.

В Заключении подводятся итоги и описываются основные результаты исследования, представляющие собой теоретическое обобщение и развитие методов обработки больших массивов социально-экономической информации одно- и многомашинных системах с целью повышения эффективности решения задач электронной коммерции.

1. Проведен анализ функционирования системы ИМЦ, предназначенной для продвижения товаров и услуг на национальные рынки государств - участников СНГ.

2. Определены основные задачи электронной коммерции, которые включают организацию проведения маркетинговых исследований; поиск партнеров по проведению электронной торговли; рекламная деятельность по привлечению инвестиций в различные регионы и страны СНГ.

3. Показано, что эффективность решения этих задач связанна с разработкой быстродействующих методов обработки социально-экономической информации.

4. Определен класс программ с повторяющимися вычислениями, которые базируются на простых зацикленных алгоритмах, используемых для обработки социально-экономической информации.

5. Разработаны формализованные постановки задач по размещению основных и вспомогательных информационных массивов в компьютере, определены граничные условия, при которых возможно было получить решение исходной задачи в аналитическом виде. Это стало возможным за счет декомпозиции обобщенной задачи.

6. Доказана теорема, определяющая нижнюю границу числа обращений к внешней памяти в общем случае, на основе которой разработаны более эффективные алгоритмы обработки социально-экономической информации.

7. Разработаны эффективные алгоритмы обработки социально-экономической информации, в которых оптимизация размещения данных осуществляется одновременно с декомпозицией основной программы.

8. Разработаны стратегии управления многопроцессорной системой по обработке социально-экономической информации, которые позволяют существенно повысить быстродействие поиска решений задач электронной коммерции.

9. Разработан комплекс программных средств, реализующих технологию автоматизированного расчета по размещению основных и вспомогательных информационных массивов в компьютере. Экспериментальное исследование, разработанных автором алгоритмов показало их преимущество по сравнению с традиционными методами.

10. Разработана технология интегрированной оценки характеризующих инвестиционную привлекательность некоторых регионов России по материалам СМИ из Интернета.

Основные публикации по теме диссертации.

1. Иголкин А.А., Фельдман М.Д. Влияние СМИ на информационно -психологическую безопасность региона: возможность оценки методами контент-анализа // В сборнике докладов VI-й Международной НПК «Комплексная защита информации». Минск: ВНИИ ПВТИ, 2002. 0,3 пл./0,2 пл.

2. Фельдман М.Д., Росс Г.В. Об одном подходе оптимизации времени обработки больших информационных массивов в Интернете //В сборнике докладов VII-й Международной НПК «Комплексная защита информации». Минск: Объединенный институт проблем информатики НАН Беларуси, 2003. 0,2 п. л./0,1 п. л.

3. Фельдман М.Д. Оптимизация процесса обработки больших информационных массивов в Интернет// НТИ, серия 2. № 4,2003.1,2 п.л.

р-87 0 4

Отпечатано в типографии ООО "Флавиона" Объем 1,2 п.л. Тираж 100 экз. Заказ № 15/8

Диссертация: содержание автор диссертационного исследования: кандидата экономических наук, Фельдман, Михаил Давидович

Введение.

Глава 1. Проблемы оптимизации технологии обработки потоков социально-экономической информации в сфере электронной торговли.

1.1 .Основные направления реализации Международной программы создания сети ИМЦ для продвижения товаров -и услуг на рынки стран СНГ.

1.2. Разработка математических моделей выбора оптимальной технологии обработки информационных массивов.

1.2.1.Общие определения и обозначения.

1.2.2. Содержательные постановки задач.

1.2.3. Формальные постановки задач.

1.2.4. Основные свойства задачи и стратегии поиска ее решения.

1.3. Многокритериальная оптимизация.

Выводы.

Глава 2. Оптимальная декомпозиция зацикленного алгоритма поиска экономической информации.

2.1. Декомпозиция алгоритма с помощью выделения контуров возведением матрицы смежности вершин модифицированного графа в степень.

2.2. Декомпозиция зацикленных алгоритмов перебором замкнутых путей на графах.

2.3. Использование алгоритма поиска кратчайших путей на графе.

2.4. Минимизация объема используемой памяти.

2.5. Многокритериальная оптимизация и лексико-графическое упорядочение критериев.

2.6. Весовые коэффициенты целевых функций.

Выводы.

Глава 3. Размещение данных в памяти компьютера.

3.1. Формальные постановки задач.

3.2. Свойства оптимальных стратегий размещения данных.

3.3. Алгоритмы размещения данных в памяти ЭВМ.

3.4. Модификация модели и алгоритма.

Выводы.

Глава 4. Параллельная реализация обрабатываемой информации.

4.1. Постановка задач.

4.2. Поиск оптимальной декомпозиции зацикленного алгоритма.

Выводы.

Диссертация: введение по экономике, на тему "Оптимизация методов обработки социально-экономической информации в системах электронной торговли"

Актуальность проблемы. В настоящее время одним из мощных импульсов в развитии рыночных отношений в России может стать организация системы информационно-маркетинговых центров (ИМЦ), которые будут предназначены для продвижения товаров и услуг на национальные рынки государств - участников Содружества Независимых Государств (Программа работ утверждена Решением Совета глав правительств СНГ 29 ноября 2001 года). Основными задачами электронной коммерции, решаемыми в системе ИМЦ, являются организация маркетинговых исследований, проведение электронной торговли и рекламной деятельности по привлечению инвестиций в различные регионы и страны СНГ. Подключение к Интернету системы ИМЦ позволит участникам электронной коммерции обеспечить свое присутствие на глобальном уровне.

Первым шагом к электронной торговле для многих организаций является проведение маркетинговых исследований в интересах (или по заказам) инвесторов, производителей и иных хозяйственных субъектов ИМЦ, которые должны использовать маркетинговые данные в своих решениях. Эти задачи включают в себя определение спроса и предложений потребителей и поставщиков по видам продукций и услуг (анализ емкости рынка, прогнозирование объемов продаж, цен по определенным видам продукции и услуг); определение потенциальных потребителей и поставщиков, их финансово-экономические возможности; выявление потребительских свойств товаров и услуг, сегмент рынка и компоновка инвестиционных проектов с учетом ресурсных ограничений, логических связей (технического, технологического и организационного содержания) между вариантами привлечения исполнителей, вариантами технических решений, вариантами используемого оборудования, а так же целей.

В электронной торговле наблюдается быстрый процесс глобализации рынков, проявляющийся в том, что предприятия используют поставщиков компонентов в одной части мира, организуют сборочные операции в другой, а продают готовую продукцию в третьей. Такая деятельность должна включать в себя оптимальную процедуру, которая базируется на применении эффективных методов поиска партнеров. На практике колоссальный объем циркулирующей информации существенно усложняет проблему для покупателей и продавцов найти друг друга. Поставщики и торговые компании широко используют электронные базы данных о своей продукции. Хотя эффективное ведение баз данных отвечает интересам поставщиков, с точки зрения покупателей возникают сложности, связанные с необходимостью осуществления поиска по многочисленным базам данных.

Еще одним направлением, способствующим развитию электронной коммерции в Интернете, является организация проведения рекламной деятельности по инвестированию различных регионов и стран СНГ. Решение этой проблемы заключается в создании крупных сетевых информационных интеграторов новостей в области экономики, которые призваны собирать и давать объективную информацию по различным регионам России с целью привлечения туда инвестиций.

Каждая интересующая пользователя тематика, например, "банковская сфера" или "торговая сфера", в сутки может охватывать тысячи документов. В этом случае необходимо осуществлять мониторинг информационных ресурсов, который тесно связан с достаточно популярным методом анализа, таким как контент-анализ. Именно этот метод является перспективным направлением развития систем сетевой интеграции и рассматривается сегодня многими экспертами как контент-мониторинг, появление которого вызвано, прежде всего, задачей систематического отслеживания тенденций и процессов в постоянно обновляемой сетевой информационной среде.

Решение рассмотренных выше проблем организации маркетинговых исследований, поиска партнеров в электронной торговле и анализа больших объёмов социально-экономической информации для проведения рекламной деятельности по инвестированию различных регионов России и стран СНГ приводит к необходимости разрабатывать быстродействующие методы обработки социальной и экономической информации.

Основу таких программных средств составляют программные реализации простых зацикленных алгоритмов, которые используют повторяющиеся процедуры: по заданному поисковому образу осуществляется поиск соответствующих данных, которые запоминаются и вновь повторяются. Помимо этих процедур в состав поисковых систем могут входить и другие проблемно-ориентированные прикладные программы, осуществляющие тот или иной целенаправленный анализ.

Крупный вклад в развитие теории и практики создания оптимизационных моделей и методов обработки социально-экономической информации внесли многие отечественные ученые. В их числе: С.В. Емельянов, К.А. Багриновский, В.Н. Бурков, О.В. Голосов, В.О. Гроппен, И.Н. Дрогобыцкий, В.А. Ириков, В.В. Кульба, Б.Е. Одинцов, А.Н. Романов, С.В. Черемных и другие.

Усилиями этих ученых сложилась база для дальнейшего обобщения результатов и теоретических разработок на одном из самых актуальных направлений - разработке математических моделей и методов обработки больших массивов социально-экономической информации в автоматизированных информационных системах и сетях компьютеров.

Одной из основных парадигм современного программирования, таких как проблемно-ориентированное программирование и объектно-ориентированное программирование, является оптимальное программирование. Оптимальное программирование это система моделей и методов, позволяющая применительно к заданной триаде задача-алгоритм-компьютер создавать программное обеспечение, эффективно реализующее специфику этой триады.

Так, стремление к созданию универсального программного продукта противоречит концепции создания высококачественных программ, эффективно использующих ресурсы конкретных компьютеров, а сокращение трудозатрат программиста, связанное с применением виртуальной памяти, часто приводит к неэффективному использованию последней, повышающему время счета.

Традиционная технология обработки информации предполагает разработку структуры основных и вспомогательных массивов, их размещение в оперативной и внешней памяти компьютера, декомпозицию поискового алгоритма с тем, чтобы реализовать его в виде головной программы, присутствующей в оперативной памяти и взаимодействующей с ней в оверлейном режиме прикладными подпрограммами, размещенными на внешних носителях. Как правило, целью оптимизации выступает минимизация верхней либо нижней границы времени счета, затрат оперативной памяти, что определяется индивидуальностью программиста, а также его умением и навыками. Однако результаты разработок этих направлений достаточно скромные. Это связано с тем, что практические задачи имеют достаточно большую размерность и получение решений в реальном масштабе времени методами математического программирования сильно затруднено.

Попытка осуществить оптимальный выбор эффективного алгоритма организации вычислительного процесса для решения задачи обработки социально-экономической информации на имеющемся компьютере, лежит в основе предлагаемой в диссертации новой технологии проектирования программ, развитой применительно к программным реализациям простых зацикленных алгоритмов. Такие алгоритмы обработки социальноэкономической информации могут быть использованы для значительного числа задач электронной коммерции.

Используя существующие подходы, в диссертационной работе разрабатываются более эффективные средства автоматизации обрабатываемой социально-экономической информации. При этом целью автоматизации является оптимизация размещения программы, осуществляющей поиск необходимой информации, и самих информационных массивов в памяти компьютера или вычислительной системы с возможностями параллельной её обработки. К таким вычислительным системам относятся различные типы компьютеров (одно и многопроцессорные) и сетей компьютеров.

Исходя из вышесказанного, повышение эффективности алгоритмов обработки социально-экономической информации являются актуальной проблемой, требует дальнейших исследований, её решение позволит существенно улучшить качество принимаемых решений в электронной торговле.

Разрабатываемые в диссертационной работе модели и методы позволят существенно упростить технологию обработки информации, исключив некоторые процедуры, зависящие от человеческого фактора: размещение данных, декомпозицию алгоритма, создание вспомогательных массивов (при этом оптимальность и корректность самого алгоритма пользователя сомнению не подвергается). Они также дадут возможность получить некую разновидность виртуальной памяти, которая использует лишь программное обеспечение компьютера, оснащенного внешними носителями и обладающего трансляторами с языков высокого уровня.

Цель диссертации - разработка математических моделей и инструментальных методов оптимизации процессов обработки больших объемов социально-экономической информации в системах электронной торговли.

Для достижения указанной цели в диссертации поставлены и решены следующие задачи.

1. Проведен анализ современного состояния решения задач электронной коммерции, которые включают в себя маркетинговые исследования, поиск партнеров в электронной торговле, а также проведение рекламной деятельности по инвестированию различных регионов и стран СНГ в информационных системах и компьютерных сетях.

2. Исследованы традиционные технологии обработки информации и определены возможные пути их модернизации с целью повышения быстродействия.

3. Разработаны формальные постановки задач по повышению быстродействия технологии обработки информации за счет декомпозиции основной программы и эффективного размещения основных и вспомогательных массивов.

4. Усовершенствованы традиционные и разработаны новые эффективные методы организации процесса обработки социально-экономической информации, учитывающие специфику поставленных задач.

5. Проведены экспериментальные исследования разработанных алгоритмов на примере решения задачи формирования информационного сборника по инвестиционной привлекательности регионов России по материалам СМИ из сети Интернет.

Объект исследования - компьютерные системы и сети компьютеров, в которых циркулирует социально-экономическая информация, предназначенная для решения задач электронной торговли.

Предмет исследования - процессы обработки социально-экономической информации с помощью компьютеров и компьютерных сетей.

Методология исследования. Теоретическую и методологическую базу исследования составляет системный подход к моделированию сложных информационных систем.

В ходе проведения исследований использовались труды отечественных и зарубежных ученых в области математического и комбинаторного программирования. При решении конкретных задач были использованы научные работы в области теории вероятностей, математической статистики, теории графов, а также материалы научной периодики, конференций и семинаров.

Решение поставленных в диссертации задач потребовало применения методов комбинаторного программирования, функционального, статистического, системного и комбинаторного анализа, а также использование аппарата теории вероятностей и теории графов.

Диссертационная работа по своему содержанию соответствует пункту 2.5 паспорта специальности 08.00.13 - Математические и инструментальные методы экономики («Разработка концептуальных положений использования новых информационных и коммуникационных технологий с целью повышения эффективности управления в экономических системах»).

Научная новизна исследования заключается в решении научной задачи - повышение эффективности технологии обработки больших объемов социально-экономической информации для решения основных задач электронной коммерции.

Научную новизну содержат следующие положения.

1. Определен класс программ с повторяющимися вычислениями, которые базируются на простых зацикленных алгоритмах, используемых для обработки социально-экономической информации.

2. Разработаны формализованные постановки задач по размещению основных и вспомогательных информационных массивов в компьютере, определены граничные условия, при которых возможно было получить и решение исходной задачи в аналитическом виде. Это стало возможным за счет декомпозиции обобщенной задачи.

3. Доказана теорема, определяющая нижнюю границу числа обращений к внешней памяти в общем случае, на основе которой разработаны более эффективные алгоритмы обработки социально-экономической информации.

4. Разработаны эффективные алгоритмы обработки социально-экономической информации, в которых оптимизация размещения данных осуществляется одновременно с декомпозицией основной программы.

5. Разработаны стратегии управления многопроцессорной системой по обработке социально-экономической информации, которые позволяют существенно повысить быстродействие поиска решений задач электронной коммерции.

6. Разработан комплекс программных средств, реализующих технологию автоматизированного расчета по размещению основных и вспомогательных информационных массивов в компьютере. Экспериментальное исследование, разработанных алгоритмов показало их преимущество по сравнению с традиционными методами.

Практическая ценность работы заключается в том, что основные положения, выводы и рекомендации диссертации ориентированы на широкое применение математических моделей и инструментальных методов для разработки систем автоматизированного управления обработкой больших объёмов социально-экономической информации с целью повышения эффективности принятия решений в задачах электронной торговли.

Разработка математического и инструментального обеспечения системы управления обработкой информационных массивов позволило существенно увеличить её быстродействие за счет оптимальной организации обрабатывающих программ и информационных массивов.

Проведенные исследования и полученные результаты составляют теоретическую основу построения систем автоматизированного управления обработкой социально-экономической информации. Разработанные модели и методы направлены на решение практической задачи - повышение эффективности обработки больших объемов социально-экономической информации, циркулирующей в системах и компьютерных сетях. Результаты исследований доведены до конкретных методик, алгоритмов и программных комплексов.

Основные результаты исследования, имеющие практическое значение: технология автоматизации процесса обработки социально-экономической информации, реализация которой позволила повысить качество и сократить время принятия решений в задачах электронной коммерции; алгоритмы обработки социально-экономической информации, учитывающие специфику задач электронной торговли.

Апробация и внедрение результатов исследования. Проведенные в диссертации исследования непосредственно связаны с планами научно-исследовательских работ Всероссийского научно-исследовательского института проблем вычислительной техники и информатизации (ВНИИПВТИ). Основные выводы и предложения диссертации прошли экспериментальную проверку и были использованы в научно-исследовательских работах:

Прогноз развития российского сегмента Интернета до 2010 года» (Шифр «Прогноз-2002»)

Создание системы ИМЦ для продвижения товаров и услуг на национальные рынки государств - участников Содружества Независимых Государств на период до 2005 года».

Алгоритмы и программы будут использованы при разработке программного обеспечения ИМЦ для динамического оперативного размещения данных в памяти IBM-совместимых персональных компьютеров на основе накапливаемой статистики обращений.

Разработан комплекс моделей и программный макет автоматизации обработки больших объёмов социально-экономической информации для решения задачи формирования рекламного информационно-аналитического сборника регионов России, которые были использованы в НИИР Центра прикладных экономических исследований и разработок Государственного университета - Высшая школа экономики (ГУ-ВШЭ) (соответствующие акты о внедрении прилагаются к диссертации).

Результаты исследований внедрены в виде: пакета прикладных программ, который будет использован ВНИИПВТИ при разработке программного обеспечения ИМЦ для динамического оперативного размещения данных в памяти IBM-совместимых персональных компьютеров на основе накапливаемой статистики обращений.

Экспериментальная проверка была проведена при формировании интегрированного информационно-аналитического сборника для потенциальных инвесторов по рекламе наиболее привлекательных областей и регионов России.

Теоретические и практические результаты диссертационного исследования были также использованы при разработке компьютерной обучающей программы по курсу «Информационные технологии управления» для дистанционного образования студентов экономических специальностей Всероссийского финансово-экономического института ВЗФЭИ.

Основные положения диссертации докладывались и получили одобрение на следующих конференциях и семинарах:

1-й Международной НТК «Проблемы развития топливно-энергетического комплекса: экономика, политика, история» (Москва, Российский государственный гуманитарный университет, 2000);

- II-й Международной НТК «Проблемы развития топливно-энергетического комплекса: экономика, политика, история» (Москва, Российский государственный гуманитарный университет, 2001);

- VI-й Международной НТК «Комплексная защита информации» (Москва, Всероссийский научно-исследовательский институт проблем вычислительной техники и информатизации, 2002),

- VII Международной НТК «Комплексная защита информации» (Москва-Минск, Объединенный институт проблем информатики НАН Беларуси, 2003), а также на семинарах РГТУ, ВНИИПВТИ, ИПУ РАН и Финансовой академии при Правительстве Российской Федерации.

Публикации. По материалам диссертации опубликовано 3 печатных работы общий объём - 1,7 п.л. (авторский объем 1,5 п. л.).

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы, и приложения содержащего акты о внедрении результатов работы. Общий объем диссертационной работы 118 страница, содержащих машинописный текст и 20 схем.

Диссертация: заключение по теме "Математические и инструментальные методы экономики", Фельдман, Михаил Давидович

Выводы

В этой главе рассмотрены методы оптимизации, базирующиеся на разбивке задачи на несколько независимых подзадач, каждая из которых может решаться теми же алгоритмами, что и исходная. Это имеет смысл при наличии многопроцессорных ЭВМ, или ЛВС.

Заключение

Настоящее исследование посвящено актуальной проблеме оптимизации обработки информации в системах электронной торговли.

В последние годы наблюдается «взрывной» рост объемов торговли через Internet. Причем этот рост характерен не только для развитых стран Америки, Европы и Азии, но и для России и стран СНГ. Однако, как показывают исследования, почти половина покупок в онлайне срывается из-за медленной загрузки электронных магазинов, а плохое качество и недостаточная оптимизация сайтов - причины 82 % упущенных прибылей предприятий электронной торговли.

Выполненная автором работа направлена, в первую очередь, на создание быстрых и надежных методов обработки социально-экономической информации в системах электронной торговли, что позволяет решать многие наболевшие вопросы, которые препятствуют дальнейшему развитию электронной торговли. Основное внимание при этом уделялось оптимизации использования ресурсов ЭВМ в зависимости от решаемых задач. В частности, одной из важнейших задач была разработка алгоритмов эффективного распределения оперативной памяти в зависимости от выполняемой подпрограммы и объема информации, обрабатываемого этой подпрограммой. Решение этой задачи позволяет обрабатывать информацию с максимальной полнотой и скоростью.

В процессе диссертационного исследования были решены следующие задачи:

1. Проведен анализ функционирования системы ИМЦ, предназначенной для продвижения товаров и услуг на национальные рынки государств -участников СНГ.

2. Определены основные задачи электронной коммерции, которые включают организацию проведения маркетинговых исследований; поиск партнеров по проведению электронной торговли; рекламная деятельность по привлечению инвестиций в различные регионы и страны СНГ. Показано, что эффективность решения этих задач связанна с разработкой быстродействующих методов обработки социально-экономической информации.

3. Определен класс программ с повторяющимися вычислениями, которые базируются на простых зацикленных алгоритмах, используемых для обработки социально-экономической информации.

4. Разработаны формализованные постановки задач по размещению основных и вспомогательных информационных массивов в компьютере, определены граничные условия, при которых возможно было получить решение исходной задачи в аналитическом виде. Это стало возможным за счет декомпозиции обобщенной задачи.

5. Доказана теорема, определяющая нижнюю границу числа обращений к внешней памяти в общем случае, на основе которой разработаны более эффективные алгоритмы обработки социально-экономической информации.

6. Разработаны эффективные алгоритмы обработки социально-экономической информации, в которых оптимизация размещения данных осуществляется одновременно с декомпозицией основной программы.

7. Разработаны стратегии управления многопроцессорной системой по обработке социально-экономической информации, которые позволяют существенно повысить быстродействие поиска решений задач электронной коммерции.

8. Разработан комплекс программных средств, реализующих технологию автоматизированного расчета по размещению основных и вспомогательных информационных массивов в компьютере.

Ill

Экспериментальное исследование, разработанных автором алгоритмов показало их преимущество по сравнению с традиционными методами.

9. Разработана технология интегрированной оценки характеризующих инвестиционную привлекательность некоторых регионов России по материалам СМИ из Интернета.

Диссертация: библиография по экономике, кандидата экономических наук, Фельдман, Михаил Давидович, Москва

1. Балабанов И. Электронная коммерция. СПб.: Питер, 2001. 336 с.

2. Барский А.Б. Параллельные процессоры в вычислительных системах. М.: Радио и связь, 1990. 256 с.

3. Белов В.В., Воробьев Е.М., Шаталов В.Е. Теория графов. М,: Высшая школа, 1976. 392 с.

4. Берж К. Теория конечных графов и ее применение. М.: И.Л., 1962. 319 с.

5. Бройдо В.Л. Вычислительные системы, сети и телекоммуникации. СПб.: Питер, 2003. 688 с.

6. Бронштейн И.И., Панкова Л.А., Трахтенгерц Э.А. Замечания о параллельных алгоритмах и задача параллельного поиска экстремума// Вопросы кибернетики. 1972, № 3. С. 29-37.

7. Бурков В.Н., Рубинштейн М.И., Соколов В.Б. Некоторые задачи оптимального размещения информации в памяти большого объема// Автоматика и телемеханика. 1969, № 9. С. 83-91.

8. Бурков В.Н., Соколов В.Б. Оптимальное размещение информационных массивов в памяти на магнитных лентах для случая двунаправленного поиска//Автоматика и телемеханика. 1969, № 4. С. 107-117.

9. Ю.Бурков В.Н., Рубинштейн М.И., Соколов В.Б. Оптимальное управление памятью большого объема при нестационарной статистике обращений// Автоматика и телемеханика. 1969, № 10. С. 90-93.

10. П.Бурков В.Н., Заложнев А.Ю., Новиков Д.А. Теория графов в управлении организационными системами. М.: Синтег, 2001.124 с.

11. Вагнер Г. Основы исследования операций. Т. 2. М.: Мир, 1973. 488 с.

12. Вальковский В. А. Параллельное выполнение циклов. Метод параллелепипедов/ЛКибернетика. 1982, № 2. С. 49-52.

13. Вальковский В. А. Распараллеливание алгоритмов и программ. Структурный подход. М.: Радио и связь, 1989. 176 с.

14. Волков С., Достов В. Платежные механизмы современного Интернета. М.: «Мир Internet», 2000, №5. С. 22-28.

15. Вольфенгаген В.Э. Комбинаторная логика в программировании. Вычисления с объектами в примерах и задачах. М.: Центр ЮрИнфоР, 2003. 342 с.

16. Гаркавенко С.И., Бердникова А.С. Определение всех путей в ориентированном ациклическом графе//Кибернетика. 1979, № 4. С. 4952.

17. Голубев-Новожилов Ю.С. Методы повышения эффективности программирования. М.: МИЭТ, 1981. 78 с.

18. Гроппен B.C. Модели и алгоритмы комбинаторного программирования. Ростов-на-Дону: Изд. РТУ, 1983. 148 с.

19. Гроппен В.О. Принципы оптимизации программного обеспечения ЭВМ. Ростов-на-Дону: Изд. РТУ, 1993. 164 с.

20. Гуслистый А., Силантьев С. Логика опционной торговли. М.: Интернет-трейдинг, 2003. 344 с.

21. Димокер Д. Господство на вертикальных рынках//Сети и системы связи. 2000, № 4. С. 87-91.

22. Касьянов В.Н. Оптимизирующие преобразования программ. М.: Наука, 1988.336 с.27 .Козье Д. Электронная коммерция. М.: Русская редакция, 1999. 247 с.

23. Корбут А.А., Финкелынтейн Ю.Ю. Дискретное программирование. М.: Наука, 1978. 308 с.

24. Королев JI.H. Структуры ЭВМ и их математическое обеспечение. М.: Наука, 1978. 353 с.

25. Косоруков О.А., Мищенко А.В. Исследование операций. М.: Экзамен, 2003. 448 с.31 .Медведовский И.Д., Семьянов П.В., Леонов Д.Г. Атака на Internet. М.: ДМК, 1999. 187 с.

26. Мельников В.В. Защита информации в компьютерных системах. М.: Финансы и статистика, 1997. 364 с.

27. Найман Э.Л. Трейдер-Инвестор. М.: ВИРА-Р, 2003. 636 с.

28. Немнюгин С., Стесик О. Параллельное программирование для многопроцессорных вычислительных систем. СПб.: BHV. Санкт-Петербург, 2002. 400 с.

29. Овчинников В.А. Алгоритмизация комбинаторно-оптимизационных задач при проектировании ЭВМ и систем. М.: МГТУ им. И. Э. Баумана. 2001.288 с.

30. Пятибратов А., Гудыно Л., Кириченко А. Вычислительные системы, сети и телекоммуникации. М.: Финансы и статистика, 2002. 512 с.

31. Семенов Ю.А. Протоколы Internet для электронной торговли. М.: Горячая Линия Телеком, 2003. 744 с.

32. Таха X. Введение в исследование операций. М., 2001. 912с.

33. Трахтенгерц Э.А. Введение в теорию анализа и распараллеливания программ ЭВМ в процессе трансляции. М.: Наука, 1981. 256 с.

34. Уилсон Т. Центры электронной торговли: не может быть легких решений//Сети и системы связи. 2000, № 5. С. 102-107.

35. Филимонов А. Протоколы Интернета. СПб.: BHV-Санкт-Петербург, 2002. 528 с.

36. Фридл Дж. Регулярные выражения. СПб.: Питер, 2003. 464 с.43 .Фролов А.В., Фролов Г.В. Глобальные сети компьютеров. М.: Диалог-МИФИ, 1996. 256 с.

37. Хамел P.JI. Последовательная передача данных. Руководство для программиста. М.: Мир, 1996. 752 с.

38. Харари Ф. Комбинаторные задачи перечисления графов//Прикладная комбинаторная математика. М: Мир, 1968. С. 107 140.

39. Холмогоров В. Интернет-маркетинг. Краткий курс. Изд. 2. М., 2002. 272 с.

40. Штернберг Л.Ф. Разработка и отладка программ. М: Радио и связь., 1984. 88 с.

41. Юрасов А.В. Электронная коммерция. М.: Дело, 2003. 480 с.

42. Якубайтис Э.А. Классификация вычислительных сетей//Автоматика и вычислительная техника. 1983, №1. С. 3 6.

43. Иголкин А.А., Фельдман М.Д. Влияние СМИ на информационно -психологическую безопасность региона: возможность оценки методами контент-анализа//Сборник докладов VI-й Международной НПК «Комплексная защита информации». Минск: ВНИИ ПВТИ, 2002. 0,3 п.л.

44. Barstov D., Shrobe П., Sanderwall Е. Interactive Programming Environments. New York: Me Graw Hill, 1984. P. 387-413.

45. Cameron J.R., Campbell A., Ward P.T. Comparing software development methods: example. Information and software technology. July/August 1991, vol 33, Number G. P. 386 402.

46. Codd E.F. A relational model for large shared banks. Communications of the ACM, 1970, № 13. P. 377-387.

47. Cox B. Message/object programming : An Evolutionary change in programming technology. IEEE Software, 1984, January. P. 50-61.

48. Daley R.C. Neumann .P.G. A General Purpose File System for Secondary Storage, Proc. FJCC, 1965. P. 213-229.

49. Danserau D.F., Holley C.D. Development and evalution of a text mapping strategy. Discourse Processing. Amsterdam: North Holland, 1982. P. 536554.

50. During D.M., Backer C.A., Gould J.D. Data organization. Human Factors, 1977, № 19. P. 1-11.

51. Faro A., Messina G. Parallel processing in computer communication. Int. Conf. on Parallel Processing. N.Y., 1981, Aug. 25-29. P. 294 296.

52. Graves M. Designing XML Databases Prentice Hall Computer Books, 2003. 655 p.

53. Groppen V.O., Abasa M.G.I. Intelligent databases for computer memory optimal control usage for programming study period shortening. Proceedings of the first International Conference on Distance Education in Russia,

54. Moscow, 5 8 July, 1994. P. 298-300.

55. Herot C.F. Spatial management of data. ACM Transactions on Database System. 1980, N 5. P. 493-514.

56. Kamae Tarahiko. A systematic method of fining all directed circuits and enumerating all directed paths. IJcc, 1965. P. 213-229.

57. Kay A.C. Computer software. Scientific American, 1984, N 251. P. 53-59.

58. Knuth D. Literate programming. Computer Journal. N 27 (2), 1984. P. 97111.

59. Malone T.W., Grant K.R., Turbak F.A., Brobst S.A., Cohen M.D. Intelligent information-sharing systems. Communications of the ACM, N 30, 1987. P 390-402.

60. Abasa M. Computer aided system of optimal data distributiоп//Тезисы докладов Международной научно-технической конференции "Новые информационные технологии в образовании". Владикавказ, 1994. С. 29.

61. Motus. Time concepts in real-time software. Control Engineering Practice. (Journal of IFAC), Vol. 1. N 1. 1993, February. P. 21 33.

62. Shneiderman B. Direct manipulation: A step beyond programming languages. IEEE Computer, 1983, N 16 (8). P. 57-69.

63. Tvugu E. Knowledge based programming environments. Knowledge -Based Systems. Vol.4, N 1. 1901, March. P. 4 - 15.

64. Weyer S.A., Borning A. A prototype electronics encyclopedia. ACM Transactions on Office Information Systems. 1965, N 3(1). P. 66-88.

65. Weyer S.A. The design of a dynamic book for information search. International Journal of Man-Machine Studies. 1982, N 17. P. 87-107.

66. Zemankova M., Kandel A. Implementing imprecision in information systems. Information Science. N 37, 1985. P. 107-141.