Управление субъектами экономики на основе анализа информационных ресурсов внешней среды тема диссертации по экономике, полный текст автореферата

Ученая степень
кандидата экономических наук
Автор
Черноусова, Надежда Андреевна
Место защиты
Москва
Год
2009
Шифр ВАК РФ
08.00.05
Диссертации нет :(

Автореферат диссертации по теме "Управление субъектами экономики на основе анализа информационных ресурсов внешней среды"

/

На правах рукописи

ЧЕРНОУСОВА Надежда Андреевна

УПРАВЛЕНИЕ СУБЪЕКТАМИ ЭКОНОМИКИ НА ОСНОВЕ АНАЛИЗА ИНФОРМАЦИОННЫХ РЕСУРСОВ ВНЕШНЕЙ СРЕДЫ

Специальность 08.00.05 - Экономика и управление народным хозяйством (теория управления экономическими системами)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата экономических наук

Москва 2009

003487232

Диссертация выполнена на кафедре Управления знаниями и прикладной информатики в менеджменте Московского государственного университета экономики, статистики и информатики (МЭСИ).

Научный руководитель:

Официальные оппоненты:

Ведущая организация:

Доктор технических наук, профессор Селетков Сергей Николаевич

Доктор экономических наук, профессор Ильенкова Светлана Дмитриевна

Кандидат экономических наук, профессор Хорошилов Александр Владиевич

Российский государственный институт интеллектуальной собственности (РГИИС)

Защита состоится «25» декабря 2009 года в 10.00 на заседании диссертационного совета Д 212.151.03 в Московском государственном университете экономики, статистики и информатики (МЭСИ) по адресу. 119501, г. Москва, ул. Нежинская, д. 7.

С диссертацией можно ознакомиться в библиотеке Московского государственного университета экономики, статистики и информатики (МЭСИ).

Автореферат разослан «25» ноября 2009 г.

Ученый секретарь диссертационного совета . .

кандидат экономических наук, доцент Е.А. Грачева

I. Общая характеристика работы

Актуальность исследования.

Современная ситуация в экономике в условиях глобализации и развития общества, основанного на знаниях, характеризуется возрастающей ролью информационных ресурсов. Субъектам экономики (любым юридическим лицам вне зависимости от формы собственности, в том числе индивидуальным предпринимателям), учитывая жесткую конкуренцию и экономический кризис, необходима полная и достоверная информация о внешней среде, которая лежит в основе эффективного управления.

Актуальность темы подтверждается подписанием на государственном уровне важных международных и российских документов - Окинавской Хартии глобального информационного общества (2000 г.), Тунисского обязательства (2005 г.), Стратегии развития информационного общества в Российской Федерации (2008 г.) и ряда других документов. В Стратегии развития информационного общества в Российской Федерации отмечается, что целью формирования и развития информационного общества в Российской Федерации является повышение качества жизни граждан, обеспечение конкурентоспособности России, развитие экономической, социальной, политической, культурной и духовной сфер жизни общества, совершенствование системы государственного управления на основе использования информационных и телекоммуникационных технологий. То есть, в условиях информационного общества конкурентоспособность субъектов российской экономики напрямую связана с возможностью обеспечения принимаемых решений своевременной, полной и достоверной информацией, накопленной всем мировым сообществом, в том числе хранящейся в мировых информационных ресурсах.

В настоящее время сеть Интернет стала одним из наиболее быстро развивающихся средств доступа к мировым информационным ресурсам, активно применяемых субъектами экономики для изучения внешней среды (совокупности условий, в которых протекает деятельность субъекта

экономики, хранящихся в информационных системах). Улучшение качества управления субъектом экономики за счет повышения эффективности использования информационных ресурсов внешней среды, является актуальной задачей, что обусловливает выбор тематики данного исследования.

Степень разработанности проблемы.

Исследованию проблем в области управления субъектами экономики посвящены работы Ильенковой С.Д., КотлераФ., МесконаМ., Орехова С.А.; в области управления информационными ресурсами - Антопольского А.Б., Гиляревского P.C., Захарова В.П., Родионова И.И., Селеткова С.Н., Соколова A.B., Тельнова Ю.Ф., Хороши лова A.B.; в области компьютерной лингвистики - Белоногова Г.Г., Гумбольта В., Калинина Ю.П., НагаоМ., Соссюра Ф.; в области теории познания - Алексеева П.В., Панина A.B., Спиркина А.Г., Уемова А.И.; в области проблем поиска информации в сети Интернет - Босова A.B., Колисниченко Д.Н., Ющука Е.А. и ряда других.

Многие проблемы управления информационными ресурсами в той или иной мере нашли свое отражение в монографиях, коллективных сборниках, учебных пособиях и статьях. Тем не менее, в большинстве работ ресурсы сети Интернет недооценены как источник информации о внешней среде субъекта экономики. В этой связи остаются недостаточно исследованными проблемы повышения эффективности поиска информационных ресурсов внешней среды, размещенных в сети Интернет.

Актуальность и недостаточная проработанность проблем, связанных с эффективностью использования информационных ресурсов внешней среды субъекта экономики, размещенных в сети Интернет, определили выбор темы, цели и задач диссертационного исследования.

Цель и задачи диссертации.

Цель диссертационного исследования заключается в теоретическом обосновании и практической реализации механизмов совершенствования поиска и оценки содержания информационных ресурсов внешней среды

субъектов экономики с целью повышения их конкурентоспособности и качества принимаемых управленческих решений.

Для достижения цели диссертационного исследования поставлены и решены следующие задачи:

1. Определить потенциал информационных ресурсов внешней среды в процессе управления субъектом экономики;

2. Оценить качество информационных ресурсов внешней среды субъекта экономики, размещенных в сети Интернет, на основе анализа их структуры и содержания;

3. Провести сравнительный анализ современных технологий поиска в сети Интернет и выявить факторы, влияющие на качество поиска;

4. Определить критерии оценки эффективности поиска информации поисковыми средствами сети Интернет.

5. Определить эффективность использования поисковых средств сети Интернет для контент-анализа информационных ресурсов внешней среды субъекта экономики;

6. Разработать механизм совершенствования средств поиска информационных ресурсов внешней среды субъекта экономики в сети Интернет.

Объект и предмет исследования.

Объектом исследования является субъект экономики.

Предмет исследования - процессы поиска, переработки и анализа содержания информационных ресурсов внешней среды субъекта экономики.

Теоретическая и методологическая основа диссертации.

Теоретической и методологической базой исследования послужили труды отечественных и зарубежных ученых в области управления экономикой и их элементами, информатики, компьютерной лингвистики, теории познания, а также прикладные исследования по проблемам поиска информационных ресурсов.

Для решения поставленных задач в работе применялись общенаучные

методы системного, функционального, сравнительного и контент- анализа.

Информационную базу исследования составили данные государственных статистических органов, материалы научно-практических конференций, публикации в СМИ российских и зарубежных ученых, законодательные акты и нормативные документы Российской Федерации, учебные и справочные пособия, материалы Интернет-ресурсов.

Научная новизна исследования.

Научная новизна заключается в разработке механизма совершенствования поиска информационных ресурсов внешней среды субъектов экономики в сети Интернет для повышения качества принимаемых управленческих решений. Наиболее существенные результаты, полученные лично автором и составляющие научную новизну:

1. Установлено, что в задачах исследования внешней среды субъекта экономики информацию можно условно разделить на две группы: информация, связанная с рисками (для которой обязательным требованием является её полнота) и не связанная с рисками в деятельности субъекта экономики. Применяемые в настоящее время поисковые средства информационных ресурсов в сети Интернет не обеспечивают полноту поиска, что не позволяет использовать ресурсы сети Интернет как основной источник информации при принятии управленческих решений.

2. Выявлены факторы, оказывающие основное влияние на качество поиска в сети Интернет: объем информационных ресурсов сети Интернет не позволяет хранить их копию в инвертированном массиве, как этого требуют алгоритмы поисковых систем, применяемых в сети Интернет; владельцы сайтов ограничивают доступ поисковых систем к своим ресурсам; неоднородность сети Интернет не позволяет поисковой системе проиндексировать все сайты, перемещаясь по ссылкам; в сети Интернет поиск документов осуществляется по ключевым словам, что не реализует задачу выявления смысла. Перечисленные факторы обусловливают необходимость совершенствования механизмов организации поиска

информационных ресурсов внешней среды субъекта экономики.

3. Определен обобщенный критерий оценки эффективности поиска информации поисковыми средствами сети Интернет - «полнота просмотра ресурсов Интернет», под которым понимается отношение просмотренных поисковой системой или каталогом ресурсов сети Интернет, к общему количеству ресурсов сети Интернет. Максимальный показатель полноты просмотра для поисковой системы Интернет составляет 4%. Это позволило сделать вывод, что потребитель, работая с поисковой системой, обращается с запросом не ко всем ресурсам сети Интернет, а к их малой части.

4. Разработан механизм организации поиска информационных ресурсов внешней среды субъекта экономики на основе смешанной системы, заключающийся в сохранении существующей системы текстовой информации и создании дополнительной базы формализованных описаний субъектов экономики и производимых или реализуемых ими товаров и услуг на основе классификаторов. Система позволит использовать информационные ресурсы сети Интернет для изучения внешней среды субъекта экономики, необходимой при принятии управленческих решений, поскольку обеспечивает максимальную полноту поиска и возможность интеграции информации по заданным критериям.

Работа соответствует п. 1.22 «Эффективность и качество управления организацией» паспорта специальности 08.00.05 - Экономика и управление народным хозяйством (Теория управления экономическими системами).

Теоретическая и практическая значимость работы заключается в развитии современных механизмов информационной поддержки при принятии управленческих решений за счет эффективного использования ресурсов Интернет. Содержащиеся в работе выводы и положения являются базой для дальнейших исследований в области использования сети Интернет для информационного обеспечения принимаемых управленческих решений.

Разработанный механизм позволяет многократно увеличить эффективность поиска информационных ресурсов внешней среды субъекта

экономики, и может служить основой для усовершенствования средств поиска в сети Интернет. Полученные результаты могут быть использованы при чтении курсов, связанных с изучением внешней среды субъектов экономики и мировых информационных ресурсов.

Апробация результатов исследования.

Основные результаты диссертационной работы докладывались на IV Российской научно-методической конференции «Совершенствование подготовки 1Т-специалистов по направлению «Прикладная информатика» для инновационной экономики» (Москва, 2008); на XII Научно-практической конференции «Реинжениринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями».

Отдельные положения работы были использованы в учебном процессе Московского государственного университета экономики, статистики и информатики при подготовке учебных пособий по курсам «Мировые информационные ресурсы», «Деловые ресурсы Интернет», «Разработка электронного портала» и «Разработка приложений электронной коммерции», а также в исследованиях, проведенных соискателем для научно-исследовательской работы по конкурсу грантов Министерства образования и науки Российской Федерации на 2008-2009 гг. «Теоретические основы повышения эффективности анализа деловой и образовательной информации в Интернет пространстве» и для научно-практической деятельности ООО «Межвузовское агентство международного консалтинга».

Публикации.

Основные положения диссертационной работы опубликованы в 5-ти печатных работах общим объемом 0,75 печатных листов, в том числе одна статья опубликована в издании, рекомендованном ВАК (0,2 п.л.).

Объем диссертации и ее структура.

Работа состоит из введения, трех глав, заключения, списка литературы из 129 наименований и 2 приложений. Диссертационная работа изложена на 119 страницах машинописного текста и содержит 11 таблиц и 15 рисунков.

II. Основное содержание работы

Во введении обоснована актуальность темы, ставятся цель и задачи исследования, формулируются основные положения, выносимые на защиту. В соответствии с поставленной целью в диссертации исследованы три группы проблем.

Первая группа проблем связана с исследованием потенциала информационных ресурсов внешней среды в процессе управления субъектом экономики, проведением контент-анализа информационных ресурсов внешней среды субъекта экономики в сети Интернет.

Появление и распространение Интернет-технологий определило новые возможности для управления субъектами экономики в электронной среде -реклама, торговля, прием и передача платежей, консультационные услуги, поиск информации.

Наиболее полно удовлетворяются потребности пользователей сети Интернет в части электронного обмена данными (электронная почта, аудио-и видеоконференции, рассылки, форумы, службы мгновенной передачи сообщений). Активно развивается торговля через сеть Интернет - количество покупок за два года возросло на 40%, около 85% пользователей Интернет во всем мире когда-либо совершали покупки в сети, а более половины опрошенных совершают их ежемесячно. Для обеспечения продаж в сети Интернет все чаще используются системы электронных платежей, хотя в России такие системы менее популярны, чем за рубежом, из-за недоверия населения к системе безопасности. Сеть Интернет широко используется для рекламы: оплачиваемая реклама, партнерские программы, вирусный маркетинг, онлайновые сообщества, рассылки по электронной почте, онлайн-аукционы, механизм «Назови свою цену».

Первоначально разработчики сети Интернет не рассчитывали, на то, что она станет глобальной информационной системой, поэтому при её создании не предъявлялось никаких требований, в частности, - сближение средств описания исходного документа и запроса.

Тем не менее, это не помешало сети Интернет стать крупнейшим средством доступа к информации, в том числе необходимой при исследовании внешней среды субъекта экономики. В частности, для эффективной деятельности любого субъекта экономики необходимо изучать конкурентов, реальных и потенциальных покупателей. Перед каждым субъектом экономики встает вопрос о целесообразности инвестиций в ту или иную деятельность, при этом решение во многом зависит от природы и интенсивности конкуренции, количества конкурентов и характеристики производимых товаров или услуг. Однако сеть Интернет в первую очередь ориентирована на представление информации для индивидуального потребителя (погода, расписание движения поездов, спортивные новости и прочее), а не на потребности субъекта экономики. Поэтому требуется анализ степени удовлетворения потребностей субъектов экономики при использовании информационных ресурсов сети Интернет в процессе управления.

Информация - сведения (сообщения, данные) независимо от формы их представления. Деловая информация - это информация, используемая для принятия решений в предпринимательской деятельности, позволяющая повысить эффективность бизнеса и приводящая к росту прибыли организации. К деловой информации относится биржевая и финансовая, статистическая, коммерческая, а также деловые новости. К деловой информации предъявляются самые жесткие требования, так как на её основе руководителями принимаются решения, которые влекут риски в деятельности компании. Обязательным требованием к информации такого типа является полнота.

Для субъектов экономики в условиях рыночных отношений потребности в информации делятся на две группы:

• Потребности в информации о собственных ресурсах (внутренняя информация) - 10-15% от общих потребностей субъекта экономики в информации;

• Потребности в информации о внешней среде - 85-90% от общих потребностей субъекта экономики в информации.

Основными источниками информационных ресурсов внешней среды субъекта экономики в сети Интернет являются:

1. Международные, всероссийские и региональные информационные, аналитические, консалтинговые и маркетинговые агентства;

2. Всероссийские, региональные, тематические газеты, журналы, телевизионные каналы и радиостанции;

3. Электронные издания, существующие только в сети Интернет и не имеющие какой-либо иной формы распространения;

4. Сайты государственных учреждений;

5. Универсальные серверы, каталоги, базы данных.

Используя вышеуказанные источники, субъект экономики может получить сведения о внешней среде, которая включает такие элементы, как потребители, конкуренты, правительственные учреждения, поставщики, финансовые организации, источники трудовых ресурсов. Для принятия управленческих решений, связанных с рисками в деятельности субъекта экономики, необходима информация, обладающая максимальной полнотой. Контент-анализ информационных ресурсов внешней среды субъекта экономики показал, что в ресурсах сети Интернет можно найти качественную информацию, которая располагается на сайтах интернет-изданий традиционных журналов и газет, теле- и радио- каналов, информационных агентств, которые завоевали доверие потребителей, а также на официальных сайтах государственных учреждений и в электронных справочниках. Анализ показал, что сеть Интернет обладает колоссальным потенциалом для развития деятельности субъектов экономики, так как объединяет и покупателей, и продавцов. Однако хаотичность развития сети Интернет не позволяют использовать информационные ресурсы с максимальной пользой. Основная проблема заключается в сложности нахождения необходимой информации, отсеивании информации, не относящейся к искомой тематике,

интеграции информации из различных источников, объективной оценке качества найденной информации.

Вторая группа проблем связана с исследованием технологий поиска информации в сети Интернет, оценкой того, насколько они удовлетворяют требованиям пользователей ресурсов сети Интернет в качестве информационной базы при принятии управленческих решений, анализом основных направлений развития поисковых систем в сети Интернет.

Информацию в сети Интернет можно отыскать с помощью поисковых систем и каталогов.

В мире создано более 2000 поисковых машин, которые работают по следующим принципам: поисковая машина ищет новые сайты и просматривает уже имеющие в базе сайты: просмотр сайтов происходит периодически, примерно, 1 раз в месяц. Однако по ряду причин поисковая система просматривает не все сайты и не все страницы сайта, в большинстве случаев игнорирует стоп-слова, остальные слова считает ключевыми, запоминает их в инвертированном массиве, на основании которого в любое время (не связанное с индексацией сайтов) предоставляет пользователю список сайтов в соответствии с указанными в запросе ключевыми словами. На рис. 1 представлена схема работы поисковой системы в сети Интернет.

а

Пользователь

Наиболее используемыми поисковыми системами в России по данным статистического сервера SpyLog в 2009 году являлись:

1. Поисковая система Яндекс (http://wvvw.yandex.ru) - используют 49,50% пользователей;

2. Google (http://www.google.ru) - 33.93%;

3. Mail.ru (http://www.mail.ru) -9,61%;

4. Рамблер (http://www.rambler.ru) - 3,38%;

5. Другие поисковые системы - 3,58%.

Часто в ресурсах сети Интернет фигурируют определения «релевантность документа», «релевантность информации», которые подразумевают степень соответствия найденных документов или информации запросу пользователя. Однако использование этого термина в данном случае некорректно, так как изначально под релевантностью подразумевалось «объективное существующее смысловое соответствие между содержанием документа и запроса. Объективность оценок релевантности обеспечивалась тем, что они устанавливались экспертным путем, а не автором запроса»1. Поскольку эксперты не могут просмотреть весь массив документов сети Интернет, и оценить, какие из выданных документов релевантны, а какие - нет, использовать термин «релевантность» применительно к сети Интернет нельзя; можно говорить только о том, что может влиять на то, какие документы выдаются в ответ на запрос пользователя, и в какой последовательности.

Другой способ поиска информации в ресурсах сети Интернет -каталоги. Посредством каталогов навигация в сети осуществляется на основе специальных указателей, представляющих собой тематические «деревья», строящиеся на основе иерархических классификаций. Большинство каталогов имеют средства поиска информации по ключевым словам. По оценкам специалистов в сети Интернет насчитывается более 700 систем-

1 [Соколов A.B., Информационно-поисковые системы: Учеб. Пособие для вузов/Под ред. А.Б. Рябова. - М.: радио и связь, 1981]

каталогов.

Благодаря тому, что размещением информационных ресурсов в рубриках каталогов занимаются эксперты, повышается степень соответствия поискового результата смысловой потребности пользователя, но существенным недостатком каталогов является то, что объем обрабатываемой экспертами информации невелик (количество веб-страниц в лучших каталогах исчисляется тысячами, а в поисковых системах счет идет на миллионы). Например, крупнейший Интернет-каталог Open Directory Project («открытый каталог» - www.dmoz.org) включает чуть более 4,5 миллионов веб-сайтов (по данным на май 2008). В то время как в 2008 году одна из самых популярных поисковых систем - Google, по данным TechCrunch, индексировала около 40 миллиардов веб-страниц. Поисковой системой Яндекс в августе 2008 года проиндексировано около 5 миллиардов страниц, а в то же время в каталоге Яндекс был зарегистрирован всего 95 391 сайт. По данным компании OCLC средний размер сайта составляет 441 страницу. Приведенные данные сопоставлены в табл. 1.

Таблица 1

Сравнительная характеристика поисковых машин и каталогов в Интернет

Наименование поисковой системы/каталога Количество сайтов в базе данных поисковой системы/каталога

Поисковая система Google 90 702 247

Поисковая система Яндекс 10 890 872

Каталог Open Directory Project 4 500 ООО

Каталог Rambler 1 474 965

Каталог List.ru 105 694

Каталог Yandex 94 560

С постоянным ростом сети Интернет увеличивается объем размещенной в ней информации, растет и количество пользователей, которые обращаются к поисковым машинам и каталогам. Все это приводит к повышению требований, предъявляемых к поисковым средствам. Обращаясь к поисковой машине или каталогу, пользователь хочет получить ответ на свой запрос в соответствии с его потребностями в информации. Однако

14

современные поисковые машины не выявляют их смысл, а ищут сайты, в текстах которых встречаются слова, указанные пользователем в запросе.

Однако по мнению исследователей в области компьютерной лингвистики, в качестве основных единиц смысла следует рассматривать не отдельные слова, а устойчивые фразеологические сочетания, выражающие понятия, отношения между понятиями и типовые ситуации. При прочтении текста у читателя, как и у автора текста, возникнет определенный мыслительный образ. Целью передачи информации с помощью текста является не столько исчерпывающее описание мыслительных образов его автора, сколько инициация процесса порождения соответствующих мыслительных образов у читателей. Поэтому текст не столько "выражает", сколько стимулирует и "намекает", и значительная часть его содержания оказывается "между строк"2. Правильность положения, что компьютер без участия человека не может выявить смысл из текста, подтверждается рядом решений на государственном уровне по вопросам машинного перевода, которое также связано с автоматическим выявлением смысла.

В 2000 году специалисты компаний AltaVista, IBM и Compaq описали математическую модель топологии Web-пространства (рис. 2).

Рис. 2. Модель топологии Web-пpocтpaнcтвa Исследования показали, что сеть Интернет - это не единое цельное пространство, его структура неоднородна: на многие страницы нет переходов

2 [Белоногов Г.Г. Теоретические проблемы информатики. Том 2.Семантические проблемы информатики / Под общей редакцией К.И. Курбахова. - М.: КОС ИНФ, 2008]

15

с других страниц, следовательно, и поисковая машина не сможет их обработать, переходя по ссылкам на страницах, как это заложено в алгоритме работы поисковой системы. Данный факт приводит к тому, что не достигается полнота информации, получаемой из ресурсов сети Интернет, являющая основным требованием для изучения информационных ресурсов внешней среды субъекта экономики.

Оценка эффективности информационно-поисковых систем осуществляется по критериям полноты и точности поиска. Полнота для поисковых систем представляет собой отношение количества найденных релевантных документов к общему числу релевантных документов в базе. Точность - это степень соответствия найденных документов запросу пользователя. Поскольку объективно оценить полноту и точность поиска в поисковой машине в сети Интернет невозможно, введем критерий оценки эффективности поиска в деловых ресурсах сети Интернет - «полнота просмотра ресурсов Интернет», который рассчитывается как отношение количества просмотренных поисковой машиной ресурсов сети Интернет к общему количеству ресурсов в сети Интернет.

По данным Google, летом 2008 года в сети Интернет насчитывалось около 1 триллиона веб-страниц, 40 миллиардов из которых он проиндексировал. Таким образом, полнота просмотра ресурсов сети Интернет Google равна 4%, что является максимальным показателем для поисковых систем сети Интернет (рис. 3).

Рис. 3. Полнота просмотра ресурсов Интернет поисковой системой Google В соответствии с этими данными, поисковая система при обработке запроса пользователя работает не со всеми ресурсами сети Интернет, а только с его малой проиндексированной частью. Схема работы поисковой

системы сети Интернет представлена на рис. 4.

Рис. 4. Схема работы поисковой системы в сети Интернет Как правило, в информационно-поисковых системах по науке и технике, объем которых на порядки меньше ресурсов сети Интернет, коэффициент полноты поиска обычно составляет 50—60%, а коэффициент точности — 40—50%. В полнотекстовых поисковых системах сети Интернет эти показатели намного ниже. Причем, если показатель точности дается пользователю в непосредственном восприятии, то потери релевантных документов остаются незамеченными.

В табл. 2 приведены сравнительные характеристики наиболее популярных поисковых систем и каталогов в сети Интернет и рассчитана их полнота просмотра.

Таблица 2

Сравнительная характеристика поисковых машин и каталогов в Интернет по

критерию полноты просмотра Интернет

Наименование поисковой системы/каталога Количество в базе данных Полнота просмотра Интернет, в %

сайтов страниц

Поисковая система Google 90 702 247 40 000 000 000 4

Поисковая система Яндекс 10 890 872 4 802 874 860 0,45

Каталог Open Directory Project 4 500 000 1 984 500 000 0,2

Каталог Rambler 1 474 965 650 459 565 0,07

Каталог List.ru 105 694 46 611 054 0,004

Каталог Яндекс 94 560 41 700 960 0,004

Анализ показал, что существующие методы совершенствования средств поиска в сети Интернет не исправляют основных недостатков

поисковых машин. Метапоисковые системы поиска информации осуществляют поиск по нескольким базам поисковых машин, однако они не учитывают индивидуальные настройки каждой поисковой машины, и на практике метапоисковые машины показывают результат поиска как у худшей поисковой машины. Карта сайта призвана решить проблему невидимой части сети Интернет, однако поисковые машины по техническим причинам не могут обработать весь массив ресурсов сети Интернет. Использование библиотечных классификаторов также не решает проблем при поиске информации, так как при описании сайта указывается общая, а не конкретная информация о ресурсе, что не позволяет осуществлять поиск по конкретным параметрам. Специализированные каталоги предприятий, например, europages.com, не исправляют недостатков, отмеченных в обычных каталогах, кроме того, поиск в них осуществляется по ключевым словам, что приводит к отсутствию единых средств описания информации источником и потребителем.

Подводя итог сказанному, можно сделать вывод, что поисковыми машинами просматривается мизерная часть информационных ресурсов сети Интернет, не превышающая 4% от общего объема ресурсов сети Интернет. В ответ на запрос к поисковой машине пользователь получает информацию не из всех ресурсов сети Интернет, а лишь просматриваемой данной поисковой машиной части. Данный факт не позволяет использовать поисковые системы Интернет для поиска информационных ресурсов внешней среды, для которых требуется максимальной полноты, и которые используются для принятия управленческих решений.

Показано, что поиск по ключевым словам, используемый в поисковых системах и каталогах сети Интернет не реализует задачу выявления смысла. При этом анализ показал, что в существующей схеме поиска не используется никаких средств единообразного описания исходной информации и запроса. При проектировании большинства поисковых машин не используются теоретические разработки и технологии, проверенные на практике, в области

теории познания, психологии, лингвистики и ее раздела- компьютерной лингвистики. Отсутствие публикаций результатов количественного анализа характеристик поиска информации в сети Интернет по полноте выдаваемой информации и информационному шуму вводит потребителя в заблуждение. Потребитель, как правило, не представляет, что объем не выданной, но удовлетворяющей его потребности информации, в несколько раз превышает объем выданной. Изменить данные оценки в реальной практике при существующей технологии поиска не представляется возможным, так как многие владельцы сайтов в интересах безопасности сами закрывают доступ поисковых систем сети Интернет к своей информации.

Третья группа проблем связана с разработкой механизма совершенствования средств поиска в сети Интернет информационных ресурсов внешней среды субъекта экономики, что позволит значительно повысить эффективность использования информационных ресурсов сети Интернет для принятия управленческих решений.

Информационно-поисковая система представляет собой функциональную систему, предназначенную для хранения и поиска информации. Поиск информации - это процесс отыскания в информационно-поисковой системе документов, соответствующих поступившему запросу. Поиск информации разделяют на два типа: документальный и фактографический.

Документальный поиск осуществляется в базе данных, содержащей информацию самого разного типа: текстовую, графическую, звуковую, мультимедийную. Поисковые системы сети Интернет относятся к документальному типу.

Фактографический поиск представляет собой поиск фактов, непосредственно отвечающих на запрос. В фактографических базах данных содержатся краткие сведения об описываемых объектах, представленные в строго определенном формате. Фактографическое описание - совокупность данных (признаков, характеристик), относящихся к некоторому объекту

(процессу, явлению). Главным достоинством фактографических поисковых систем является полнота выдачи информации, равная 100%.

В данной работе произведена попытка создания смешанной системы, способной осуществлять не только документальный, но и фактографический поиск, чтобы удовлетворять потребности пользователей, для которых обязательным требованием является максимальная полнота информации для исследования внешней среды. Для этого создается формализованное описание наиболее важной информации сайта, которое используется в фактографической поисковой системе. Поскольку наиболее важная информация для каждой области специфична, то и формализация выполняется для конкретной области, в данном случае описание сайта субъекта экономики.

В основном сайты субъектов экономики создаются с целью распространения информации о производимых ими товарах или оказываемых услугах. Объем информации, которую необходимо формализовать, составляет не более 1 одной страницы, что составляет 0,25% от среднего объема сайта. Однако такая информация позволит найти всех поставщиков, конкурентов и партнеров. При этом в базе указывается адрес сайта, в котором хранится текстовая информация.

Информационный язык фактографических систем предназначен для описания объектов (фактов). При этом в фактографической системе хранится ограниченный состав объектов и свойств объектов. Информационным языком должны пользоваться как источники, так и пользователи, поэтому они должны иметь одну основу. Базы данных должны отображать реальный мир в соответствии со структурой модели отображения реальной действительности в сознании человека. В соответствии с выводами теории познания, психологии и лингвистики модель отображения реальной действительности в сознании человека выглядит следующим образом: в процессе чтения текста в результате мыслительной деятельности в сознании человека создается образ, основанный на знаниях, которыми владеет

читатель, соответствующий восприятию содержания текста. Человек познает реальный мир через объекты, свойства и отношения.

В настоящее время существует много подходов организации модели данных. В данной работе было принято решение использовать объектовую (объектную) модель, или как ее называют другие исследователи, концепцию предикатно-октантной структуры. Под объектом понимается все, что имеет свойства: физическое лицо, организация, товар, услуга, событие, действие и прочее, то есть то, что интересует человека в его деятельности. Схема организации формализованного описания представлена на рис. 5.

База организаций л ¿А \ -у?- / База товаров и услуг

Рис. 5. Организация формализованного описания Для стандартного описания юридических лиц и товаров на основе контент-анализа реестров и бизнес-справочников, была сформирована форма, содержащая информацию, необходимую для идентификации юридического лица или индивидуального предпринимателя, и указания реализуемых и потребляемых ими товаров и услуг (Табл. 3):

Таблица 3

Идентифицирующие признаки юридического лица и индивидуального предпринимателя

Юридическое лицо Индивидуальный предприниматель

Наименование Фамилия, Имя, Отчество

Организационно-правовая форма Пол

Форма собственности Дата и место рождения

Руководитель Данные документа, удостоверяющего личность

Численность Дата регистрации в качестве индивидуального предпринимателя

Год основания ИНН, дата постановки на учет в налоговом органе

Адрес (юридический и почтовый) Адрес (юридический и почтовый)

Телефон Телефон

Юридическое лицо Индивидуальный предприниматель

Факс Факс

Адрес в сети Интернет (url) Адрес в сети Интернет (url)

Адрес электронной почты (e-mail) Адрес электронной почты (e-mail)

Филиалы Коды по ОКВЭД

ИНН Продукция и услуги

Коды по ОКВЭД Используемые сырье и материалы

Продукция и услуги Информация по состоянию на

Используемые сырье и материалы

Информация по состоянию на

Некоторые реквизиты юридических лиц и индивидуальных предпринимателей могут выбираться из справочника, сформированного на основе соответствующего классификатора, что позволит единообразно описывать информацию при регистрации сайта в фактографической поисковой системе и при его поиске.

Для единообразного описания реквизитов субъектов экономики предлагается использовать следующие классификаторы: ОКСМ, ОКАТО, ОКФС, ОКОПФ, ОКВЭД. Для описания реализуемых или потребляемых товаров или услуг целесообразно использовать классификатор ОКПД.

Накопление в базе данных формализованных описаний субъектов экономики и реализуемых товаров и услуг позволит осуществлять поиск по заданным критериям. В частности, система позволит со 100% полнотой найти, например, всех производителей обуви в Москве, или все предприятия в Екатеринбурге, использующие в качестве сырья муку.

База данных формализованного описания сайтов субъектов экономики

предлагается в качестве дополнения к существующим текстовым поисковым

системам, что позволит обеспечить автоматическую интеграцию

информации по различным критериям, образуя из фрагментов обобщенное

описание реального мира. Способность поисковой машины автоматически

обобщать информацию, раскрывая смысл текста, переведет поисковые

машины сети Интернет на качественно новый уровень и откроет новые

возможности для их развития как систем автоматической обработки

информации в интересах максимального удовлетворения требований

22

пользователей. Затраты на описание субъекта экономики и реализуемых товаров или услуг единовременные и не превышают 1% от стоимости создания сайта. Ввод сведений производится либо за счет владельца сайта, либо как дополнительная услуга, предоставляемая специалистами поисковой системы. Таким образом, будут удовлетворены потребности пользователей в информационных ресурсах внешней среды, получаемых из сети Интернет, при полноте, равной 100%.

По данным Росстата в 2009 году из 4 771 900 организаций в Российской Федерации имели свой веб-сайт 19,8%. Таким образом, необходима формализация менее 0,0001% от общего количества сайтов и около 0,002% от количества сайтов, проиндексированной лучшей поисковой системой сети Интернет.

Фактографические системы многократно реализованы в мировой практике, что подтверждает их высокую эффективность в части полноты поиска. Использование фактографического описания переведет сеть Интернет на качественно новый уровень, ввиду 25-кратного увеличения полноты поиска. Реализация такого подхода существенно снизит последствия информационного кризиса и поднимет на новый уровень качество информационного обеспечения принимаемых решений.

В заключении обобщены основные положения проведенного исследования, сформулированы выводы и предложения, обозначены возможные направления дальнейших научных и практических разработок.

Основные публикации по теме диссертации:

Статьи в журналах, рекомендованных ВАК для публикаиии результатов диссертационных работ:

1. Черноусова Н.А. Анализ возможностей поиска социально-экономической информации в Интернет // Труд и социальные отношения - 2009, №6 (60). -0,2 п.л.

Прочие статьи:

2. Черноусова H.A. Технологии организации поиска, извлечения и анализа знаний на примере Интернет // XII Научно-практическая конференция «Реинжениринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями» (РБП-СУЗ-2009). Сборник научных трудов / Московский государственный университет экономики, статистики и информатики - М., 2009. - 0,15 п.л.

3. Черноусова H.A. Эффективность поиска деловой информации через поисковые системы Интернет // «Модели экономических систем и информационные технологии». Сборник научных трудов (Выпуск XVII) / Финансовая академия при Правительстве РФ - М.: 2008. - 0,2 п.л.

4. Черноусова H.A. Анализ эффективности поиска деловых ресурсов в Интернет // Совершенствование подготовки IT-специалистов по направлению «Прикладная информатика» для инновационной экономики. Сборник научных трудов IV Российской научно-методической конференции / Московский государственный университет экономики, статистики и информатики - М., 2008. - 0,1 п.л.

5. Черноусова H.A. Проблемы поиска информации в Интернет для обучающихся экономическим специальностям // Совершенствование подготовки IT-специалистов по направлению «Прикладная информатика» для инновационной экономики. Сборник научных трудов IV Российской научно-методической конференции / Московский государственный университет экономики, статистики и информатики - М., 2008. - 0,1 п.л.

Подписано в печать: 25.11.09. Объем: 1,5 усл. печ. л. Тираж: 100 экз. Заказ № 227. Отпечатано в типографии «Реглет» 119526, г. Москва, пр-т Вернадского, 39, тел.:(495) 363-78-90 www.reglet.ru