Моделирование взаимодействия конечных пользователей с ЭВМ тема диссертации по экономике, полный текст автореферата

Ученая степень
кандидата экономических наук
Автор
Данг Конг Тьен
Место защиты
Москва
Год
1993
Шифр ВАК РФ
08.00.13
Диссертации нет :(

Автореферат диссертации по теме "Моделирование взаимодействия конечных пользователей с ЭВМ"

РГ6 од

1 5 ноя 1093

МИНИСТЕРСТВО НАУКИ, ВЫСШЕЙ ШКОЛЫ И ТЕХНИЧЕСКОЙ ПОЛИТИКИ РОССИЙСКОЙ ДЕЛЕГАЦИИ

ГОСУДАРСТВЕННАЯ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ АКАДЕМИЯ УПРАВЛЕНИЯ имени Серго Орджоникидзе

На правах рукописи

Данг Конг Тьен

УДК'

1ЯДЕЛИРОВАНИЕ 1Ш!йЭДБ1СТВКЯ КОНЕЧНЫХ ПОЛЬЗОВАТЕЛЕЙ С ЭВМ

Споциальность 08.00.13 -"Эжпомлио-математические методы"

Автореферат диссертации на соискание ученной степени кандидата экономических наук

Москва 1993

,илРотл n.'nojiKf'Ha г. Госудлр"ТЕ?н)гой ордена Трудового КрПСНСГП МНЧ^т; аг-адечии упранления имени (Jepro Орджоникидзе .

Научный руководитель : Kmгдît.t;пт экономических наук, доцент Е.И. МОИСЕЕВА

Официальные оппоненты: Доктор технических наук, профессор Ю.М. ЧЕРКАНОВ Кандидат экономических наук, доцент В.Л. 13ЕГЕРЛ

Ведущая организация: Центр регионапыгого научно-технического сотрудничества "РЕНЛТЕХС" при Президиуме Российской академии наук

Зацэта состоится ¿¿¿•SiJ^j 19УЗ г. в часов

:ia заседании спацнапипированного совета ГЛУ

по адресу: ЮОЬ'.й, Москва,.Рязанский проспект, 99.

i ¡правки по телефону: 371-26-11

Автореферат разослан " " CO&lïltplJ? 1903 гсда.

У'-.'снкглГ секретарГ'

::.\-:«?:îpc~.nr.ucro егггта

/Л.Д. ЛКРЛ.М9ВА/

В настоящее время мало остается тех, кто не знает что такое ЭВМ, но как обращаться не все знаот с ними . Несмотря на то, что существует многочисленное количество программных средств, работающих в диалоговом режиме с пользователями, проблема взаимодействия с неподготовленных пользователей остается актуальной.

^ Решение этой проблемы может осуществляться в следующих направлениях:

1. Повышение компьютерной грамотности (введение новой дициплины "Основы информатики" в программе обучения в школах) .

2. Совершенствование технической базы информатики.

3. Разработка программных средств, оказывающих помощь неподготовленным пользователям, для работы с информационной системой (в частности,с БД) без предварительной подготовки.

В-настоящее время проблема общения заключается в том, что-)все большее число людей, зная, что они хотят от ЭВМ, ке сягаит, как ато осуществить. Существует два подхода к решению, проблемы общения. Оба базируются на анализе истории языковой практтш взаимодействия человека с ЭВМ её нынешнего состояния; Они стоят на разных концах процесса "естественный язык - искусственный язык". По сущности каждый из подходов пытается найти ¡сомпромисс между июли. Основные отличия - поиск компромисса. Суть первого подхода состоит в стремлении "очеловечить" формальные языки, второго формализовать естественный язык. Естественно, с динамическим процессе!,* развития вычислительной техники и искусства программирования оба подхода сокрапрвт расстояние между естественным и искусственным языком. Какой подход да»т больший эффект ? Трудно д<_.г> сер-""

йзный ответ на данный вопрос. Если проанализировать историю развития формальных языков общения с ЭВМ от машинной ' команды, через ассемблер, затем фортран, алгол, кобол, ил/1 , то молно назвать первый. При этом возникают трудности, связанные с появлением посредников между ЗВМ и конечными пользователями. Спецподготовка последних равносильно изучению иностранным языкам.

В данной работе рассмотрен один из аспектов первого направления, а имено,вопрос взаимодействия конечных пользователей с базами данных на естественных языках ( на примере вьетнамского).

Научная новизна заключается в предложенях по моделирован»® процессов общения конечных пользователей с ЭВМ вообще и в частности, с базами, данных. Предложен и программно реализован алгоритма поддержания функционирования интерфейса общения конечных пользователей с базами данных на вьетнамском языке на основе морально устарелых моделей ПЗВМ и СУБД.

Принципиально, результаты исследования в диссертации могут быть применима не только во Вьетнаме, но и там, где существуют следующие условия: уровень компьютеризации не высок .применение ЭВМ приносят экономический эффект народному хозяйстве за счет низкой цены аппаратуры и бесплатно полеченных копий программного обеспечения (СУБД, срок де&стпк». лицензии.. которых истек).

Структур*» раоо!к: /Диссертация состоит из вьодсни». четырех главы, «закЕочекня, приложений и списка литератур-:.

В глат' 1 анализируется состояние использования Эй! б Ссииалистич*гкой Республику Вьетнама и характеристики ка- -о-

го этапа . Результаты анализируемых ситуаций доказывает актуальность темы исследования. Представляет интерес предлагаемая классификация конечных пользователей.

-> Косвенные КП

КП—1-> Прямые КП-

-> КП, работающие в пакетном режиме

->КП, работающие в — диалоговом режиме

—>Непрограммирующие КП

-> Программирующее КП

Рис.1.1. Схема классификации КП,

<-1

| Запрос | пользователя)-

Ответ СУБД | из БД |<-

СУБД |

+ ЯОД |

+ ЯМД Ь-+ Диалоговое]

средство |

+ Сервис |<-

+ Другие |

БАЗА

ДАННЫХ

>

Рис. 2.1 Схема &У1Гкциоирога;:;:я БД. В главе 2 рассмотрены средства взаимодействия конечных

- û -

пользователей с Сазами данных :

- СУБД liait средство взаимодействия пользователей с БД, функции БД и их ограничения при общении с конечными неподготовленными пользователями. Схема традиционного функционирования СУБД иллюстрируется рис.2.1.

■ - Необходимость и возможность общения конечных польао-

I I

I Конечный

I I

пол-тель Не-

расширенная СУБД |

I I-1

I-1 I-1 I I

-Н Интерфейс h—н С У И—H БАЗА

■4 К П h-il Б Д -II ДАННЫХ

-J-H ' I v

Jl

л

J-

| Опытные пользователи, | | администрация БД. |

I_!

Рис.2.3 Структура системы общения 1Ш с БД на основе расширенной СУБД (интерфейс + СУБД).

вателей с БД на ЕЯ: Решение проблемы сйлшдшшн KU и щ,|

'очки зрения совершенствования программных средств путём )ааработки нового поколения СУБД, способствующих общению о СП на ЕЯ, требует ЭВМ с более большой памятью и скоростью эбработки данных. Наша задача состоит в совершенствовании ;уществующих СУБД для того, ^чтобы КП могли общаться с БД госредством этих СУБД и на основе моралыго-устаренных ПЭВМ. Зариант совершенствования СУБД представляется в рис.2.2

Если мы обратим внимание на источник происхождения сонцепции БД, то сама последняя была ролдена на принципе «элдектнвного использования данных, следовательно, сам язык збщения с ней естественно стремится к человеческому и это ?стествонный путь совершенствования языков общения пользователей с БД.

- На основе анализа существующих систем общения конечных пользователей с БД (PARMAX- итальянский язык, СЛФИРрусо-прлдг^тпп сбтезя схема интерфейса общения конечных кш.80вят<?лей с БД на ЕЯ (рис.2.3)

В 3 рассмотрен вопрос моделирования общения с БД.

Яля обсуждения подходов к разработке интерфейса общения ; 5Л необходимо рассмотреть модель пользователей , модель запросов и в конкретном случае особенности ЕЯ. '•моде;.;! тюльвовтгрля:

Пеш>гсвят«7ь ратсматрирк»тся кял соггжуппость некоторое ♦.«ргиег?рн~тяк п - прплтчнмч точек'грония. Няпример. с точкп греикя проИссисчпль!!':•« >'г,ал5г!'Н1"л:и!1 в по°лметной оОлсстн,

г. 7. .Ff"T"rjc тт-ляпетг«! тс-" "ИП»ЧГЬ гяч»отво •тнечич."

ИНТЕРФЕЙС

I Начало работы |

I--1

I Ввод сообщения. Н

г

| Анализ сообщения |-.-,-.

I Конечный пол-тель |

Т

I I

т

I

т 8

I

-л-

I I-1 I

-, | |СУБД1 | ,-

| Формирование I I I и I I I Формирование | | запросов к СУБД НН КМ ответов КП. I

1-1 | | БД | | '-1

_1 I_1 I_

Рис.2.3 Схема функционирования интервепса обивная КП с БЛ.

пользователей. Как мы отметили в (п. IV), система должна обладать возможностями по обучению пользователей в накоплении навыков общения с системой. Модель пользователей должна выражать кэлпчесиенуо оценку этого процесса. Лопустпм, имеются п КП, 1-1,2.....п.

Для решения своей задачи они обращают к БД с запросом Zij. - это запрос Zi~ обращение к системе в j-ом

разрезе, где j=l,2,...,1. Пусть, tjj - время обработки запроса 2ц,

Siд - количество обучающих текстов, которые система представляет в процессе реализации \ запроса Zj j.

В процессе общения с системой часть этих обучаюида текстов КП запомнит и в следующем сеансе их не следует выдавать, следовательно, при любом i, 31> 32 истинны следующие выражения:

Если ji<J2 --> Sij2 <= Siji и tij2 <= tiji Для Pi существуют неотрицательные значения Sj и Ti, та-, кие, что

5i = Sa " S ; Ti = tu -T (1).

Где : S = min { S,j > ; T = rnin < tjj >. Величина Si представляет собой количество дополнительных сообщений, выдаваемых системой КП Pi в 1-ом разе для реализации запроса'Z (Z - это запрос-тест). Она^показьтает, какова квалификация КП Pi, запоминающего сообщения (рекомендации) системы во времени работы. Чем меыпее S,, тем более высокой квалификации обладает пользователь Pi.

Величина Ti предсталяет собой дополнительной время, в котором КП Pi и система взаимодействуют между собой, чтобы пользователь Pj получил ответ. Эта величина равна сум/. -• времени, затрачиваемого системой на реализация диалога, используемого КП (время мышления, ■ набора сообгэния на клавиатуре). ■Мы назовём первое ТС,, второе TPi

Таким образом, для запроса-теста 2. кавдый пользователь характеризуется

Р1 = -1 Бь ТС1( ТР, > (К).

Эта модель называете!! статистической моделью, поскольку предполагает, что все полъвователи выдают абсолютно одинаковые запросы (запрос-тест).

На практике, у каждого пользователя есть свой масс запросов Поэтому в общем случае модель пользователя имеет вид:

Р, = < г1, ТС1, ТР £ > (3).

Модели пользователя позволяет классифицировать пользователей по параметрам модели (3). Это очень полезно для адаптации в соответствии с уровнем пользователей. Модель (3) носит название динамической.

Модель запросов: Все существующие запросы пользователей момга разделиться на три группы:

а ЕЯ-запрос т.о. запрос на естественных языках (для неподготовленных пользователей, не имеющих достаточного огшта оайоти с системой)-

-а Эаирео о (¡/икопровашшй структурой (для ояитап иоям.-о-;;;-л'ел'Зй).

■•'• Запрос лпроктива (д.':;-. с:-;сТ1?!.:Н:,\ м ".

:... ., р..чип ! .

сои:

г - ( кч, кч. сч > (4).

Здесь порядок в модели (4.) не имеет значения. Запрос Z комет находился в одной из вести возможных перестановок трон параметров. Модель (4),носит название формальной.

Сценка сложности группы пользователей БД: Взряомоя г» модели (2), Г-л { Si( TClf TPi } , !.:с.:1ю рассматривать модель (2) как степень взешепоикмэнка ивдцу iJt 11 свстюэй (Вй). Напртдер, если КП слаб по информа-т-:.:о, то Si, ТС,., ¡'Pi оудут больше; а скегсиа со слсСь-м обеспечением обусловливает увеличение андчзккя шг;.:модел:;.

i ¡:o::c.\i::< S< , ТС;, ъ снстенз координат, то

Г. 1.:с.г:;:т рассь'атрпгат.'.ся кс;: тс-'^д ^ тр^хгернем 'л:, к.'л::;:;"!! начало кссрдинат <0,0. С>. Тогда р,.сс-

!'.3.-;"V точл:;:: .;о;;г?;л\:'тг:!с7

ТР>;<0,ТС,ТР>; <0, ТС, 0>;<5, ТС, 0>;0, 0>;{3щ, 0, 0>;<0, ТСщ, 0}; {0,0,ТРт>; <Зп„ТСт,0>; <Зл,0,ТРт>; -(О, ТСт, ТРт> ; -(Зт.ТСтДРт}.

Таким образом, чем разнообразнее пользователи, тем больше многогранник. Иначе говоря, объём (V) многогранника характеризует степень сложности группы пользователей.

V = (Бт * ТСт * ТРшЫБ * ТС л ТР) (6).

Формула (б) показывает,что значение V косвенно зависит от п (количество Кпользователей в группе). Конечно, чем больше п, тем больше возможностей увеличения V.

Значение К = п/У (7) называется "плотностью пользователей" и характеризует однородность группы пользователей.

Анализ степени сложности группы пользователей помогает нам предварительно оценить совместимость между пользователями и системой. На основе значения К мы будем принимать решение о совэрщенствованиии системы или о предварительной подготовке пользователей. Естественно, здесь возникает вопрос, как оценить предельно-допустимое значение К ? Но нашему мнению значение К моле? определиться опытным путём и оно зависит от конкретной системы. Это очень сложный вопрос, он не может рассматриваться в рамках данной работы.

Модель пользователей, запросов и сложности группы пользователей являются основой для проектирования и разработки интерфейса общения пользователей с БД на ЕЯ, с одной стороны (пользователя). С другой - это СУБД, структуры базы данных и предметной области. Татам образом, в обще;.; случае интерфейс П на ЕЯ строятся на основе следувгих аспектов: я пользователей.

* Модели запросов, в том числе особенностей ЕЯ.

* Сложности группы пользователей.

* СУБД, структуры РД и.её предметной области.

В главе 4 дана методика разработки интерфейса общения с

БД.

Сначала проведен анализ трудностей в процессе разработку пользовательского интерфейса с БД и общей схемы диалогового процессора и ее структуры (рис.4.2)

I I

| М Т Н-

1-г-'

г

Н п в м т Нп

I-.1 I

| | АНАЛИЗАТОР

I I-:-1-—

запрос! i-*—i i-^-1 i—%—i i

-н А К [•-н А И Ч 8-н л С Н-Н

-"1

ответ г

а " ' ж " '

I I! 13 1 -!■ - I

II 1 I

СИНТЕЗАТОР

Нч

Рис. 4. 2 С7Р\':СТУР"-Л с:<<?!<Л ДП 2 ,~.<ЗСТКОП сссмоа -ПЛГССП.

В соответствии ' с тремя компонентам запроса в составе анализатора иотчадт анализ командной части (ДК), анализ информационной части (АКЧ) и анализ ситуации (АС). Процесс распознавания запроса осуществляется в соответствии с принятой формой запроса в три этапа с помощью машинного тезауруса (МТ). На первом этапе анализируется командная часть запроса V. устанавливается требуемый ремы работи системы. На втором этапе анализируется информационная часть запроса и если нудно выявлять саиСку пользователя. Третии ехал - анализируется ситуаиия fусловие извлечения информации). Результаты этих ■этапов кспакьвуатся пптерг.ретенором для формирования формального запроса к ЕЯ, сор..-.&шг;Л1 ээпзос ¡¡з^от быть ксмаоц-ноп стоской или ксмаклним ГаЫХ.сл «ила *.rRö СУБД. Синтезатор :c;.;y;!"oh:.lT1. отг.-v у.:.:. F.'!;.

Д ..■::;■:.• сссбсчшсстн пегнамжаго лайка.

0-к:Тгл.:..о:-.'лй ¿¡.:-ух.:'.7а состо.л из 20 букв латшгокого с. '..угу.:.;::;: ::: : о''.о. d.i. л. и', с и 5 тшгас удсрешы нн-- ::•-.;: (:::>') иугагл-.п, образом, ыолно СЧИ-

•:vb. что а.-: "jv.-.t г.:-го.ч;^;,.^:-;:то нв^ка соотсглч. (о точки ьро-

- Il:

0: о 0, o, с, с

d: tí, 0, d, ç'

и : ù, 11 u

ii

s ; >

У 1 / > V » y

Согласных

v з, с, d, d, g, h, к, i, m, p, q, r, s, t, v,x.

Сам вьетнамский алфавит состоит на 29 букв, но при учете ударений интонации он достигает 69 символов, которые необходимо кодировать. Отсюда проблема вьетк^вкацки более слокиая чем руссг.фи.'иции. Саыый слокла зьетификация клавиатура. Вооо1й>деолть д*ил-»о букв трэбуит минимально 178 байтов к кодовой странице для строчного и заглавного шрифтов- ото /;ве третьих кодовой сграгиады. А на клаьиатуре сл^догсныэ !"'!лвн;.:и только Ü3. В настопц:м; л о Вьетнаме существуют

некоторое вэризити вьотиия;^:!:! кль'игятури. Болыынзтво hô них имитируют процесс насори тсксча .¡а п;:.:;у:.;уъ малту, >. ;. используют •¡)у!П'.ц;:она:;ы!::-:' (.или/и ynpv. "^ггумА клав пни ;тлл чгл'с, ч'гсои изменить сгаи-иод кл:-.:-.;;;:;:, рп"ш::;а vv.av/ Т'"-r.TiK'i ?! nc:;o.:::-;.o;v;;;!;í ряг;гых 'Нункциснг-ль;;:-:х к-чя-о;::';. ;,ру/'0'Л ::cí. j '<■: м v¡ :1 г - ' " /.ч о!"': ■_■*:■:<-i.1:-;

словосочетание,на вьетнамском языке не изменяет форму,

* Предложение: как языковая единица предложение на вьетнамском языке представляет собой совокупность связанных определенными типами связей словосочетаний и (или) слов,представляющую собой воконченную по смыслу синтаксическую единицу.

Отличия вьетнамского от русского языка состоят в том, что слова в предложении на вьетнамском языке находятся- в строгом порядке. Т.е. каждая расстановка предложения превратит его в новом предложении (новое содержание) или несмысловое предложение.

Таким образом, модель запросов

г « < кч, ич, -сч >

в вьетнамском языке нет эквивалента в других расстановках . Иначе говоря, модель запросов на вьетнамском языке задается жесткой формой.

Рассмотрены некоторые характеристики СУБД РохВазе+, на основе которой будет работать интерфейс.

И последнее: предложен алгоритм распознавания запросов на вьетнамском яаыке.

Первый тип: вапроо, вадаемый вопросительным предложением, имеет следующий вид:

Вопросительное слово + условия?

Между компонентами могут быть или не быть союзы.

Второй тип: запрос задается следующим:

Повелительная форма глагола + требуемая информация -н-условия.

Обобщенный алгоритм распознания запросов к БД на ЕЯ.

Как уже было отмечено в практике нет систем, в которых общение КП происходит полностью на ЕЛ. Предлагаем алгоритм распознания простых вапросов на вьетнамском языке.

Запрос должен иметь туи

КЧ [;] CIÎ43 { союз > СЧ.

Где:

КЧ - Слова или словосочетания, юторые принадлежат СКС;

ИЧ - Слова или словосочетания, которые принадлежат СИС;

СЧ - Логические выражения в естественной форме.

Шаг 1: Нормализация эапроса КП.

Расстояния между слонами запроса, набранного пользователем, не всегда равны одному пробелу или ' разделителю типа ".", "," или ":". Нормализация валроса представляет собой процесс выбрасывания лишних пробелов в запросе.

Шаг 2: различит КЧ от ИЧ и СЧ.

Если КЧ требует подсчитать количество, то переход

if пату 4.

Иначе к сагу 3.

Шаг 3: различить 114 от СЧ и преобразовать естественную форму имени атрибутов БД в формальном виде.

Шаг 4: расшифровать СЧ. Аналогично иагу 3 но тодысо касается СЧ.

Шаг Б: Формировать запрос к БД на языке, понятном СУБД.

Пр1!мечание: па ^о.см г:are от, й до 4 если встречаться негснятное слово, то сесбгпть польаовато.та о пеСЗ;:одк"ости пере вводить запрос.

Результат!.' у ~'.'/:с■ и''' прг.^еня^тсп в

ГЛбС'Т1'0 И ЛОДД°р."'г1м1!П 'i: V H i "III ! С '1 ¡* ПС В J ï i ПI ^ТН'^рМсЩНОЧЧОЧ С1*~Т?~

мы при посольстве СРВ в Москве.

В приложении к диссертации имеются блок-схемы реализации алгоритма, а также часть листинга программы, написанной автором на языке Турбо-Си фирмы Вог1алс).

1ШЖ-СХЕМЛ АЛГОРИТМ НОРМАЛИЗАЦИИ ЗАПРОСОВ

1 - Длина запроса в байтах, Л (1), 1 =Т7Т - Запрос 1<П.

. ' _ ________I

_ __

I !

1 = 1

А (1) =' *

-а-1 1 = П+1 I

| А(П)=А(3}

: Г) - Г,+1

п < 1

11-1 К

ч

ШШ-ОХГСЛА АЛГОРИа .1 Г, РАОГСЗНАВАКШ! КОУЩДЧОП) с;.п03Л В НСВШШЗОПШЮМ ЗАПРОС!'.

АЦ) - Нормализованный запрос.

1Л(}) - Место окончания оого слова в запросе.

КЭ, КС, КО - Три компоненты словари командных слов.

¡'шах ~ Длина словаря командных слов.

В(к) - Буфер.