Моделирование взаимодействия конечных пользователей с ЭВМ тема диссертации по экономике, полный текст автореферата
- Ученая степень
- кандидата экономических наук
- Автор
- Данг Конг Тьен
- Место защиты
- Москва
- Год
- 1993
- Шифр ВАК РФ
- 08.00.13
Автореферат диссертации по теме "Моделирование взаимодействия конечных пользователей с ЭВМ"
РГ6 од
1 5 ноя 1093
МИНИСТЕРСТВО НАУКИ, ВЫСШЕЙ ШКОЛЫ И ТЕХНИЧЕСКОЙ ПОЛИТИКИ РОССИЙСКОЙ ДЕЛЕГАЦИИ
ГОСУДАРСТВЕННАЯ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ АКАДЕМИЯ УПРАВЛЕНИЯ имени Серго Орджоникидзе
На правах рукописи
Данг Конг Тьен
УДК'
1ЯДЕЛИРОВАНИЕ 1Ш!йЭДБ1СТВКЯ КОНЕЧНЫХ ПОЛЬЗОВАТЕЛЕЙ С ЭВМ
Споциальность 08.00.13 -"Эжпомлио-математические методы"
Автореферат диссертации на соискание ученной степени кандидата экономических наук
Москва 1993
,илРотл n.'nojiKf'Ha г. Госудлр"ТЕ?н)гой ордена Трудового КрПСНСГП МНЧ^т; аг-адечии упранления имени (Jepro Орджоникидзе .
Научный руководитель : Kmгдît.t;пт экономических наук, доцент Е.И. МОИСЕЕВА
Официальные оппоненты: Доктор технических наук, профессор Ю.М. ЧЕРКАНОВ Кандидат экономических наук, доцент В.Л. 13ЕГЕРЛ
Ведущая организация: Центр регионапыгого научно-технического сотрудничества "РЕНЛТЕХС" при Президиуме Российской академии наук
Зацэта состоится ¿¿¿•SiJ^j 19УЗ г. в часов
:ia заседании спацнапипированного совета ГЛУ
по адресу: ЮОЬ'.й, Москва,.Рязанский проспект, 99.
i ¡правки по телефону: 371-26-11
Автореферат разослан " " CO&lïltplJ? 1903 гсда.
У'-.'снкглГ секретарГ'
::.\-:«?:îpc~.nr.ucro егггта
/Л.Д. ЛКРЛ.М9ВА/
В настоящее время мало остается тех, кто не знает что такое ЭВМ, но как обращаться не все знаот с ними . Несмотря на то, что существует многочисленное количество программных средств, работающих в диалоговом режиме с пользователями, проблема взаимодействия с неподготовленных пользователей остается актуальной.
^ Решение этой проблемы может осуществляться в следующих направлениях:
1. Повышение компьютерной грамотности (введение новой дициплины "Основы информатики" в программе обучения в школах) .
2. Совершенствование технической базы информатики.
3. Разработка программных средств, оказывающих помощь неподготовленным пользователям, для работы с информационной системой (в частности,с БД) без предварительной подготовки.
В-настоящее время проблема общения заключается в том, что-)все большее число людей, зная, что они хотят от ЭВМ, ке сягаит, как ато осуществить. Существует два подхода к решению, проблемы общения. Оба базируются на анализе истории языковой практтш взаимодействия человека с ЭВМ её нынешнего состояния; Они стоят на разных концах процесса "естественный язык - искусственный язык". По сущности каждый из подходов пытается найти ¡сомпромисс между июли. Основные отличия - поиск компромисса. Суть первого подхода состоит в стремлении "очеловечить" формальные языки, второго формализовать естественный язык. Естественно, с динамическим процессе!,* развития вычислительной техники и искусства программирования оба подхода сокрапрвт расстояние между естественным и искусственным языком. Какой подход да»т больший эффект ? Трудно д<_.г> сер-""
йзный ответ на данный вопрос. Если проанализировать историю развития формальных языков общения с ЭВМ от машинной ' команды, через ассемблер, затем фортран, алгол, кобол, ил/1 , то молно назвать первый. При этом возникают трудности, связанные с появлением посредников между ЗВМ и конечными пользователями. Спецподготовка последних равносильно изучению иностранным языкам.
В данной работе рассмотрен один из аспектов первого направления, а имено,вопрос взаимодействия конечных пользователей с базами данных на естественных языках ( на примере вьетнамского).
Научная новизна заключается в предложенях по моделирован»® процессов общения конечных пользователей с ЭВМ вообще и в частности, с базами, данных. Предложен и программно реализован алгоритма поддержания функционирования интерфейса общения конечных пользователей с базами данных на вьетнамском языке на основе морально устарелых моделей ПЗВМ и СУБД.
Принципиально, результаты исследования в диссертации могут быть применима не только во Вьетнаме, но и там, где существуют следующие условия: уровень компьютеризации не высок .применение ЭВМ приносят экономический эффект народному хозяйстве за счет низкой цены аппаратуры и бесплатно полеченных копий программного обеспечения (СУБД, срок де&стпк». лицензии.. которых истек).
Структур*» раоо!к: /Диссертация состоит из вьодсни». четырех главы, «закЕочекня, приложений и списка литератур-:.
В глат' 1 анализируется состояние использования Эй! б Ссииалистич*гкой Республику Вьетнама и характеристики ка- -о-
го этапа . Результаты анализируемых ситуаций доказывает актуальность темы исследования. Представляет интерес предлагаемая классификация конечных пользователей.
-> Косвенные КП
КП—1-> Прямые КП-
-> КП, работающие в пакетном режиме
->КП, работающие в — диалоговом режиме
—>Непрограммирующие КП
-> Программирующее КП
Рис.1.1. Схема классификации КП,
<-1
| Запрос | пользователя)-
Ответ СУБД | из БД |<-
СУБД |
+ ЯОД |
+ ЯМД Ь-+ Диалоговое]
средство |
+ Сервис |<-
+ Другие |
БАЗА
ДАННЫХ
>
Рис. 2.1 Схема &У1Гкциоирога;:;:я БД. В главе 2 рассмотрены средства взаимодействия конечных
- û -
пользователей с Сазами данных :
- СУБД liait средство взаимодействия пользователей с БД, функции БД и их ограничения при общении с конечными неподготовленными пользователями. Схема традиционного функционирования СУБД иллюстрируется рис.2.1.
■ - Необходимость и возможность общения конечных польао-
I I
I Конечный
I I
пол-тель Не-
расширенная СУБД |
I I-1
I-1 I-1 I I
-Н Интерфейс h—н С У И—H БАЗА
■4 К П h-il Б Д -II ДАННЫХ
-J-H ' I v
Jl
л
J-
| Опытные пользователи, | | администрация БД. |
I_!
Рис.2.3 Структура системы общения 1Ш с БД на основе расширенной СУБД (интерфейс + СУБД).
вателей с БД на ЕЯ: Решение проблемы сйлшдшшн KU и щ,|
'очки зрения совершенствования программных средств путём )ааработки нового поколения СУБД, способствующих общению о СП на ЕЯ, требует ЭВМ с более большой памятью и скоростью эбработки данных. Наша задача состоит в совершенствовании ;уществующих СУБД для того, ^чтобы КП могли общаться с БД госредством этих СУБД и на основе моралыго-устаренных ПЭВМ. Зариант совершенствования СУБД представляется в рис.2.2
Если мы обратим внимание на источник происхождения сонцепции БД, то сама последняя была ролдена на принципе «элдектнвного использования данных, следовательно, сам язык збщения с ней естественно стремится к человеческому и это ?стествонный путь совершенствования языков общения пользователей с БД.
- На основе анализа существующих систем общения конечных пользователей с БД (PARMAX- итальянский язык, СЛФИРрусо-прлдг^тпп сбтезя схема интерфейса общения конечных кш.80вят<?лей с БД на ЕЯ (рис.2.3)
В 3 рассмотрен вопрос моделирования общения с БД.
Яля обсуждения подходов к разработке интерфейса общения ; 5Л необходимо рассмотреть модель пользователей , модель запросов и в конкретном случае особенности ЕЯ. '•моде;.;! тюльвовтгрля:
Пеш>гсвят«7ь ратсматрирк»тся кял соггжуппость некоторое ♦.«ргиег?рн~тяк п - прплтчнмч точек'грония. Няпример. с точкп греикя проИссисчпль!!':•« >'г,ал5г!'Н1"л:и!1 в по°лметной оОлсстн,
г. 7. .Ff"T"rjc тт-ляпетг«! тс-" "ИП»ЧГЬ гяч»отво •тнечич."
ИНТЕРФЕЙС
I Начало работы |
I--1
I Ввод сообщения. Н
г
| Анализ сообщения |-.-,-.
I Конечный пол-тель |
Т
I I
т
I
т 8
I
-л-
I I-1 I
-, | |СУБД1 | ,-
| Формирование I I I и I I I Формирование | | запросов к СУБД НН КМ ответов КП. I
1-1 | | БД | | '-1
_1 I_1 I_
Рис.2.3 Схема функционирования интервепса обивная КП с БЛ.
пользователей. Как мы отметили в (п. IV), система должна обладать возможностями по обучению пользователей в накоплении навыков общения с системой. Модель пользователей должна выражать кэлпчесиенуо оценку этого процесса. Лопустпм, имеются п КП, 1-1,2.....п.
Для решения своей задачи они обращают к БД с запросом Zij. - это запрос Zi~ обращение к системе в j-ом
разрезе, где j=l,2,...,1. Пусть, tjj - время обработки запроса 2ц,
Siд - количество обучающих текстов, которые система представляет в процессе реализации \ запроса Zj j.
В процессе общения с системой часть этих обучаюида текстов КП запомнит и в следующем сеансе их не следует выдавать, следовательно, при любом i, 31> 32 истинны следующие выражения:
Если ji<J2 --> Sij2 <= Siji и tij2 <= tiji Для Pi существуют неотрицательные значения Sj и Ti, та-, кие, что
5i = Sa " S ; Ti = tu -T (1).
Где : S = min { S,j > ; T = rnin < tjj >. Величина Si представляет собой количество дополнительных сообщений, выдаваемых системой КП Pi в 1-ом разе для реализации запроса'Z (Z - это запрос-тест). Она^показьтает, какова квалификация КП Pi, запоминающего сообщения (рекомендации) системы во времени работы. Чем меыпее S,, тем более высокой квалификации обладает пользователь Pi.
Величина Ti предсталяет собой дополнительной время, в котором КП Pi и система взаимодействуют между собой, чтобы пользователь Pj получил ответ. Эта величина равна сум/. -• времени, затрачиваемого системой на реализация диалога, используемого КП (время мышления, ■ набора сообгэния на клавиатуре). ■Мы назовём первое ТС,, второе TPi
Таким образом, для запроса-теста 2. кавдый пользователь характеризуется
Р1 = -1 Бь ТС1( ТР, > (К).
Эта модель называете!! статистической моделью, поскольку предполагает, что все полъвователи выдают абсолютно одинаковые запросы (запрос-тест).
На практике, у каждого пользователя есть свой масс запросов Поэтому в общем случае модель пользователя имеет вид:
Р, = < г1, ТС1, ТР £ > (3).
Модели пользователя позволяет классифицировать пользователей по параметрам модели (3). Это очень полезно для адаптации в соответствии с уровнем пользователей. Модель (3) носит название динамической.
Модель запросов: Все существующие запросы пользователей момга разделиться на три группы:
а ЕЯ-запрос т.о. запрос на естественных языках (для неподготовленных пользователей, не имеющих достаточного огшта оайоти с системой)-
-а Эаирео о (¡/икопровашшй структурой (для ояитап иоям.-о-;;;-л'ел'Зй).
■•'• Запрос лпроктива (д.':;-. с:-;сТ1?!.:Н:,\ м ".
:... ., р..чип ! .
сои:
г - ( кч, кч. сч > (4).
Здесь порядок в модели (4.) не имеет значения. Запрос Z комет находился в одной из вести возможных перестановок трон параметров. Модель (4),носит название формальной.
Сценка сложности группы пользователей БД: Взряомоя г» модели (2), Г-л { Si( TClf TPi } , !.:с.:1ю рассматривать модель (2) как степень взешепоикмэнка ивдцу iJt 11 свстюэй (Вй). Напртдер, если КП слаб по информа-т-:.:о, то Si, ТС,., ¡'Pi оудут больше; а скегсиа со слсСь-м обеспечением обусловливает увеличение андчзккя шг;.:модел:;.
i ¡:o::c.\i::< S< , ТС;, ъ снстенз координат, то
Г. 1.:с.г:;:т рассь'атрпгат.'.ся кс;: тс-'^д ^ тр^хгернем 'л:, к.'л::;:;"!! начало кссрдинат <0,0. С>. Тогда р,.сс-
!'.3.-;"V точл:;:: .;о;;г?;л\:'тг:!с7
ТР>;<0,ТС,ТР>; <0, ТС, 0>;<5, ТС, 0>;0, 0>;{3щ, 0, 0>;<0, ТСщ, 0}; {0,0,ТРт>; <Зп„ТСт,0>; <Зл,0,ТРт>; -(О, ТСт, ТРт> ; -(Зт.ТСтДРт}.
Таким образом, чем разнообразнее пользователи, тем больше многогранник. Иначе говоря, объём (V) многогранника характеризует степень сложности группы пользователей.
V = (Бт * ТСт * ТРшЫБ * ТС л ТР) (6).
Формула (б) показывает,что значение V косвенно зависит от п (количество Кпользователей в группе). Конечно, чем больше п, тем больше возможностей увеличения V.
Значение К = п/У (7) называется "плотностью пользователей" и характеризует однородность группы пользователей.
Анализ степени сложности группы пользователей помогает нам предварительно оценить совместимость между пользователями и системой. На основе значения К мы будем принимать решение о совэрщенствованиии системы или о предварительной подготовке пользователей. Естественно, здесь возникает вопрос, как оценить предельно-допустимое значение К ? Но нашему мнению значение К моле? определиться опытным путём и оно зависит от конкретной системы. Это очень сложный вопрос, он не может рассматриваться в рамках данной работы.
Модель пользователей, запросов и сложности группы пользователей являются основой для проектирования и разработки интерфейса общения пользователей с БД на ЕЯ, с одной стороны (пользователя). С другой - это СУБД, структуры базы данных и предметной области. Татам образом, в обще;.; случае интерфейс П на ЕЯ строятся на основе следувгих аспектов: я пользователей.
* Модели запросов, в том числе особенностей ЕЯ.
* Сложности группы пользователей.
* СУБД, структуры РД и.её предметной области.
В главе 4 дана методика разработки интерфейса общения с
БД.
Сначала проведен анализ трудностей в процессе разработку пользовательского интерфейса с БД и общей схемы диалогового процессора и ее структуры (рис.4.2)
I I
| М Т Н-
1-г-'
г
Н п в м т Нп
I-.1 I
| | АНАЛИЗАТОР
I I-:-1-—
запрос! i-*—i i-^-1 i—%—i i
-н А К [•-н А И Ч 8-н л С Н-Н
-"1
ответ г
а " ' ж " '
I I! 13 1 -!■ - I
II 1 I
СИНТЕЗАТОР
Нч
Рис. 4. 2 С7Р\':СТУР"-Л с:<<?!<Л ДП 2 ,~.<ЗСТКОП сссмоа -ПЛГССП.
В соответствии ' с тремя компонентам запроса в составе анализатора иотчадт анализ командной части (ДК), анализ информационной части (АКЧ) и анализ ситуации (АС). Процесс распознавания запроса осуществляется в соответствии с принятой формой запроса в три этапа с помощью машинного тезауруса (МТ). На первом этапе анализируется командная часть запроса V. устанавливается требуемый ремы работи системы. На втором этапе анализируется информационная часть запроса и если нудно выявлять саиСку пользователя. Третии ехал - анализируется ситуаиия fусловие извлечения информации). Результаты этих ■этапов кспакьвуатся пптерг.ретенором для формирования формального запроса к ЕЯ, сор..-.&шг;Л1 ээпзос ¡¡з^от быть ксмаоц-ноп стоской или ксмаклним ГаЫХ.сл «ила *.rRö СУБД. Синтезатор :c;.;y;!"oh:.lT1. отг.-v у.:.:. F.'!;.
Д ..■::;■:.• сссбсчшсстн пегнамжаго лайка.
0-к:Тгл.:..о:-.'лй ¿¡.:-ух.:'.7а состо.л из 20 букв латшгокого с. '..угу.:.;::;: ::: : о''.о. d.i. л. и', с и 5 тшгас удсрешы нн-- ::•-.;: (:::>') иугагл-.п, образом, ыолно СЧИ-
•:vb. что а.-: "jv.-.t г.:-го.ч;^;,.^:-;:то нв^ка соотсглч. (о точки ьро-
- Il:
0: о 0, o, с, с
d: tí, 0, d, ç'
и : ù, 11 u
ii
s ; >
У 1 / > V » y
Согласных
v з, с, d, d, g, h, к, i, m, p, q, r, s, t, v,x.
Сам вьетнамский алфавит состоит на 29 букв, но при учете ударений интонации он достигает 69 символов, которые необходимо кодировать. Отсюда проблема вьетк^вкацки более слокиая чем руссг.фи.'иции. Саыый слокла зьетификация клавиатура. Вооо1й>деолть д*ил-»о букв трэбуит минимально 178 байтов к кодовой странице для строчного и заглавного шрифтов- ото /;ве третьих кодовой сграгиады. А на клаьиатуре сл^догсныэ !"'!лвн;.:и только Ü3. В настопц:м; л о Вьетнаме существуют
некоторое вэризити вьотиия;^:!:! кль'игятури. Болыынзтво hô них имитируют процесс насори тсксча .¡а п;:.:;у:.;уъ малту, >. ;. используют •¡)у!П'.ц;:она:;ы!::-:' (.или/и ynpv. "^ггумА клав пни ;тлл чгл'с, ч'гсои изменить сгаи-иод кл:-.:-.;;;:;:, рп"ш::;а vv.av/ Т'"-r.TiK'i ?! nc:;o.:::-;.o;v;;;!;í ряг;гых 'Нункциснг-ль;;:-:х к-чя-о;::';. ;,ру/'0'Л ::cí. j '<■: м v¡ :1 г - ' " /.ч о!"': ■_■*:■:<-i.1:-;
словосочетание,на вьетнамском языке не изменяет форму,
* Предложение: как языковая единица предложение на вьетнамском языке представляет собой совокупность связанных определенными типами связей словосочетаний и (или) слов,представляющую собой воконченную по смыслу синтаксическую единицу.
Отличия вьетнамского от русского языка состоят в том, что слова в предложении на вьетнамском языке находятся- в строгом порядке. Т.е. каждая расстановка предложения превратит его в новом предложении (новое содержание) или несмысловое предложение.
Таким образом, модель запросов
г « < кч, ич, -сч >
в вьетнамском языке нет эквивалента в других расстановках . Иначе говоря, модель запросов на вьетнамском языке задается жесткой формой.
Рассмотрены некоторые характеристики СУБД РохВазе+, на основе которой будет работать интерфейс.
И последнее: предложен алгоритм распознавания запросов на вьетнамском яаыке.
Первый тип: вапроо, вадаемый вопросительным предложением, имеет следующий вид:
Вопросительное слово + условия?
Между компонентами могут быть или не быть союзы.
Второй тип: запрос задается следующим:
Повелительная форма глагола + требуемая информация -н-условия.
Обобщенный алгоритм распознания запросов к БД на ЕЯ.
Как уже было отмечено в практике нет систем, в которых общение КП происходит полностью на ЕЛ. Предлагаем алгоритм распознания простых вапросов на вьетнамском языке.
Запрос должен иметь туи
КЧ [;] CIÎ43 { союз > СЧ.
Где:
КЧ - Слова или словосочетания, юторые принадлежат СКС;
ИЧ - Слова или словосочетания, которые принадлежат СИС;
СЧ - Логические выражения в естественной форме.
Шаг 1: Нормализация эапроса КП.
Расстояния между слонами запроса, набранного пользователем, не всегда равны одному пробелу или ' разделителю типа ".", "," или ":". Нормализация валроса представляет собой процесс выбрасывания лишних пробелов в запросе.
Шаг 2: различит КЧ от ИЧ и СЧ.
Если КЧ требует подсчитать количество, то переход
if пату 4.
Иначе к сагу 3.
Шаг 3: различить 114 от СЧ и преобразовать естественную форму имени атрибутов БД в формальном виде.
Шаг 4: расшифровать СЧ. Аналогично иагу 3 но тодысо касается СЧ.
Шаг Б: Формировать запрос к БД на языке, понятном СУБД.
Пр1!мечание: па ^о.см г:are от, й до 4 если встречаться негснятное слово, то сесбгпть польаовато.та о пеСЗ;:одк"ости пере вводить запрос.
Результат!.' у ~'.'/:с■ и''' прг.^еня^тсп в
ГЛбС'Т1'0 И ЛОДД°р."'г1м1!П 'i: V H i "III ! С '1 ¡* ПС В J ï i ПI ^ТН'^рМсЩНОЧЧОЧ С1*~Т?~
мы при посольстве СРВ в Москве.
В приложении к диссертации имеются блок-схемы реализации алгоритма, а также часть листинга программы, написанной автором на языке Турбо-Си фирмы Вог1алс).
1ШЖ-СХЕМЛ АЛГОРИТМ НОРМАЛИЗАЦИИ ЗАПРОСОВ
1 - Длина запроса в байтах, Л (1), 1 =Т7Т - Запрос 1<П.
. ' _ ________I
_ __
I !
1 = 1
А (1) =' *
-а-1 1 = П+1 I
| А(П)=А(3}
: Г) - Г,+1
п < 1
11-1 К
ч
ШШ-ОХГСЛА АЛГОРИа .1 Г, РАОГСЗНАВАКШ! КОУЩДЧОП) с;.п03Л В НСВШШЗОПШЮМ ЗАПРОС!'.
АЦ) - Нормализованный запрос.
1Л(}) - Место окончания оого слова в запросе.
КЭ, КС, КО - Три компоненты словари командных слов.
¡'шах ~ Длина словаря командных слов.
В(к) - Буфер.