ДВЕ СИСТЕМЫ, ОСНОВАННЫЕ НА СЕМАНТИЧЕСКИХ СЕТЯХ
До сих пор мы обсуждали проблемы представления информации только на очень низком и общем уровне. Теперь мы кратко рассмотрим две конкретных системы, а именно системы Шенка и Симмонса, и укажем два различных направления, которые они выбрали, основываясь на семантических сетях, подчиняющихся, по существу, тем же самым правилам, которые были нами изложены.
СИСТЕМА ШЕНКА
Уже давно ведется спор по поводу необходимости использования компонентных (primitive) представлений, то есть таких, в которых все понятия могут быть разбиты на понятия-компоненты, причем последние образуют небольшой конечный набор. Двумя главными сторонниками использования таких компонентов выступают Уилкс (см. часть II статьи Уилкса) и Шенк. Теория Шенка, известная как теория концептуальных зависимостей, является одной из наиболее совершенных попыток создания набора правил, точно определяющих, что может появиться в репрезентации, подобной семантической сети. В своем нынешнем варианте, называемом MARGIE (Schank et al., 1973), система Шенка включает анализатор английского языка, созданный Ризбеком (R і е s b е с к, 1974), подсистему семантической памяти Ригера (R і е g е г, 1974) и генератор английского языка Голдмана (Goldman, 1974). MARGIE работает в двух режимах: в режиме перифразирования и в режиме вывода умозаключений. (Возможности данной системы в плане вывода умозаключений обсуждаются во второй статье Чарняка.) Для режима перифразирования типичным при-
мером является следующий:
INPUT: John killed Mary by choking Mary.
ВХОД: ‘Джон убил Мэри, задушив Мэри.’
OUTPUT: John strangled Mary.
John choked Mary and she died because she ' could not breathe.
Mary died because she was unable to inhale some a і r and she was unable to inhale some "air because John grabbed her neck.
ВЫХОД: ‘Джон удавил Мэри.’
‘Джон задушил Мэри, и она умерла, потому что она не могла дышать.’
‘Мэри умерла, потому что она была не в состоянии вдохнуть воздух, и она была не в состоянии вдохнуть воздух, так как Джон схватил ее за горло.’
Шенк стремился дать такое представление значения, в терминах которого можно было бы решать эти и другие задачи, например задачу машинного перевода; представление, которое, кроме того, было бы независимо от конкретного языка, от синтаксиса, а также от каких бы то ни было поверхностных структур.
(Это сильно сближает систему Шенка с моделью представления памяти.)Man , F . take О book 'человек' 1 1 'брать' 4 """" 'книга'
Формальная структура графов Шенка та же, что в грамматике зависимостей (Hays, 1964), а элементы (узлы) в графе могут принадлежать к четырем типам, или концептуальным категориям. Они обозначаются аббревиатурами РР, ACT, РА и АА и примерно соотносятся — соответственно — с существительным, глаголом, прилагательным и наречием. Правда, это значительное упрощение, сделанное только для того, чтобы дать краткое и независимое описание. На самом же деле многие английские существительные в теории концептуальных зависимостей представляются как действия (ACTs), например hunt ‘охота’. Эти единицы объединяются и образуют базисную структуру, "концептуализацию", которая очень близка к предикатным структурам. Концептуализация для The man took a book ‘Человек взял книгу’ выглядит примерно так:
Для тех, кто не знаком с падежной нотацией Шенка [58],
поясним, что означает, что Man находится в падеже о
ACTOR, а < указывает на падеж ОБЪЕКТа. Можно
сказать, что и человек, и книга находятся в зависимости от центрального АКТа (take ‘брать’). Наконец, ”Р“ означает прошедшее время. Для соединения концептуальных категорий разработан тщательно продуманный синтаксис, который будет описан ниже лишь частично.
Отметим сходство между (8) и (9).
(9)
take
Главное различие состоит в том, что (9) использует предикатную структуру, тогда как в (8) ее нет, но при машинной реализации (8) фактически используются предикатные структуры по причинам, упоминавшимся выше в данной статье.
Ядром нотации Шенка являются его 11 базисных, или "элементарных" (primitive), действий. Это PROPEL ‘приводить в движение’, MOVE ‘двигать’, INGEST ‘глотать’, EXPEL ‘выталкивать’, GRASP ‘схватывать’, PTRANS ‘физически перемещать’, MTRANS ‘ментально перемещать’, ATRANS ‘передавать’, SPEAK ‘говорить’, ATTEND ‘присутствовать’ и MBUILD ‘ментально создавать’.
Существует также недостаточный глагол DO ‘делать’. Точное число здесь не важно, так как оно может меняться. Но важно то, что это число весьма незначительно. Шенк считает, что этих элементарных действий вместе с небольшим (но пока еще не установленным) числом состояний вполне достаточно для того, чтобы представить значения всех глаголов.Лучше всего пояснить использование этой нотации путем рассмотрения нескольких примеров (в порядке возрастающей трудности).
Наш пример (8) (The man took a book) в действительности будет выглядеть так:
man
man < , > PTRANS < book 4-
Это соответствует примерно следующему: The man Physically TR ANSferred the book from some unknown location to himself. ‘[Этот] человек Физически ПЕРЕ- местил [определенную] книгу из какого-то неизвестного места к себе. ’
John killed his teacher ‘Джон убил своего учителя’
DO
1
dead
alive
POSS-BY
'принадлежность'
Teacher ф
John
John
'Джон сделал нечто, что каузировало ( "Ц* } то, что учитель перешел из ) живого состояния в мертвое/
Очевидно сходство этого представления с представлением в порождающей семантике (cause to be dead ‘каузи- ровать быть мертвым’).
I saw John eating soup
‘Я увидел, что Джон ест суп’. (См. схему на с. 258.)
Чтобы понять этот пример, обратимся сначала к его левой половине. Здесь говорится, в сущности, что «я ментально ПЕРЕместил (MTRANS) информацию из моих глаз (eyes) в мой концептуальный процессор (СР) и информация, которая переместилась, состояла в том, что Джон ест суп (soup)». В правой половине говорится, что the way this information transfer was accomplished was by ATTENDing my eye from some unknown location to John and the soup.
‘способ, которым было выполнено перемещение этой информации, состоял в обращении (ATTEND) моих глаз от некоторого неизвестного места к Джону и супу’.
I saw John eating soup
I
-I
ATTEND
t°
eye
John, soup
I
MTRANS СА2
Break Ct ------------------ » Hammer
С4
Window СЗ
или (для внутримашинного представления) — с помощью набора троек отношений:
(Cl СА1 С2) (Cl СА2 С4) (Cl THEME СЗ)
Однако это еще не полное представление, и наше использование в схеме словесных помет вводит в заблуждение, поскольку узлы по замыслу должны быть чем-то вроде того, что мы раньше называли понятиями-элементами (tokens).
(Симмонс говорит, что узел представляет ’’контекстуальное значение слова") Эти элементы связаны со смыслами конкретных слов посредством отношения ТОК (‘быть представителем’), которое в грубом приближении эквивалентно отношению ISA, то есть, например, упоминание слова the bank (в значении учреждения) будет представлено в сети посредством, скажем, С55, которое будет связано отношением ТОК со смыслом слова ’’bank", соотносящимся с местом, где обычно хранят деньги. Конечно, оно не будет прямо связано со словом bank в целом, которое в действительности является неоднозначным. В реализации этой модели смыслы слов будут представлены как отдельные лексические единицы (entries), которым будут присвоены условные имена типа L97. Для конкретного смысла ’’apple" ‘яблоко’ Симмонс предлагает следующий ассоциируемый с ним набор синтаксических и семантических признаков:(ll)NBR (number) ‘число’ —S (singular) ‘единственное* SHAPE ‘форма’ —spherical ‘сферическая’
COLOR ‘цвет’ —red ‘красный’
PRINTIMAGE ‘печат- —apple ‘яблоко’ ный вид’
THEME ‘тема’ —eat ‘есть’
SYNTACTIC-CATEGORY—noun ‘ существительное’ и т.д. ‘синтаксическая категория’.
Возвращаясь к нашему примеру John broke the window, можно дать следующую полную репрезентацию, включающую отношения ТОК:
(С1 ТОК break) (Cl СА1 С2) (Cl THEME C3) (Cl CA2 C4) (C2 TOK John) (C2 DET Def) (C2 NBR S)
(C3 TOK window) (C3 DET Def) (C3 NBR S)
(C4 TOK hammer) (C4 DET Indef) (C4 NBR S) (C4 PREP with)
(Здесь DET — ‘детерминация’, Def — ‘определенная’, Indef—‘неопределенная’, PREP—‘предлог’).
(12)
Сеть в (12) также является представлением и для следующих предложений, которые могут мыслиться в качестве поверхностных вариантов единой "глубинной" (underlying) структуры:
John broke the window with a hammer.
‘Джон разбил окно молотком.’
John broke the window. ‘Джон разбил окно.’
The hammer broke the window.
‘Молоток разбил окно.’ The window broke. ‘Окно разбилось’.Ясно, что метод Симмонса, приписывающий некоторый узел определенному смыслу слова, в любом случае не является системой, основанной на компонентном подходе, как у Шенка. Зато Симмонс использует систему правил перифразирования, которая, по замыслу, позволяет переходить от одной сети к другой, причем эти переходы, как он считает, эквивалентны введению в систему компонентов. Так, в S і m m о n s, 1973 рассматриваются предложения: John bought the boat from Mary.
‘Джон купил лодку у Мери.’
Mary sold the boat to John.
‘Мери продала лодку Джону.’, которые обычно считаются близкими перифразами друг друга. Однако его система будет представлять их различно.
С1 ТОК buy, SOURCE (Mary), GOAL (John), THEME (boat)
Cl TOK sell, SOURCE (Mary), GOAL (John), THEME (boat)
Используя нотацию Симмонса, мы можем, однако, получить и единую репрезентацию для обоих предложений, введя элементарное действие transfer ‘перемещать’:
С1 ТОК and, Args С2 , СЗ
С2 ТОК transfer, SOURCE (John), GOAL (Mary), THEME (money)
C3 TOK transfer, SOURCE (Mary), GOAL (John), THEME (boat)
Симмонс останавливается на первом варианте представления и на правилах перифразирования для получения одной формы из другой.
Должно быть ясно, что представление Симмонса гораздо ближе к естественному языку, чем представление Шенка, и не только потому, что он избегает введения компонентов, но еще и потому, что в его системе элементы (tokens) —это представители лексических значений. Иногда это приводит к непредвиденным проблемам. Вернемся к (11). Существуют признаки, приписанные apple, которые описывают яблоко, признаки, которые описывают машинные характеристики, например PRINT-IMAGE, и, наконец, признаки, описывающие роль, которую играет это слово в синтаксисе. Симмонс, конечно, не единственный, кто ставит в один ряд такие несопоставимые единицы. Тем не менее мы полагаем, что подобный подход может привести только к затруднениям. Если мы запрашиваем информацию о яблоке, мы, конечно, не захотим, чтобы нам говорили о его печатном виде.
ОРГАНИЗАЦИЯ
Расширения, обсуждавшиеся до сих пор, касались очень конкретного уровня дробления информации. Что же можно сказать о всеобъемлющей организации памяти и о представлении более сложных идей, таких, как описания физических объектов или серии событий?
Различные взгляды, выражаемые разными исследователями о высших уровнях организации памяти, по-видимому, отражают те или иные пристрастия их сторонников в области психологической теории или теории использования вычислительной техники. Иначе говоря, на организацию памяти влияют как соображения, связанные с механизмами вывода умозаключений, так и желание точно моделировать интеллектуальное поведение человека. Начнем с простого примера, попытаемся установить, каково могло бы быть представление для понятия large block ‘большой блок’. Можно было бы ожидать, что такая простая вещь не должна быть предметом спора. Однако для этого понятия возможны два представления:
(13) BLOCK LARGE BLOCK LARGE
'ЙПЛК1 '((nпLПlnм, 'йлпШілії*
a) No-class-concept b) Class-concept
Главное различие состоит в том, что (136) предполагает существование понятия ’’large block" как класса вещей, тогда как (13а) этого не предполагает. Число возможных представлений увеличится, если мы добавим новые прилагательные. В теории ”не-классных“ понятий a large red block ‘большой красный блок’ представляется очевидным способом:
.у
'блок
isA . BLOCK
А
SIZE COLOR
'размер' 'цвет'
/ \
• LARGE RED 'большой' 'красный'*
(14) а)
Однако при использовании ’’классных" понятий допускаются три других возможности (см. рис. 14а, б, в).
ISA SUPERSET
----------------------------------------------------------- -► BLOCK
SIZE COLOR
/ \
LARGE RED
Ни одна из этих структур не является безупречной.(14а) не соотносит понятие ’’large red block" с понятием ’’large block". Автор же полагает, что эти понятия должны быть связаны эксплицитно. (146) отражает тот факт, что данный блок фактически является красным блоком, но не может отразить симметричный факт, состоящий в том, что это точно так же и большой блок. Когда будут использоваться более чем два определяющих свойства, то при построении схем типа (14в) проектировщик системы будет сталкиваться с ком-
04) б)
ISA
SUPERSET SUPERSET »-------- »• ►BLOCK
SIZE
LARGE
COLOR
I
RED
бинаторным взрывом, либо ему придется иметь дело с очень сложной проблемой выбора: он должен будет определить, какие из нескольких возможных отношений теоретико-множественного включения должны быть эксплицированы.
(14) в)
BLOCK
j SUPERSET
/\ SUPERSET SUPERSET
-< >
SUPERSET
COLOR
SIZE
►•RED
LARGE •-
SUPERSET
ISA
Сходная проблема, касающаяся как ’’классных", так и ”не-классных“ представлений, возникает в случае, когда подмножество определяется посредством двух свойств, которые не являются независимыми друг от друга. Например, блок, который является фактически многоцветным, может быть представлен следующим образом:
W +“-д —-..оск
COLOR
У \
BLUE RED
Но из соглашений, которые использовались до сих пор, следует, что данный блок является сплошь красным и сплошь синим. Один из способов выбраться из этого противоречия — представить blue and red block ‘синий и красный блок’ следующим образом:
ISA SUPERSET
“К
-►* BLOCK
COLOR
BLUE
\4 AND
AND
RED
Другая альтернатива: используя для представления blue and red block схему (15), ввести правило о том, что определенные связанные свойства (например, идентичные) не могут применяться к узлу порознь.
Вопрос о выборе представления затемняется еще более в случае семантической записи идиом или тонких вариантов общих понятий. Выражение very red nose ‘очень красный нос’ должно иметь представление, которое показывает, что хотя фактически речь идет о красном носе, но его краснота в данном случае есть нечто особое. Black men ‘чернокожие люди’ обозначает не множество людей, имеющих кожу черного цвета, а людей, которые обладают определенным набором характеристик, и в их число не обязательно входит чернота. (Вероятно, на самом деле этот вопрос относится к проблематике автоматического анализа.)
События также объединяются в группы для образования более сложных событий. Какой более высокий уровень организации был предложен для сложных событий? Для того чтобы говорить о такой организации, давайте предположим, что у нас есть некоторое представление для действий и простых конструктов, скажем, типа шенковского. Это значит, что мы определили, какие отношения мы будем допускать и в каких комбинациях, а также имена наших элементарных действий. Далее, предположим, что мы условились о переводах "наивных понятий" (everyday concepts) на язык этого представления, то есть мы имеем некоторую структуру для sweet ‘сладкий’, для buy ‘покупать’ и т. д. В связи с этим нам сейчас нужна теория более сложных действий. Например, как соединить описания различных подэтапов процесса приготовления торта в единое описание всеобъемлющего действия приготовления торта*
Норман определяет сложное действие в семантической сети путем описания его как упорядоченного списка под- этапов, необходимых для выполнения этого действия. Довольно интересно то, что он может описывать подобным путем также действия, которые оперируют базой данных. Например, определением для establish ‘устанавливать’; ‘создавать’; ‘учреждать’ (у него это процедура, которая должна гарантировать, что тройка ”arbu находится в базе данных) является следующая сеть:
CONNECT?
"" 'связывает ли?
ESTABLISH Trelation r I- Установить ротношени^І г
concept
'понятие
'по отношению к' agent - object „
is when 'при условии'
* act-of -
if no 'если нет'
Make CONNECTed 'осуществить связь'
1 ПО OJHI
act-of
'по отношению к' with
при помощи object
Интерпретацией этой сети является программа для определяемого в ней понятия ESTABLISH. Программа принимает три параметра а, г и Ь. Определение отношения (команды) is when состоит в том, что программа сначала использует блок CONNECT?, чтобы проверить, связывает ли уже отношение г понятия а и b в базе данных. Если нет (if по), то а связывается (благодаря действию блока make- CONNECTed) с b посредством г. Обратите внимание, что произошло. В приведенном выше представлении с помощью семантической сети была определена процедура, которая оперирует данной семантической сетью. В рамках сети оказывается возможным не только описывать события, но и определять все способы использования данных (то есть ме-
ханизмы вывода умозаключений). С одной стороны, описание ESTABLISH является частью данных, потому что оно представлено в семантической сети, с другой стороны, оно одновременно является процедурой.
Итак, мы косвенным образом подошли к спору о представлении данных. Есть исследователи, которые утверждают, что всякое знание хранится в форме процедур, и другие ученые, которые заявляют, что оно хранится как собрание фактов. В системе Нормана это разграничение умышленно затемняется (автор считает, что так и следует поступать). Различные исследователи придерживаются той или иной крайней точки зрения и приводят много примеров в поддержку своего мнения. Одним из серии таких прототипических примеров является вопрос об определении дуги. С одной стороны, сторонники процедурного подхода говорят о том, что способ представления знания о дуге должен заключаться в создании программы, скажем, для ее распознавания. Сторонники фактографического подхода полагают, что нужно просто иметь описание обобщенной дуги. Если посмотреть с этой точки зрения на расхождения между Симмонсом и Шенком, то обнаружится, что эти расхождения являются фактически вариантом указанного спора. Шенк хочет иметь универсальное (для любых целей) представление, тогда как Симмонс хочет иметь процедуры для перехода от одного представления к другому.
Из хорошо известных программ программа Винограда является, пожалуй, наиболее зависимой от процедурного знания (см. ч. первую статьи Уилкса). Первоначальное применение семантических сетей отличалось сильной ориентацией на данные, а не на процедуры. Автор настоящей статьи придерживается мнения, что информация должна храниться в той форме, которая является наиболее удобной. Данные, которые хранятся в виде процедур, чаще всего несут на себе слишком сильный отпечаток специфических целей и задач по использованию информации. Лучше хранить информацию о том, что стол красный, чем хранить информацию о том, как определить, что стол красный. А что если нам понадобится узнать, является ли стол зеленым? А как быть с альтернативными методами узнавания (для слепого человека, например)? Высказанное общее наблюдение имеет, конечно, отклонения. Таким отклонением является, например, ситуация типа той, что наблюдается у Нормана, где обе формы сосуществуют в качестве различных способов рассмотрения одной и той же репрезентации. Другое исключение касается информации о действиях.
В системе LUIGI (S с г a g g, 1974) для хранения информации о действиях используются неопределенные (в смысле ориентации на данные или на процедуры) представления. Система была построена в рамках системы Нормана MEMOD. Система LUIGI знала, как выполнять (фактически имитировать) различные человеческие действия типа поджаривания хлеба, приготовления спагетти или уборки кухни. Информация о том, как выполнять эти действия, хранилась в форме процедур. Однако эти процедуры могли использоваться и в качестве данных другими частями системы для ответов на вопросы типа "How do you make a ham and cheese sandwich?" ‘Как Вы делаете бутерброд с ветчиной и сыром?’, "How many utensils do you use if you make a mushroom omelette?" ‘Сколько предметов кухонной утвари Вы используете, если Вы готовите грибной омлет?’, "Why did Don use a knife?" ‘Почему Дон пользовался ножом?’ или даже на вопрос "Did anyone do anything which would have moved the bread?" ‘Сделал ли кто-то нечто, чтобы хлеб передвинулся?’, который был самостоятельно порожден программой LUIGI после того, как ей не удалось ответить на вопрос "Where is the bread?" ‘Где хлеб?’ с помощью более простых средств. Поскольку все моделирующие процедуры вполне доступны для стандартных подпрограмм, осуществляющих ответы на вопросы, то эти процедуры могут детально обследоваться, могут предсказываться их побочные результаты и даже могут вычисляться необходимые для них предварительные условия, если они эксплицитно не упоминаются.
Например, чтобы ответить на вопрос:
How do you make a ham and cheese sandwich?
‘Как Вы делаете бутерброд с ветчиной и сыром?’
система должна исследовать свою собственную программу, которую она использовала бы, если бы ей было приказано сделать бутерброд. На каждом шаге программы она должна определять, является ли он тем шагом, который должен быть упомянут. Затем она порождает описание данного шага, имея в виду, что исполнителем будет она сама (то есть система) и что бутерброд будет сделан с ветчиной и сыром. Ее конечным выходом является;
IF I WERE TO MAKE A SANDWICH
THEN I WOULD DO THE FOLLOWING THINGS:
I PLACE SLICE OF BREAD ON THE COUNTER
I SPREAD MUSTARD ON THE BREAD
I PLACE HAM ON THE BREAD
I PLACE CHEESE ON THE BREAD
I PLACE LETTUCE ON THE BREAD
I PLACE SECOND PIECE OF BREAD ON THE BREAD
‘если бы я должна была сделать бутерброд, то я сделала бы следующие вещи: я кладу ломтик хлеба на стойку, я намазываю горчицу на хлеб, я кладу ветчину на хлеб, я кладу сыр на хлеб, я кладу салат на хлеб, я кладу на хлеб второй кусочек хлеба’
Главным моментом здесь является то, что для описания сложных действий, пригодных для удовлетворения многочисленных целей, может использоваться единое представление, которое ориентировано как на данные, так и на процедуры. Недавно (S с г a g g, 1975) такого рода представление было развито в сеть, которая включает альтернативные методы и независимый порядок шагов, а также информацию о причинах и результатах и информацию о привязке к остальной части базы данных. Расширенная сеть должна быть соединена с такой интерпретирующей программой, которая не нуждается в фиксированном порядке для шагов, но может выбирать его или наугад или на основе некоторой мотивации. Отсутствие фиксированного алгоритма, возможно, сделает систему решения интеллектуальных задач более похожей на человека, чем первоначальный вариант системы LUIGI. Но здесь мы уже переходим к структурам данных весьма высокого уровня (см. об этом вторую часть статьи Чарняка).