ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

ДВЕ СИСТЕМЫ, ОСНОВАННЫЕ НА СЕМАНТИЧЕСКИХ СЕТЯХ

До сих пор мы обсуждали проблемы представления ин­формации только на очень низком и общем уровне. Теперь мы кратко рассмотрим две конкретных системы, а именно системы Шенка и Симмонса, и укажем два различных на­правления, которые они выбрали, основываясь на семан­тических сетях, подчиняющихся, по существу, тем же са­мым правилам, которые были нами изложены.

СИСТЕМА ШЕНКА

Уже давно ведется спор по поводу необходимости ис­пользования компонентных (primitive) представлений, то есть таких, в которых все понятия могут быть разбиты на понятия-компоненты, причем последние образуют неболь­шой конечный набор. Двумя главными сторонниками ис­пользования таких компонентов выступают Уилкс (см. часть II статьи Уилкса) и Шенк. Теория Шенка, известная как теория концептуальных зависимостей, является одной из наиболее совершенных попыток создания набора правил, точно определяющих, что может появиться в репрезентации, подобной семантической сети. В своем нынешнем варианте, называемом MARGIE (Schank et al., 1973), система Шенка включает анализатор английского языка, созданный Ризбеком (R і е s b е с к, 1974), подсистему семантической памяти Ригера (R і е g е г, 1974) и генератор английского языка Голдмана (Goldman, 1974). MARGIE работает в двух режимах: в режиме перифразирования и в режиме вывода умозаключений. (Возможности данной системы в пла­не вывода умозаключений обсуждаются во второй статье Чарняка.) Для режима перифразирования типичным при-

мером является следующий:

INPUT: John killed Mary by choking Mary.

ВХОД: ‘Джон убил Мэри, задушив Мэри.’

OUTPUT: John strangled Mary.

John choked Mary and she died because she ' could not breathe.

Mary died because she was unable to inhale some a і r and she was unable to inhale some "air because John grabbed her neck.

ВЫХОД: ‘Джон удавил Мэри.’

‘Джон задушил Мэри, и она умерла, потому что она не могла дышать.’

‘Мэри умерла, потому что она была не в со­стоянии вдохнуть воздух, и она была не в состоянии вдохнуть воздух, так как Джон схватил ее за горло.’

Шенк стремился дать такое представление значения, в терминах которого можно было бы решать эти и другие задачи, например задачу машинного перевода; представ­ление, которое, кроме того, было бы независимо от конкрет­ного языка, от синтаксиса, а также от каких бы то ни было поверхностных структур.

(Это сильно сближает систему Шенка с моделью представления памяти.)

Man , F . take О book 'человек' 1 1 'брать' 4 """" 'книга'

Формальная структура графов Шенка та же, что в грамматике зависимостей (Hays, 1964), а элементы (узлы) в графе могут принадлежать к четырем типам, или концеп­туальным категориям. Они обозначаются аббревиатурами РР, ACT, РА и АА и примерно соотносятся — соответ­ственно — с существительным, глаголом, прилагательным и наречием. Правда, это значительное упрощение, сделан­ное только для того, чтобы дать краткое и независимое опи­сание. На самом же деле многие английские существитель­ные в теории концептуальных зависимостей представляются как действия (ACTs), например hunt ‘охота’. Эти единицы объединяются и образуют базисную структуру, "концеп­туализацию", которая очень близка к предикатным струк­турам. Концептуализация для The man took a book ‘Че­ловек взял книгу’ выглядит примерно так:

Для тех, кто не знаком с падежной нотацией Шенка [58],

поясним, что означает, что Man находится в падеже о

ACTOR, а < указывает на падеж ОБЪЕКТа. Можно

сказать, что и человек, и книга находятся в зависимости от центрального АКТа (take ‘брать’). Наконец, ”Р“ озна­чает прошедшее время. Для соединения концептуальных категорий разработан тщательно продуманный синтаксис, который будет описан ниже лишь частично.

Отметим сходство между (8) и (9).

(9)

take

Главное различие состоит в том, что (9) использует преди­катную структуру, тогда как в (8) ее нет, но при машинной реализации (8) фактически используются предикатные структуры по причинам, упоминавшимся выше в данной статье.

Ядром нотации Шенка являются его 11 базисных, или "элементарных" (primitive), действий. Это PROPEL ‘при­водить в движение’, MOVE ‘двигать’, INGEST ‘глотать’, EXPEL ‘выталкивать’, GRASP ‘схватывать’, PTRANS ‘физически перемещать’, MTRANS ‘ментально перемещать’, ATRANS ‘передавать’, SPEAK ‘говорить’, ATTEND ‘при­сутствовать’ и MBUILD ‘ментально создавать’.

Существует также недостаточный глагол DO ‘делать’. Точное число здесь не важно, так как оно может меняться. Но важно то, что это число весьма незначительно. Шенк считает, что этих элементарных действий вместе с небольшим (но пока еще не установленным) числом состояний вполне достаточ­но для того, чтобы представить значения всех глаголов.

Лучше всего пояснить использование этой нотации путем рассмотрения нескольких примеров (в порядке возрастаю­щей трудности).

Наш пример (8) (The man took a book) в действительно­сти будет выглядеть так:

man

man < , > PTRANS < book 4-

Это соответствует примерно следующему: The man Phy­sically TR ANSferred the book from some unknown lo­cation to himself. ‘[Этот] человек Физически ПЕРЕ- местил [определенную] книгу из какого-то неизвестного места к себе. ’

John killed his teacher ‘Джон убил своего учителя’

DO

1

dead

alive

POSS-BY

'принадлежность'

Teacher ф

John

John

'Джон сделал нечто, что каузировало ( "Ц* } то, что учитель перешел из ) живого состояния в мертвое/

Очевидно сходство этого представления с представле­нием в порождающей семантике (cause to be dead ‘каузи- ровать быть мертвым’).

I saw John eating soup

‘Я увидел, что Джон ест суп’. (См. схему на с. 258.)

Чтобы понять этот пример, обратимся сначала к его левой половине. Здесь говорится, в сущности, что «я ментально ПЕРЕместил (MTRANS) информацию из моих глаз (eyes) в мой концептуальный процессор (СР) и информация, ко­торая переместилась, состояла в том, что Джон ест суп (soup)». В правой половине говорится, что the way this information transfer was accomplished was by ATTENDing my eye from some unknown location to John and the soup.

‘способ, которым было выполнено перемещение этой ин­формации, состоял в обращении (ATTEND) моих глаз от некоторого неизвестного места к Джону и супу’.

I saw John eating soup

I

-I

ATTEND

eye

John, soup

I

MTRANS СА2

Break Ct ------------------ » Hammer

С4

Window СЗ

или (для внутримашинного представления) — с помощью набора троек отношений:

(Cl СА1 С2) (Cl СА2 С4) (Cl THEME СЗ)

Однако это еще не полное представление, и наше исполь­зование в схеме словесных помет вводит в заблуждение, поскольку узлы по замыслу должны быть чем-то вроде того, что мы раньше называли понятиями-элементами (tokens).

(Симмонс говорит, что узел представляет ’’контекстуальное значение слова") Эти элементы связаны со смыслами кон­кретных слов посредством отношения ТОК (‘быть предста­вителем’), которое в грубом приближении эквивалентно отношению ISA, то есть, например, упоминание слова the bank (в значении учреждения) будет представлено в сети посредством, скажем, С55, которое будет связано отноше­нием ТОК со смыслом слова ’’bank", соотносящимся с мес­том, где обычно хранят деньги. Конечно, оно не будет прямо связано со словом bank в целом, которое в действительности является неоднозначным. В реализации этой модели смы­слы слов будут представлены как отдельные лексические единицы (entries), которым будут присвоены условные име­на типа L97. Для конкретного смысла ’’apple" ‘яблоко’ Симмонс предлагает следующий ассоциируемый с ним набор синтаксических и семантических признаков:

(ll)NBR (number) ‘число’ —S (singular) ‘единственное* SHAPE ‘форма’ —spherical ‘сферическая’

COLOR ‘цвет’ —red ‘красный’

PRINTIMAGE ‘печат- —apple ‘яблоко’ ный вид’

THEME ‘тема’ —eat ‘есть’

SYNTACTIC-CATEGORY—noun ‘ существительное’ и т.д. ‘синтаксическая категория’.

Возвращаясь к нашему примеру John broke the window, можно дать следующую полную репрезентацию, включаю­щую отношения ТОК:

(С1 ТОК break) (Cl СА1 С2) (Cl THEME C3) (Cl CA2 C4) (C2 TOK John) (C2 DET Def) (C2 NBR S)

(C3 TOK window) (C3 DET Def) (C3 NBR S)

(C4 TOK hammer) (C4 DET Indef) (C4 NBR S) (C4 PREP with)

(Здесь DET — ‘детерминация’, Def — ‘определенная’, Indef—‘неопределенная’, PREP—‘предлог’).

(12)

Сеть в (12) также является представлением и для сле­дующих предложений, которые могут мыслиться в каче­стве поверхностных вариантов единой "глубинной" (un­derlying) структуры:

John broke the window with a hammer.

‘Джон разбил окно молотком.’

John broke the window. ‘Джон разбил окно.’

The hammer broke the window.

‘Молоток разбил окно.’ The window broke. ‘Окно разбилось’.

Ясно, что метод Симмонса, приписывающий некоторый узел определенному смыслу слова, в любом случае не является системой, основанной на компонентном подходе, как у Шенка. Зато Симмонс использует систему правил перифразирования, которая, по замыслу, позволяет пере­ходить от одной сети к другой, причем эти переходы, как он считает, эквивалентны введению в систему компонентов. Так, в S і m m о n s, 1973 рассматриваются предложения: John bought the boat from Mary.

‘Джон купил лодку у Мери.’

Mary sold the boat to John.

‘Мери продала лодку Джону.’, которые обычно считаются близкими перифразами друг друга. Однако его система будет представлять их раз­лично.

С1 ТОК buy, SOURCE (Mary), GOAL (John), THEME (boat)

Cl TOK sell, SOURCE (Mary), GOAL (John), THEME (boat)

Используя нотацию Симмонса, мы можем, однако, получить и единую репрезентацию для обоих предложений, введя элементарное действие transfer ‘перемещать’:

С1 ТОК and, Args С2 , СЗ

С2 ТОК transfer, SOURCE (John), GOAL (Mary), THE­ME (money)

C3 TOK transfer, SOURCE (Mary), GOAL (John), THEME (boat)

Симмонс останавливается на первом варианте представле­ния и на правилах перифразирования для получения одной формы из другой.

Должно быть ясно, что представление Симмонса гораздо ближе к естественному языку, чем представление Шенка, и не только потому, что он избегает введения компонентов, но еще и потому, что в его системе элементы (tokens) —это представители лексических значений. Иногда это приводит к непредвиденным проблемам. Вернемся к (11). Существуют признаки, приписанные apple, которые описывают яблоко, признаки, которые описывают машин­ные характеристики, например PRINT-IMAGE, и, на­конец, признаки, описывающие роль, которую играет это слово в синтаксисе. Симмонс, конечно, не единственный, кто ставит в один ряд такие несопоставимые единицы. Тем не менее мы полагаем, что подобный подход может при­вести только к затруднениям. Если мы запрашиваем ин­формацию о яблоке, мы, конечно, не захотим, чтобы нам говорили о его печатном виде.

ОРГАНИЗАЦИЯ

Расширения, обсуждавшиеся до сих пор, касались очень конкретного уровня дробления информации. Что же можно сказать о всеобъемлющей организации памяти и о пред­ставлении более сложных идей, таких, как описания фи­зических объектов или серии событий?

Различные взгляды, выражаемые разными исследовате­лями о высших уровнях организации памяти, по-видимому, отражают те или иные пристрастия их сторонников в обла­сти психологической теории или теории использования вы­числительной техники. Иначе говоря, на организацию па­мяти влияют как соображения, связанные с механизмами вывода умозаключений, так и желание точно моделиро­вать интеллектуальное поведение человека. Начнем с про­стого примера, попытаемся установить, каково могло бы быть представление для понятия large block ‘большой блок’. Можно было бы ожидать, что такая простая вещь не должна быть предметом спора. Однако для этого понятия возможны два представления:

(13) BLOCK LARGE BLOCK LARGE

'ЙПЛК1 '((nпLПlnм, 'йлпШілії*

a) No-class-concept b) Class-concept

Главное различие состоит в том, что (136) предполагает существование понятия ’’large block" как класса вещей, тогда как (13а) этого не предполагает. Число возможных представлений увеличится, если мы добавим новые прила­гательные. В теории ”не-классных“ понятий a large red block ‘большой красный блок’ представляется очевидным способом:

'блок

isA . BLOCK

А

SIZE COLOR

'размер' 'цвет'

/ \

• LARGE RED 'большой' 'красный'*

(14) а)

Однако при использовании ’’классных" понятий допуска­ются три других возможности (см. рис. 14а, б, в).

ISA SUPERSET

----------------------------------------------------------- -► BLOCK

SIZE COLOR

/ \

LARGE RED

Ни одна из этих структур не является безупречной.(14а) не соотносит понятие ’’large red block" с понятием ’’large block". Автор же полагает, что эти понятия должны быть связаны эксплицитно. (146) отражает тот факт, что данный блок фак­тически является красным блоком, но не может отразить симметричный факт, состоящий в том, что это точно так же и большой блок. Когда будут использоваться более чем два определяющих свойства, то при построении схем типа (14в) проектировщик системы будет сталкиваться с ком-

04) б)

ISA

SUPERSET SUPERSET »-------- »• ►BLOCK

SIZE

LARGE

COLOR

I

RED

бинаторным взрывом, либо ему придется иметь дело с очень сложной проблемой выбора: он должен будет опре­делить, какие из нескольких возможных отношений тео­ретико-множественного включения должны быть экспли­цированы.

(14) в)

BLOCK

j SUPERSET

/\ SUPERSET SUPERSET

-< >

SUPERSET

COLOR

SIZE

►•RED

LARGE •-

SUPERSET

ISA

Сходная проблема, касающаяся как ’’классных", так и ”не-классных“ представлений, возникает в случае, когда подмножество определяется посредством двух свойств, которые не являются независимыми друг от друга. Напри­мер, блок, который является фактически многоцветным, может быть представлен следующим образом:

W +“-д —-..оск

COLOR

У \

BLUE RED

Но из соглашений, которые использовались до сих пор, следует, что данный блок является сплошь красным и сплошь синим. Один из способов выбраться из этого противоречия — представить blue and red block ‘синий и красный блок’ следующим образом:

ISA SUPERSET

“К

-►* BLOCK

COLOR

BLUE

\4 AND

AND

RED

Другая альтернатива: используя для представления blue and red block схему (15), ввести правило о том, что опреде­ленные связанные свойства (например, идентичные) не могут применяться к узлу порознь.

Вопрос о выборе представления затемняется еще более в случае семантической записи идиом или тонких вариан­тов общих понятий. Выражение very red nose ‘очень крас­ный нос’ должно иметь представление, которое показы­вает, что хотя фактически речь идет о красном носе, но его краснота в данном случае есть нечто особое. Black men ‘чернокожие люди’ обозначает не множество людей, име­ющих кожу черного цвета, а людей, которые обладают оп­ределенным набором характеристик, и в их число не обя­зательно входит чернота. (Вероятно, на самом деле этот вопрос относится к проблематике автоматического анализа.)

События также объединяются в группы для образова­ния более сложных событий. Какой более высокий уровень организации был предложен для сложных событий? Для того чтобы говорить о такой организации, давайте предпо­ложим, что у нас есть некоторое представление для дей­ствий и простых конструктов, скажем, типа шенковского. Это значит, что мы определили, какие отношения мы будем допускать и в каких комбинациях, а также имена наших элементарных действий. Далее, предположим, что мы ус­ловились о переводах "наивных понятий" (everyday con­cepts) на язык этого представления, то есть мы имеем не­которую структуру для sweet ‘сладкий’, для buy ‘покупать’ и т. д. В связи с этим нам сейчас нужна теория более слож­ных действий. Например, как соединить описания различ­ных подэтапов процесса приготовления торта в единое описание всеобъемлющего действия приготовления торта*

Норман определяет сложное действие в семантической сети путем описания его как упорядоченного списка под- этапов, необходимых для выполнения этого действия. Довольно интересно то, что он может описывать подобным путем также действия, которые оперируют базой данных. Например, определением для establish ‘устанавливать’; ‘создавать’; ‘учреждать’ (у него это процедура, которая должна гарантировать, что тройка ”arbu находится в базе данных) является следующая сеть:

CONNECT?

"" 'связывает ли?

ESTABLISH Trelation r I- Установить ротношени^І г

concept

'понятие

'по отношению к' agent - object „

is when 'при условии'

* act-of -

if no 'если нет'

Make CONNECTed 'осуществить связь'

1 ПО OJHI

act-of

'по отношению к' with

при помощи object

Интерпретацией этой сети является программа для опре­деляемого в ней понятия ESTABLISH. Программа прини­мает три параметра а, г и Ь. Определение отношения (команды) is when состоит в том, что программа сначала использует блок CONNECT?, чтобы проверить, связывает ли уже отношение г понятия а и b в базе данных. Если нет (if по), то а связывается (благодаря действию блока make- CONNECTed) с b посредством г. Обратите внимание, что произошло. В приведенном выше представлении с помощью семантической сети была определена процедура, которая оперирует данной семантической сетью. В рамках сети ока­зывается возможным не только описывать события, но и определять все способы использования данных (то есть ме-

ханизмы вывода умозаключений). С одной стороны, описа­ние ESTABLISH является частью данных, потому что оно представлено в семантической сети, с другой стороны, оно одновременно является процедурой.

Итак, мы косвенным образом подошли к спору о пред­ставлении данных. Есть исследователи, которые утвержда­ют, что всякое знание хранится в форме процедур, и дру­гие ученые, которые заявляют, что оно хранится как собра­ние фактов. В системе Нормана это разграничение умыш­ленно затемняется (автор считает, что так и следует посту­пать). Различные исследователи придерживаются той или иной крайней точки зрения и приводят много примеров в поддержку своего мнения. Одним из серии таких прототипи­ческих примеров является вопрос об определении дуги. С од­ной стороны, сторонники процедурного подхода говорят о том, что способ представления знания о дуге должен за­ключаться в создании программы, скажем, для ее распозна­вания. Сторонники фактографического подхода полагают, что нужно просто иметь описание обобщенной дуги. Если посмотреть с этой точки зрения на расхождения между Симмонсом и Шенком, то обнаружится, что эти расхожде­ния являются фактически вариантом указанного спора. Шенк хочет иметь универсальное (для любых целей) пред­ставление, тогда как Симмонс хочет иметь процедуры для перехода от одного представления к другому.

Из хорошо известных программ программа Винограда является, пожалуй, наиболее зависимой от процедурного знания (см. ч. первую статьи Уилкса). Первоначальное при­менение семантических сетей отличалось сильной ориента­цией на данные, а не на процедуры. Автор настоящей статьи придерживается мнения, что информация должна храниться в той форме, которая является наиболее удобной. Данные, которые хранятся в виде процедур, чаще всего несут на себе слишком сильный отпечаток специфических целей и задач по использованию информации. Лучше хранить информа­цию о том, что стол красный, чем хранить информацию о том, как определить, что стол красный. А что если нам по­надобится узнать, является ли стол зеленым? А как быть с альтернативными методами узнавания (для слепого че­ловека, например)? Высказанное общее наблюдение имеет, конечно, отклонения. Таким отклонением является, на­пример, ситуация типа той, что наблюдается у Нормана, где обе формы сосуществуют в качестве различных спосо­бов рассмотрения одной и той же репрезентации. Другое исключение касается информации о действиях.

В системе LUIGI (S с г a g g, 1974) для хранения ин­формации о действиях используются неопределенные (в смысле ориентации на данные или на процедуры) представ­ления. Система была построена в рамках системы Нормана MEMOD. Система LUIGI знала, как выполнять (фактиче­ски имитировать) различные человеческие действия типа поджаривания хлеба, приготовления спагетти или уборки кухни. Информация о том, как выполнять эти действия, хранилась в форме процедур. Однако эти процедуры могли использоваться и в качестве данных другими частями сис­темы для ответов на вопросы типа "How do you make a ham and cheese sandwich?" ‘Как Вы делаете бутерброд с вет­чиной и сыром?’, "How many utensils do you use if you make a mushroom omelette?" ‘Сколько предметов кухонной утвари Вы используете, если Вы готовите грибной омлет?’, "Why did Don use a knife?" ‘Почему Дон пользовался ножом?’ или даже на вопрос "Did anyone do anything which would have moved the bread?" ‘Сделал ли кто-то нечто, чтобы хлеб передвинулся?’, который был самостоятельно порожден программой LUIGI после того, как ей не удалось ответить на вопрос "Where is the bread?" ‘Где хлеб?’ с помощью более простых средств. Поскольку все моделирующие процедуры вполне доступны для стандартных подпрограмм, осущест­вляющих ответы на вопросы, то эти процедуры могут де­тально обследоваться, могут предсказываться их побоч­ные результаты и даже могут вычисляться необходимые для них предварительные условия, если они эксплицитно не упоминаются.

Например, чтобы ответить на вопрос:

How do you make a ham and cheese sandwich?

‘Как Вы делаете бутерброд с ветчиной и сыром?’

система должна исследовать свою собственную программу, которую она использовала бы, если бы ей было приказано сделать бутерброд. На каждом шаге программы она должна определять, является ли он тем шагом, который должен быть упомянут. Затем она порождает описание данного шага, имея в виду, что исполнителем будет она сама (то есть система) и что бутерброд будет сделан с ветчиной и сы­ром. Ее конечным выходом является;

IF I WERE TO MAKE A SANDWICH

THEN I WOULD DO THE FOLLOWING THINGS:

I PLACE SLICE OF BREAD ON THE COUNTER

I SPREAD MUSTARD ON THE BREAD

I PLACE HAM ON THE BREAD

I PLACE CHEESE ON THE BREAD

I PLACE LETTUCE ON THE BREAD

I PLACE SECOND PIECE OF BREAD ON THE BREAD

‘если бы я должна была сделать бутерброд, то я сделала бы следующие вещи: я кладу ломтик хлеба на стойку, я намазываю горчицу на хлеб, я кладу ветчину на хлеб, я кладу сыр на хлеб, я кладу салат на хлеб, я кладу на хлеб второй кусочек хлеба’

Главным моментом здесь является то, что для описания сложных действий, пригодных для удовлетворения много­численных целей, может использоваться единое представ­ление, которое ориентировано как на данные, так и на процедуры. Недавно (S с г a g g, 1975) такого рода пред­ставление было развито в сеть, которая включает альтер­нативные методы и независимый порядок шагов, а также ин­формацию о причинах и результатах и информацию о при­вязке к остальной части базы данных. Расширенная сеть должна быть соединена с такой интерпретирующей про­граммой, которая не нуждается в фиксированном порядке для шагов, но может выбирать его или наугад или на основе некоторой мотивации. Отсутствие фиксированного алго­ритма, возможно, сделает систему решения интеллекту­альных задач более похожей на человека, чем первоначаль­ный вариант системы LUIGI. Но здесь мы уже переходим к структурам данных весьма высокого уровня (см. об этом вторую часть статьи Чарняка).

<< | >>
Источник: В.А. ЗВЕГИНЦЕВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК XII. ПРИКЛАДНАЯ ЛИНГВИСТИКА. МОСКВА «РАДУГА» - 1983. 1983

Еще по теме ДВЕ СИСТЕМЫ, ОСНОВАННЫЕ НА СЕМАНТИЧЕСКИХ СЕТЯХ: