ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

СЕМАНТИЧЕСКИЕ СЕТИ

Разработка понятия семантической сети обычно припи­сывается Куиллиану (Q и і 1 1 і а п, 1968) (хотя структура,

использованная в системе SIR Рафаэла (1964), как по­казано в первой части статьи Ю.

Чарняка, имеет во мно­гом такой же вид, и мы будем говорить о ней как о се­мантической сети). В своей наипростейшей форме семанти­ческая сеть есть совокупность точек, называемых узлами; каждая из них может мыслиться как представление некото­рого понятия (точное определение понятия здесь для нас несущественно; достаточно представлять его себе как неко­торую сущность, о которой хранится информация). Каждый узел может иметь имя, например: boy ‘мальчик’ или gift ‘подарок’. Узлы без имен в общем случае соотносятся с по­нятиями, которые не представимы с помощью простого име­ни в английском языке, например: the cute little girl with the long blond curls who lives around the corner ‘миловидная маленькая девочка с длинными белокурыми вьющимися волосами, которая живет за углом’. Точка может связывать­ся посредством направленной дуги (или, если угодно, стрел­ки), которая называется отношением, с любой другой точ­кой сети. Это отношение получает некоторое обозначение (помету). Графически это может выглядеть так:

R

Схема читается следующим образом: R связывает А с В.

Принятая интерпретация этой структуры сводится к тому, что отношение R имеет место между А и В, или А на­ходится в отношении R к В. Заметим, что В не обязательно находится в отношении R к А. Именно поэтому дуга должна быть направленной и представляться в виде стрелки. Напри­мер, если А — это Anna, В — это Bill, a R — это LIKES ‘любит’, мы имеем*

LIKES

anna S' "ч bill

Вполне возможно, что Анна ни в малейшей степени не ин­тересует Билла, поэтому мы не можем заключить следую­щее:

LIKES

ANNA ЧЧ\ BILL

Любой узел может быть связан с произвольным числом

других узлов, каждый из них — с любым числом других узлов и т.

д. Если добавлять все большее и большее число узлов и дуг, графическое представление становится похо­жим на сеть из линий, поэтому оно получило название се­мантической сети (семантической, поскольку исторически такие сети были использованы прежде всего для представ­ления значений выражений на естественном языке).

Сеть может строиться для представления очень сложных взаимоотношений, например, в:

ISA

Charles представляет некоторого конкретного члена множества всех мальчиков (ISA означает is а ‘есть некоторый’, boy — ‘мальчик’).

Charles hit the blond haired girl.

‘Чарльз ударил девочку с белокурыми волосами.’ может быть представлено как:

BOY

'мальчик'

BLOND

'белокурый'

где НАР означает has-as-part ‘имеет в качестве части’. Заметим, что здесь имеются непоименованные узлы, пред­ставляющие конкретную девочку и ее волосы. (Таким не­поименованным узлам иногда приписываются произвольные символы типа Cl, С2 и т. д. для внутренних ссылок.) Если добавить дополнительную информацию о том, что девочка

Минимальной единицей информации в семантической сети является тройка ARB. Но базисная единица — это узел, или понятие. Понятие обладает информационным содержанием лишь в силу того, что оно связано с другими узлами. Можно считать, что информация существует в от­ношениях. Понятие, не участвующее ни в каких отношени­ях, лишено содержания, и мы считаем, что доступ к нему закрыт. Это понятие, о котором ничего не известно (дейст­вительно, это весьма странное понятие).

была высокая, узел, репрезентирующий девочку, будет рас­ширен:

Слово ’’понятие" (concept) обычно используется для обо­значения как общих, так и конкретных понятий. Конкретное понятие, подобное этому листу бумаги или конкретному мальчику, который ударил белокурую девочку, в нашем последнем примере, мы будем называть ”элементом“ ("to­ken").

Неконкретные понятия будут называться ”типами“ ("types"). Часто неконкретные понятия являются типами- классами, например GIRL и HAIR. В других случаях они могли бы, вероятно, тоже интерпретироваться как классы (TALL = класс высоких вещей?), но мы находим такие интерпретации натянутыми и не будем настаивать на том, что все ’’типы" являются классами. (Читатель, знакомый со статьей Куиллиана, может заметить, что принятое нами употребление терминов ’’тип" и ’’элемент" несколько отли­чается от того, которое мы находим у Куиллиана.) Мы ви­дели в нашей последней схеме, как элемент (the blond girl) был связан с соответствующим типом (girl) посредством от­ношения ISA (для выражения этого отношения используют­ся также обозначения IS-A и ELEMENT). В этих случаях мы можем сказать, что узел-элемент (blond girl) ’’является элементом" соответствующего узла-типа (girl). Типы (girl), которые являются подтипами других типов (human ‘чело­веческий’), могут связываться со своим более крупным ти­пом посредством отношения SUPERSET ‘надмножество’ (S. S. или другие эквивалентные обозначения).

Важно подчеркнуть разграничение между ти­пом и элементом. Системы, в которых оно игнорируется, обычно сталкиваются с трудностями, связанными с тем, что в них невозможно провести различие между сущностью (элементом) и множеством (типом), которое не имеет членов. Чтобы пояснить это, предположим, что у нас имеется (не­правильная) структура (1) следующего вида:

(1) ANIMAL

'животное'

ISA ISA ISA

PIG

'свинья'

FIDO

ROVER

REX

CLEO

Это подструктура некоторой базы данных. Если бы системе, использующей эту базу данных, был задан вопрос:

How many animals do you know about?

‘О скольких животных Вы знаете?’ она могла бы ответить ‘о трех’, подсчитав непосредственные подмножества узла ANIMAL. Или она могла бы ответить ‘о пяти’, пройдя по всем цепочкам с отношениями ISA до их концов (CLEO, FIDO, ROVER, REX и PIG).

Но распо­знать, что в действительности имеется четыре конкретных животных (их клички Cleo, Fido, Rover, Rex), невозможно, если только не пометить каким-нибудь способом типы и элементы, например используя два различных отношения — ISA и SUPERSET. Альтернативный путь может состоять в том, чтобы пометить каждый узел особым обозначением, указывающим, является ли он классом или элементом.

Обсуждая последние примеры, мы впервые конкретно коснулись активного аспекта памяти. В этом примере, для того чтобы обосновать форму, которую должна иметь сеть (необходимость разграничения ’’тип — элемент"), мы долж­ны были обратиться к проблеме поиска информации (выяс­нения того, о скольких животных имеются сведения в сис­теме). Действительно, популярность сетей вначале была во многом обязана их способности существенно облегчать оп­ределенные виды поиска и вывода. В частности, они могут Великолепно справляться с выводами типа "Сократ — чело­

s.s,

as.

BIRD

ANIMAL

НАР

\

НАР

\

ч

WING

SKIN

YELLOW

\

CANARY-

COLOR

век, все люди смертны". Здесь мы рассмотрим пример "ка­нарейка — птица, все птицы имеют крылья".

Если эту схему рассматривать как часть сети, то цвет кана­рейки можно найти простым прохождением стрелки COLOR от CANARY ‘канарейка’ к YELLOW ‘желтый’. Чтобы оп­ределить, имеет ли канарейка крылья (заметим, что НАР не связывает здесь CANARY и WING ‘крыло’), необходимо только заметить, что BIRD НАР WING и CANARY

S. S. BIRD, следовательно, канарейки должны тоже иметь крылья. Аналогично, повторив еще раз силлогическое рассуждение, можно установить, что канарейки имеют кожу (skin). Таким образом, для некоторых ситуаций семанти­ческие сети обеспечивают естественный метод вывода.

Можно назвать еще два свойства семантических сетей, которые способствовали росту их популярности. Во-первых, семантические сети подсказывают некоторые способы со­кращения объема информации, подлежащей хранению. Нет необходимости специально отмечать, что канарейки имеют крылья, и вороны имеют крылья, и малиновки имеют крылья, и утки имеют крылья. Нужно только, чтобы каж­дое такое свойство было связано с самым общим типовым узлом, который обладает этим типичным свойством (в нашем случае этот узел — BIRD ‘птица’). Привлекательность такого представления заключается еще в том, что оно экс­плицитно показывает, каковы общие черты большинства птиц. Вторым фактом, который послужил толчком для рас­пространения идеи семантической сети, был ряд результа­тов психологических экспериментов, из которых следовало, что хранение информации в мозгу человека осуществляет­ся, вероятно, тоже в виде сетей (Collins and Q и і 1 1 i- a n, 1968); правда, позднее были получены и иные выводы (В і s с h о f, 1978). Было замечено, что время ответной ре­акции человека устойчиво возрастает по мере того, как во­просы затрагивают свойства все более и более общего ха­рактера (например, канарейки желтые, имеют крылья, имеют кожу и т. д.). Именно это и предсказывают семанти­ческие сети, так как более общие свойства находятся дальше от конкретных элементов и, чтобы найти их, нужно про­смотреть больше узлов.

ОБОБЩЕНИЯ СЕТЕЙ

Первоначально казалось, что семантические сети дают нечто ценное для всех и являются настоящей панацеей для психологов и специалистов по вычислительной технике. Однако более поздние психологические результаты пока­зали, что сами по себе сети не являются хорошими психоло­гическими моделями, а специалисты по вычислительной технике скоро столкнулись с формальными трудностями, вытекающими из того, что по мере рассмотрения более слож­ных данных сети, применявшиеся в ранних системах, скоро оказались в ряде отношений недостаточными: чтобы они и дальше могли быть жизнеспособными моделями, требова­лись ограничения или дополнения в базисной структуре.

Некоторые из этих формальных проблем решаются в мо­дели памяти, развиваемой Норманом, Линсеем и Румель- хартом (см. Norman & Rumelhart, 1975) и со­ставляющей ядро предполагаемой комплексной психологи­ческой модели. Память в их понимании предусматривает не­которые усовершенствования и расширения по сравнению с исходным понятием семантической сети.

Одна из проблем, связанных с описанным выше пред­ставлением сети, возникает при моделировании фактов типа John hit Магу ‘Джон ударил Мэри’, которые мы представ­ляем следующим образом:

HIT

Возникающая здесь трудность заключается в том, что у нас нет возможности добавить дополнительную информацию об этом событии, информацию о том, когда он ударил ее, где (как в смысле локализации удара на теле, так и в смыс­ле места, где произошло действие в целом), была ли исполь­зована палка и т. д. Эта трудность может быть устранена посредством введения концептуальных узлов не только для объектов, но и для событий. Тогда мы получим:

FIST

'кулак'

/

INSTRUMENT

AGENT / OBJECT

JOHN -ч .............................. — HIT---------------------------------------------- MARY

LOCATION TIME

'местоположение' 'время'

/ \

THE PARK WEDNESDAY

'ларк' ' среда'

MORNING

'утро'

3 a.m.

'3 часа дня'

Заметим, что если раньше мы различали, кто ударил кого, помещая одно понятие в конце стрелки, обозначающей отношение, а другое — в начале, то теперь так сделать нель­зя, поскольку теперь John и Магу каждый имеют свою

собственную стрелку. Вместо этого мы проводим данное

разграничение посредством эксплицитного называния одно­го элемента агенсом, а другого — объектом, придавая пред­ставлению вид, напоминающий падежную структуру.

Но и это представление не разрешает всех проблем. Рас­смотрим представление для следующего предложения:

John hit Mary and Bill hit Sue.

‘Джон ударил Мэри, а Билл ударил Сью.’

JOHN MARY

AGENT OBJECT

X /

HIT

X X

AGENT OBJECT

X X

BILL SUE

Теперь уже неясно, кто ударил кого и сколько таких дейст­вий произошло в действительности. (Не годится здесь и такое решение, чтобы было два узла, помеченных HIT, по­скольку, при наличии одинаковых помет, не будет возмож­ности различить их при поиске.) Чтобы обойти эту труд­ность, мы должны разграничивать конкретные действия типа "ударить" и понятие "ударять вообще". Тогда полу­чаем:

BILL

/

АО ENT

ACT-QF HIT ---

OBJECT

\

SUE

^ JOHN

\

AGENT

ACT-OF

OBJECT

/

MARY

Узел HIT в центре представляет понятие ‘ударять’. Два конкретных происшествия, когда кого-то ударили, свя­заны с общим понятием HIT посредством отношения ACT-OF ‘действие типа’. Отношение ACT-OF между понятиями, отражающими действие, аналогично отношению ISA между понятиями, отражающими предметы.

Узел HIT в (2) мог бы быть расширен:

/ \

AGENT OBJECT

/ \

X Y

Эта информация, как показывает ее местоположение в схе­ме, относится к общему понятию ‘ударять’. Она означает, что без указания отношений AGENT и OBJECT данное понятие является неполным (или даже невообразимым). Следовательно, каждое отдельное действие типа HIT (свя­занное отношением ACT-OF) должно иметь и стрелку AGENT, и стрелку OBJECT. Такие обязательные атрибуты могут мыслиться как аналоги глубинных падежных от­ношений [57], за исключением того, что здесь они выступают как требования к памяти, а не к самой языковой структуре. Заметим, что представление в виде семантической сети вполне определенно предполагает использование именно падежной структуры, а не позиционной структуры, как в представлении типа исчисления предикатов. Таким обра­зом, в то время как раньше предикаты типа hit выступали как связи между узлами (или, более формально, как от­ношения между узлами), теперь они сами выступают в роли узлов. Так как первоначально в нашем представлении все предикаты были отношениями, мы могли употреблять эти термины во многом как синонимы. А теперь этого делать нельзя. Поэтому мы будем и дальше употреблять термин отношение для обозначения связей между узлами, тогда как термин предикат будет теперь обозначать общие поня­тийные узлы типа HIT. Более того, мы будем называть структуры типа (2) ”предикатными структурами", чтобы подчеркнуть тот факт, что здесь HIT является узлом (пре­дикатом), а не связью.

Этот переход в статусе от связи к узлу будет иметь целый ряд важных последствий для использования семантиче­ских сетей, что станет ясно в процессе изложения. Сейчас же заметим, что отношения типа AGENT будут фигуриро­вать в сети очень часто. Каждый отдельный случай осуще­ствления практически каждого действия будет иметь от­ношение AGENT (или ACTANT, или какое-то другое в том же роде — употребляемые здесь термины не означают, что мы пользуемся какой-либо конкретной системой глу­бинных падежей).

Один из результатов введения предикатных структур состоит в том, что в семантической сети теперь может быть представлен эквивалент любого N-арного предиката, зада­ваемого посредством ИППП (см. часть 1-ю статьи Чарняка). До этого дополнения в семантической сети имелись эк­виваленты (в виде дуги отношения) только для двухмест­ных предикатов. Эти новые преимущества приводят, прав­да, к увеличению объема базы данных и, вероятно, к уве­личению времени поиска. Впрочем, мы должны предупре­дить читателя, что, несмотря на тот факт, что все современ­ные семантические сети используют средства, аналогичные описанным предикатным структурам, авторы таких систем продолжают проводить свои рассуждения так, как будто бы этого не было, и продолжают использовать старую нота­цию в качестве сокращения для новой. Мы будем поступать так же. Однако, когда будет проводиться дуга, в действи­тельности представляющая некоторый узел, мы будем по­мечать ее символом узла в виде кружка в центре дуги. Так:

HIT

/

ACT-OF

AGENT / OBJECT JOHN -ч-------------------- *------------------- —*• MARY

становится:

HIT

JOHN

MARY

Иногда возникает необходимость представлять в базе данных суждения, про которые неизвестно, истинны ли они, или даже известно, что они ложны. Например, чтобы представить:

Peter said that he went to the store ‘Питер сказал, что он пошел в магазин’

требуется, чтобы

Не went to the store ‘Он пошел в магазин’

было представлено каким-либо образом в нашей сети, даже если известно, что оно ложно. Один из способов сделать это — пометить каждый предикатный узел значением ис­тинности TRUE ‘истинно’, FALSE ‘ложно’ или UNKNOWN ‘неизвестно’. Так, Peter said that he went to the store могло бы быть представлено е следующем виде:

PETER

'Питер'

POLARITY

'полярность'

STORE

'магазин'

UNKNOWN

'неизвестно'

Здесь мы знаем, что Питер сказал это, но не знаем, действи­тельно ли он пошел. Однако это обозначение не является достаточным для адекватного представления всех случаев. Рассмотрим схему:

SAY GO

Эта запись может пониматься двояко:

Peter said that he went to the store, but he really didn’t ‘Питер сказал, что он пошел в магазин, но в самом деле он не пошел’ и:

Peter said that he didn’t go to the store ‘Питер сказал, что он не идет в магазин’

Один из способов записи, позволяющий преодолеть эту трудность, был разработан Шубертом (Schubert, 1975). Он использует логический оператор NOT ‘не’ в ка­честве предиката. Так:

Peter didn’t go to the store ‘Питер не пошел в магазин’

Он вводит дополнительное соглашение о том, что некоторый узел в базе данных соотносится с действительным утвержде­нием (которое объявляется истинным) тогда и только тогда, когда на схеме не существует входящей в него стрелки. Так, на последней схеме отрицание утверждается (is asser­ted), а утвердительное высказывание — нет. Опираясь на это соглашение, можно по разному представить два зна­чения, которые "скрыты" в схеме (3):

SAY GO

SAY NOT GO

РЕАЛИЗАЦИЯ

GO

PETER

представляется в виде:

Следует остановиться на преобразовании семантиче­ских сетей в машинные представления. До сих пор мы пы­тались обсуждать проблематику семантических сетей, не рассматривая проблем их реального представления в вы­числительной машине. Но существует по крайней мере один важный вопрос, который не встает при рассмотрении се­мантических сетей как графов, но который мы будем вы­нуждены решать, если действительно попытаемся реализо­вать систему, основанную на семантической сети. Поскольку в цифровой вычислительной машине нельзя хранить линии и узлы как таковые, то мы должны выбрать некоторую аль­тернативную схему представления. Имеется две основных возможности:

Перечислить для каждого узла все отношения, в ко­торые он вступает (вместе с именами узлов, на которые указывают отношения), то есть:

JOHN

HIT BILL LOVES MARY

‘Джон*

‘ударил Билла* ‘любит Мэри*

Перечислить для каждого понятия-отношения все пары узлов, которые связаны этим отношением.

LOVE

JOHN, MARY JOAN, FRANK

‘Любить’

‘Джон*, ‘Мэри’ ‘Джоан’, ‘Фрэнк’

(Можно было бы, конечно, идя на значительную избыточ­ность, использовать оба эти способа, или, может быть, не­которую их комбинацию.) Второй вариант, если применить его отдельно, работать, по существу, не будет, поскольку в результате мы получим массив, где все случаи применения каждого данного отношения сгруппированы вместе. Это было бы не так уж плохо, если бы наши отношения были того типа, который описан ранее (и использован выше), то есть типа LOVE и HIT. Для того чтобы выяснить, лю­бит ли Джон кого-нибудь, мы могли бы просто просмотреть записи, хранящиеся под рубрикой отношения LOVE, где был бы список всех пар (А, В), таких, что A LOVES В ис­тинно. Если JOHN появляется в левой части какой-либо пары в этом списке, то мы считаем, что он любит кого-то (а именно лицо, приписанное ему в данном списке). Однако вспомним, что LOVE представляется сейчас посредством предикатной структуры, а отношения теперь носят харак­тер понятий типа AGENT и OBJECT. Поскольку большин­ство (или все) предикаты имеют AGENT, поиск в списке пар для отношения AGENT был бы эквивалентен просма­триванию каждого предиката в базе данных, чтобы опре­делить, встречается ли Джон в статусе агенса с последую­щей проверкой того, является ли 'найденный предикат ACT-OF LOVE. Даже после этого исчерпывающего поиска мы не знали бы, кто был ОБЪЕКТОМ его ЛЮБВИ.

LOVE 7 ACT-OF LOVE HAS-AGENT JOHN HAS-OBJECT JILL

С другой стороны, если бы все индексировались по уз­лам и мы хотели бы получить ответ на поставленный выше вопрос, мы просмотрели бы записи под рубрикой, соответ­ствующей узлу JOHN, и увидели бы, является ли он аген­сом какого-либо предиката:

JOHN AGENT LOVE 7

JILL OBJECT LOVE 7

Если такой предикат есть и если это ACT-OF LOVE, то мы заключаем, что Джон любит кого-то. Заметим, что LOVE 7 (отдельный случай реализации LOVE) тоже являет­ся узлом, поэтому в базе данных должен быть указатель отношений, в которые он вступает. Чтобы выяснить, кого именно Джон любит, надо просто просмотреть отношение HAS-OBJECT в списке для LOVE 7. Итак, важно, что­бы данные хранились (по крайней мере) в узловом фор­мате.

Заметим, что в приведенном примере индексирования у нас фактически хранилась избыточная информация. Чтобы выразить тот факт, что Джон любит Джилл, мы использо­вали пять записей, хотя теоретически могли бы обойтись и тремя, скажем, теми, которые перечислены под LOVE 7. Однако на практике этот путь малопригоден, поскольку при такой схеме каждый раз, когда мы хотели бы узнать, любит ли кого-либо Джон, система должна была бы прос­матривать каждый узел и определять, обладает ли он свой­ствами, приписанными выше узлу LOVE 7. Очевидно, в такой ситуации экономия на сокращении избыточных за­писей в указателях отношений только ради того, чтобы быть втянутыми в подобный поиск, была бы ложной экономией. Но в других случаях ситуация не столь ясна. Рассмотрим отношение SUBSET ‘подмножество’. При полном индекси­ровании хранилась бы не только информация при А о том,

что оно есть SUBSET относительно В, но также и при В — информация о том, что В есть SUPERSET относительно А. И снова мы имеем дело с избыточной информацией, но, как мы уже видели, поиск конкретного факта значительно ускоряется, если обратное отношение хранится в экспли­цитном виде. Если же мы только укажем при А, что А SUBSET В, то будет очень трудно найти все подмножества узла, и наоборот. С другой стороны, представляется мало­вероятным, что человек всегда хранит в памяти как SUBSET, так и SUPERSET. Заметим, что на вопрос:

Dachshunds are _________ ?

‘Таксы являются_________ ?’

легко ответить ”dogs“ ‘собаками’, поэтому можно считать, что при DACHSHUND в памяти хранится соотношение (DACHSHUND SUBSET DOG) или какой-то его эквива­лент. Но:

Name ten kinds of dogs

‘Назовите десять пород собак’

— гораздо более трудный случай. (Вы, может быть, и зна­ете десять пород, но если только Вы не являетесь знатоком собак, задание потребует от Вас определенного времени.) Это может служить свидетельством в пользу того, что при понятии DOG в памяти не хранится список всех его под­множеств. Но в целом вопрос о том, в каких же именно слу­чаях должны храниться и прямые отношения, и обратные, остается нерешенным.

БЕГЛОЕ СРАВНЕНИЕ СЕТЕЙ И ИСЧИСЛЕНИЙ

Очевидное преимущество представления в форме ис­числения предикатов заключается в том, что мы получаем в свое распоряжение всю мощь ИППП и можем осуществлять логический вывод на основе базы данных без дополнитель­ных усилий. ИППП дает средства для представления кван­торов и других понятий, выразить которые в семантиче­ских сетях совсем не просто. Попытайтесь представить в форме сети хотя бы такое выражение:

СУЩЕСТВУЕТ (Х)(Р(Х) И Q (X) ИМПЛИЦИРУЕТ R (X)) Один из недостатков ИППП как способа представления данных состоит в отсутствии хорошей организации фактов

(см. часть I статьи Чарняка). Любой, кто пытался про­водить доказательства в ИППП, знает, что не всегда легко выбрать формулы и правила вывода для вычисления не­которого конкретного факта. Методики, используемые в настоящее время в программах по доказательству теорем, являются даже менее эффективными, чем действия людей (в том, что касается выбора наиболее подходящего мате­риала). В принципе, конечно, не существует причин, ко­торые препятствовали бы привнесению в ИППП многих структурных свойств семантической сети (многие из них действительно использовались в ИППП), но тем не менее, мы должны признать, что ИППП не оказалось такой же удобной основой для развития методов организации фак­тов, как семантические сети.

Хотя мы описывали семантические сети так, как будто это существенно отличный от ИППП метод представления памяти (и в самом деле, мы полагаем, что они действитель­но различны по цели), тем не менее можно показать, что они, в принципе, эквивалентны по выразительной силе, хотя из этого не следует эквивалентность по удобству поль­зования.

Чтобы убедиться в этом на интуитивном уровне, доста­точно обратить внимание на сходство между списком двух­аргументных предикатов ИППП и машинным представле­нием семантической сети, описанным в предыдущем разделе (то есть списком троек типа понятие — отношение — поня­тие). Однако не так легко показать, что они эквивалентны в точном смысле. Главные трудности концентрируются при этом вокруг проблемы квантификации. Каким образом выражаются в семантической сети кванторные свойства от­ношений? Многие сторонники семантических сетей, описы­вая смысл вводимых отношений в терминах квантификации, делают это весьма неопределенно, а иногда даже и непосле­довательно. Например, если представление

НАР

HUMAN

HEART

является подструктурой базы данных, то обычная его ин­терпретация состоит в том, что все люди (HUMAN) имеют сердце (HEART). Но если в базе данных имеется представ­ление

MAN

* FOOTBALL

то нам говорят, что это означает, что мужчины иногда игра­ют в футбол. (Или, более точно, мы считаем, что в то время как каждый человек имеет сердце, если специально не утверждается обратное, то в футбол играют лишь некоторые мужчины.) При ближайшем рассмотрении оказывается невозможным приписать отношениям некую простую ин­терпретацию, которая покрывала бы все возможные кван­тификации этого отношения. Чтобы убедиться в этсм, за­метим, что у двухместного пргедиката в исчислении пре­дикатов может быть шесть разных квантификаций:

(4) а) ДЛЯ ЛЮБОГО (X) (ДЛЯ ЛЮБОГО (Y) (RX, Y))

б) ДЛЯ ЛЮБОГО (X) (СУЩЕСТВУЕТ (Y) (RX, Y))

в) ДЛЯ ЛЮБОГО (Y) (СУЩЕСТВУЕТ (X) (RX, Y))

г) СУЩЕСТВУЕТ (Х)(ДЛЯ ЛЮБОГО (Y) (RX, Y))

д) СУЩЕСТВУЕТ (Y) (ДЛЯ ЛЮБОГО (X) (RX, Y))

е) СУЩЕСТВУЕТ (X) (СУЩЕСТВУЕТ (Y) (RX, Y))

Однако в семантической сети можно отразить только че­тыре разных квантификации, получаемых посредством при­соединения кванторов к каждому концу дуги отношения:

(FOR-ALL) (для любої

X

R

(FOR-ALL) ія любого)

Y

Everyone loves everybody 'Каждый любит каждого '

(EXISTS)

(существует)

Ч Y

R

(FOR-ALL) (для любо

X

ALL humans have hearts 'У всех людей есть сердца'

R

(EXISTS)

{существу!

X

(FOR-ALL)

‘ цля любого)

ч Y

There Is a man who loves all women

'Существует мужчина, который любит всех женщин'

R

(EXISTS)

(существует)

(EXISTS)

(существует)

Some men have watches 'У некоторых мужчин есть часы'

Если семантическая сеть должна иметь в плане квантифи­кации ту же выразительную силу, что и ИППП, тогда долж­ны быть найдены некоторые дополнительные (более слож­ные) структурные правила.

Шуберт (Schubert, 1975) указал один способ пе­ревода большинства структур, имеющихся в ИППП, в семантическую сеть. Для этого высказывание, представ­ленное в форме исчисления предикатов, он прежде всего пе­реписывает в форме Сколема (см. первую статью Чарняка),— в форме, которая не имеет кванторов существования, а все кванторы общности находятся за пределами основной части выражения. В его графе узлы, которым приписан квантор общности, специально помечены (он использовал пунктир­ный кружок). Любой узел, обозначающий некоторую функ­цию Сколема и зависящий от узла, соотносящегося с кван­тором общности, соединяется (посредством пунктирной дуги) с этим узлом-хозяином, например:

(5) Every man loves a woman.

‘Каждый мужчина любит женщину.’ имеет две интерпретации, представляемые в ИППП как:

FOR-ALL (X) (EXISTS (Y) (MAN (X) IMPLIES (WOMAN (Y) AND LOVE (X, Y))))

‘ДЛЯ ЛЮБОГО (X) (СУЩЕСТВУЕТ (Y) (МУЖЧИНА (X) ИМПЛИЦИРУЕТ (ЖЕНЩИНА (Y) И ЛЮБИТ (X, Y))))’ и

EXISTS (Y) (FOR-ALL (X) (WOMAN (Y) AND (MAN (X) IMPLIES LOVE (X, Y))))

‘СУЩЕСТВУЕТ (Y) (ДЛЯ ЛЮБОГО (X) (ЖЕНЩИНА (Y) И МУЖЧИНА (X) ИМПЛИЦИРУЕТ ЛЮБИТ (X, Y))))’

В результате сколемизации мы получаем:

FOR-ALL(X) (MAN X IMPLIES WOMAN(MANS-WO- MAN(X)) AND LOVE (X, MANS-WOMAN (X)))

‘ДЛЯ ЛЮБОГО (X) (МУЖЧИНА (X) ИМПЛИЦИРУЕТ

ЖЕНЩИНА (ЖЕНЩИНА-МУЖЧИНЫ (X)) И ЛЮБИТ (X, ЖЕНЩИНА-МУЖЧИНЫ (X)))’

FOR-ALL(X) (WOMAN(A) AND (MAN(X)IMPLIES LOVE(X.A)))

‘ДЛЯ ЛЮБОГО (X) (ЖЕНЩИНА (А) И (МУЖЧИНА (X) ИМПЛИЦИРУЕТ ЛЮБИТ (X, А)))’

(А является константой).

В семантической сети два этих утверждения могут быть представлены следующим образом:

о

<< | >>
Источник: В.А. ЗВЕГИНЦЕВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК XII. ПРИКЛАДНАЯ ЛИНГВИСТИКА. МОСКВА «РАДУГА» - 1983. 1983

Еще по теме СЕМАНТИЧЕСКИЕ СЕТИ: