ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

ПРИМЕР

Ниже приведено предложение, взятое из заметки с первой страницы газеты ’’Нью-Йорк Таймс":

An Arabic speaking gunman shot his way into the Iraqi Embassy here (Paris) yesterday morning, held

hostages through most of the day before surrendering to French policemen and then was shot by Iraqi security officials as he was led away by the French officers.

‘Вчера утром здесь (в Париже) вооруженный че­ловек, говорящий по-арабски, стреляя на ходу, вор­вался в иракское посольство, захватил заложников и держал их большую часть дня, а затем сдался фран­цузским полицейским, позднее он был застрелен со­трудниками иракской службы безопасности в то время, когда его уводили французские офицеры.’

Рассмотрим теперь это предложение слово за словом и попытаемся определить желаемый вид обработки в рамках интегральной схемы понимания. Программа, которую мы опишем ниже, осуществляет именно такую обработку. Мо­дель будет пропускать неинтересные части и строить свое представление, когда это необходимо, стараясь заканчи­вать полную обработку каждой подчасти без отставаний. Иными словами, мы хотим, чтобы предлагаемая нами модель заканчивала обработку, лишь слегка запаздывая по отношению к моменту, когда была получена входная информация,— точно так же, как действует человек.

Отметим здесь один важный момент: хотя мы и будем обсуждать анализ этого предложения, следуя слово за словом слева направо, мы не должны думать, что и в дей­ствительности человек понимает текст по принципу ”не более одного слова одновременно". На деле слова посту­пают целыми группами, как при визуальном (чтение), так и при слуховом (устная речь) восприятии. Поэтому мы тоже можем производить обработку по тому же прин­ципу. Так, например, для любого рассматриваемого слова мы всегда знаем следующее за ним слово. Такое допущение может упростить решение проблемы снятия неоднознач­ности.

****************

An Arabic speaking gunman...

‘Вооруженный человек, говорящий по-арабски...’ *************************

AN (неопределенный артикль) — это слово, которое сначала нужно только сохранить, чтобы не забыть. Это значит, что система смотрит его в словаре и находит там указание перейти к следующему слову, поместив AN в какой-то отсек оперативной памяти (ОП) с тем, чтобы вернуться к нему позднее.

ARABIC ‘арабский’ подается в словаре как слово, которое может быть пропущено, если ему предшествовало другое пропускаемое слово, поэтому наша модель про­пускает его и помещает в ОП.' (То, что слово ARABIC может быть пропущено, было определено еще при разра­ботке модели и записано в словаре. Сами же критерии определения того, что может пропускаться, составляют одну из интересных актуальных проблем при моделиро­вании языковой способности человека. (Обсуждение этих вопросов можно найти в Schank and Selfridge,

1977) . Обычно прилагательные (правда, не все) могут пропускаться. Слово Russian ‘русский’, например, не может быть пропущено, потому что оно может обозначать деятеля. Не могут пропускаться и прилагательные, отме­ченные как представляющие определенный интерес, на­пример disgusting ‘отвратительный*, murderous ‘крова­вый’, lecherous ‘распутный’ и т. д.)

SPEAKING ‘говорящий’ также может быть пропущено, пока не встретилось потенциальных деятелей. Поиск обо­значений ДЕЯТЕЛЕЙ в ОП приводит к отрицательному результату. Поэтому данное слово также пропускается.

GUNMAN ‘вооруженный человек’ снабжено признаками ACTOR ‘деятель’, NOUN ‘существительное’ и HIGH IN­TEREST ACTOR ‘деятель, представляющий большой ин­терес’. Тот факт, что у нас появилось слово с признаком HIGH INTEREST, заставляет нас построить запросы типа ’’сверху вниз", связанные с выяснением определенной информации; в частности, теперь мы хотим получить от­веты на следующие вопросы:

КТО он? — Заставляет нас собрать вместе накопленные прилагательные (например, ARABIC) и приписать их к элементу памяти, обозначающему данного человека (GUN­MAN).

ЧТО он сделал? — Ответом на этот вопрос служит единица, которую мы находим в памяти при элементе GUNMAN, а именно — SHOOT ‘стрелять’. Таким образом, еще до того как в систему поступит продолжение текста, выводится умозаключение, что упомянутый вооруженный человек стрелял или будет в кого-либо стрелять.

В КОГО он стрелял? — Вопрос заставляет поинтере­соваться синтаксическим объектом глагола, которым, по. нашему допущению, является SHOOT.

ПОЧЕМУ он стрелял? — Заставляет нас искать при­чину.

ГДЕ это случилось? — Заставляет нас искать место­нахождение.

КАКИЕ СЦЕНАРИИ могут быть вызваны? — Само слово GUNMAN может послужить причиной вызова того или иного сценария. Наиболее вероятен вызов сценариев $ROBBERY ‘ограбление’, $TERRORISM ‘терроризм’ и $KIDNAP ‘похищение’. Теперь мы можем заняться по­иском подтверждений в остальной части предложения.

Вопросы, сформулированные выше (в виде запросов; см. R і е s b е с к, 1975), будут теперь управлять анализом остальной части этого предложения. Здесь важно указать на то обстоятельство, что посредством этих запросов на самом деле осуществляется управление не просто разбором предложения, а процессом гораздо более сложного порядка. Эти вопросы затрагивают информацию, которая интересна для нас в более широком плане понимания. Мы осуществ­ляем фактически целостный процесс понимания этого рас­сказа. Запросы в равной степени затрагивают факторы, существенные и для собственно анализа, и для вывода умозаключений, и для применения сценариев, и для целе- полагания.

******************

shot his way into the Iraqi Embassy...

‘стреляя на ходу, ворвался в иракское посольство...® ***********************^***

SHOT ‘стреляя’ сразу же признается тем словом, кото­рое удовлетворяет ожиданию, вытекающему из информации, приписанной слову GUNMAN. Именно путем удовлетво­рения подобных ожиданий строятся концептуальные струк­туры, и в данном случае мы строим первую такую струк­туру — представление для действия SHOOT. При этом по­зиция деятеля заполняется элементом, обозначающим упо­мянутого вооруженного человека, а позиция направления стрельбы остается незаполненной.

Эта незаполненная по­зиция маркируется так же, как позиция, удовлетворяющая

ответу на вопрос типа "КТО . . .?“ (см. выше), и теперь ана­лизатор "заинтересован" в том, чтобы найти ответ на ука­занный вопрос,' связанный с концептуальной структурой SHOOT; с этой целью система ищет следующее главное существительное в последующей именной группе.

HIS ‘его’, ‘свой’ пропускается и хранится в ОП.

WAY ‘путь’ не удовлетворяет ожиданию, связанному с заполнением пустой позиции. Слово WAY фиксируется, с одной стороны, как пропускаемое слово, а с другой, как указание на направление или местоположение. В этот момент создается запрос, связанный с поиском этого ме­стоположения, и мы предпринимаем попытку пропускать последующие слова до тех пор, пока не найдем обозначение искомого места.

INTO ‘в (вовнутрь)’ подано в словаре как пропуска­емое слово.

THE (определенный артикль) записывается в ОП и пропускается.

IRAQI ‘иракский’ записывается в ОП и пропускается.

EMBASSY ‘посольство’ оказывается обозначением ме­ста и фиксируется как местоположение события SHOOT. Более того, EMBASSY помечается как слово, представ­ляющее интерес, и как обозначение места, важного в политическом отношении. Последняя информация удов­летворяет условиям запроса, вызывающего сценарий $TER- RORISM, предсказанного нами (среди прочих) на основе анализа слова GUNMAN. Коль скоро EMBASSY пред­ставляет интерес, активизируются его запросы. Один из них направлен на поиск страны, которую представляет данное посольство. В результате из ОП извлекается слово IRAQI, которое удовлетворяет указанному запросу.

Фиксация сценария $TERRORISM приводит к тому, что мы перестаем интересоваться представлением предло­жения как такового и сосредоточиваем свое внимание на формулировании и удовлетворении запросов, вытекающих из этого сценария и необходимых для представления рас­сказа в целом. Итак, теперь мы пытаемся найти ответы на следующие запросы:

Были ли взяты ЗАЛОЖНИКИ?

Какие были предъявлены требования? (Деньги? Осво­бождение политических заключенных?)

Был ли причинен какой-либо ущерб?

Какие меры были предприняты против террориста? (Ответный огонь? Арест? Освобождение заложников?) ************

here yesterday morning...

‘здесь вчера утром...’

***********

HERE ‘здесь’ в рамках сообщения о новостях всегда обозначает то место, которое указано в газетной строке, содержащей дату сообщения. Запись этой локализации добавляется к представлению рассказа.

YESTERDAY ‘вчера’ оказывается обозначением вре­мени и поэтому записывается в позицию времени в струк­туре данного события.

MORNING ‘утро’ тоже обрабатывается указанным спо­собом.

%%%%%%%%%%%%%%%%%%%

held hostages through most of the day...

‘задерживал заложников большую часть дня...’

HELD ‘задерживал* пропускается, потому что оно не соответствует ни одному из запросов. Такого соответствия нет по той причине, что информация о слове HELD, име­ющаяся в обозреваемой части словаря, сводится лишь к тому, что это — глагол. Поскольку появление глаголов не предсказывалось, мы пропускаем это слово. Можно, конечно, представить себе случай, когда при этом слове стояла бы помета о его интересности. Заметим, что HELD — чрезвычайно многозначное слово; раньше мы, может быть, и стали бы выводить многочисленные предсказания из него, а потом искать подтверждения того, какое из зна­чений имелось в виду. При интегральной понимающей системе у нас нет необходимости это делать. Причина этого вскрывается при рассмотрении хода последующей обработки данной группы.

HOSTAGES ‘заложники’ прямо отвечает одному из имеющихся запросов. Вызывается соответствующая сцена из сценария ^TERRORISM, а именно сцена ВЗЯТИЕ ЗАЛОЖНИКОВ. В этот момент производится проверка хранящегося в ОП глагола с целью удостовериться в пра­вильности принятого решения. Если бы, например, в ОП хранился глагол shot ‘застрелил’, то этот вызов не должен был бы срабатывать. Глагол HELD оказывается в точности таким словом, которое вполне согласуется с вызываемой сценой. Важный момент состоит здесь в том, что значение глагола HELD и не должно было определяться в изолиро­ванном виде, что представляется удачным решением, потому что слова типа HELD в действительности не имеют какого-либо конкретного значения.

Значение этого глагола вытекает из его связи с HOSTAGES, а слово HOSTAGES понимается посредством сценария $TERRORISM. Таким образом, принцип интегрального понимания плюс анализ типа ’’пропускать и сохранять" в огромной степени облег­чает обработку текста.

THROUGH ‘через; в течение’ подается в словаре как указание либо на время, либо на место, поэтому форми­руется запрос на поиск соответствующего слова. Однако на данный момент наша система знает, что именно ее ин­тересует. В частности, очень важно продолжить поиск ответов на неудовлетворенные запросы, имея в виду осо­бенно то, что они связаны с понятием смерти (см. Schank, 1978). Поэтому мы фактически игнорируем остальную часть группы как не представляющую интереса.

MOST ‘большая часть’ записывается в ОП и пропу­скается.

OF (предлог) пропускается.

THE записывается в ОП и пропускается.

DAY ‘день’ опознается и игнорируется. Вместе с тем это слово отвечает запросу низшего уровня по поводу указания времени, и данная информация добавляется к нашим знаниям о времени; она может быть использована позднее, если у нас когда-нибудь возникнет интерес к тому, что мы сейчас сочли неинтересным.

before surrendering to French policemen...

‘перед тем как сдаться французским полицейским...*

BEFORE ‘перед’—это слово, связанное с упорядоче­нием во времени; оно подготавливает нас к фиксации но­вого события и уточняет его время относительно ранее упомянутого события.

SURRENDERING ‘сдача* — слово, которое маркиро­вано признаком высокой степени интереса и одновременно охарактеризовано как составная часть нескольких сцена­риев, включая $TERRORISM. В рамках этого сценария вызывается сцена сдачи властям (в плен) и формулиру­ются запросы, касающиеся причин этого действия, его контрагентов и т. д. Определенные слова считаются ука­зателями этих ролей. Так, because ‘потому что’ выделяет причины, a to (предлог с дативным значением) выделяет контрагентов.

ТО говорит нам, что далее следуют контрагенты (люди, взявшие в плен).

FRENCH ‘французский’ откладывается в ОП.

POLICEMEN ‘полицейские* помечено как существи­тельное, которое может быть ДЕЯТЕЛЕМ, поэтому си­стема обращается к ОП, чтобы собрать относящиеся к нему компоненты. Это слово может обозначать также контр­агента в сцене сдачи властям, так что оно удовлетворяет двум имеющимся запросам.

and then was shot by Iraqi security officials...

‘и затем был застрелен сотрудниками иракской службы безопасности...’

***************************

AND ‘и* говорит о том, что кончилось одно событие и, вероятно, начинается другое событие.

THEN ‘затем’ дает указание о времени данного собы­тия.

WAS ‘был’ указывает на то, что деятель, записанный в ОП, является концептуальным объектом .нового события. Поэтому формируются запросы о соответствующем деятеле и действии.

SHOT ‘застрелен’ оказывается словом, представляющим интерес, и обрабатывается так же, как GUNMAN, за ис­ключением того, что мы не будем в этом случае искать некоторые элементы, характерные именно для сущест­вительного GUNMAN. В результате мы получаем:

В КОГО они стреляли? — ARAB GUNMAN ‘в вооружен­ного араба’.

КТО СТРЕЛЯЛ? — Ответа нет.

ПОЧЕМУ стреляли? — Ответа нет.

ГДЕ это случилось? — Уже известно.

КАКИЕ СЦЕНАРИИ вызываются? — Глагол SHOOT ‘стрелять’ может вызвать какой-либо сценарий. Обычно здесь могут рассматриваться три варианта: $ROBBERY ‘ограбление’, $TERRORISM ‘терроризм’ и $KIDNAP ‘по­хищение’. Но мы имеем дело с контекстом, который зада­ется сценарием $TERRORISM. Другие из упомянутых сценариев не могут быть нормальным продолжением сце­нария ^TERRORISM. К такому выводу мы приходим на основе обращения к планам и целям.

КАКОВЫ были РЕЗУЛЬТАТЫ этого действия? — Строится запрос с целью определения результатов. Если в тексте не удается найти элементов, удовлетворяющих этому запросу, то делается умозаключение об обычных результатах этого действия. В данном случае это смерть объекта.

Так как слово SHOT оказывается интересным, мы должны объяснить его. У нас нет для этого сценариев, поэтому мы должны выяснить, кто мог захотеть убить данного вооруженного человека и почему. Эти запросы добавляются к массиву активизированных ранее запросов.

BY (предлог) говорит о том, что далее идет обозначе­ние деятеля.

IRAQI ‘иракский’ пропускается и записывается в ОП.

SECURITY ‘безопасность’, ‘служба безопасности’ про­пускается и записывается в ОП.

OFFICIALS ‘сотрудники’ используется для завершения обработки данной именной группы. Это слово удовлетво­ряет запросу о том, КТО стрелял, и раз мы теперь распо­лагаем знанием деятелей, то мы можем задаться вопросом о том, почему они хотели убить ТЕРРОРИСТА. В данный момент мы могли бы установить связь между IRAQI SE­CURITY OFFICIALS и IRAQI EMBASSY, но это не ведет к какому-либо объяснению. Это только заставляет нас удивляться происшедшему. Мы пытаемся объяснить данное событие, постулируя, например, темы типа МЕСТЬ или ЗАСТАВИТЬ ЕГО МОЛЧАТЬ, но уверенности на этот счет нет.

as he was led away by French officers.

‘в то время, когда его уводили французские офицеры*.

***************************

В основном наш анализ закончен, так как больше нет запросов, требующих немедленного удовлетворения. (Мы узнаём это после того, как просмотрели абзац и не нашли новых запросов.) Нас, однако, продолжают интересовать цели каждого из деятелей, поэтому запросы типа ПОЧЕМУ остаются активизированными.

AS ‘в то время, когда’ является показателем одновре­менности. Поскольку у нас нет особого интереса к тому, что происходило в то же самое время (если только это не факты, интересные сами по себе), то мы можем теперь, пропуская слова, искать действия и деятелей, которые представляют интерес. AS может также обозначать при­чинность, но в этом случае семантические предсказания, сформированные ранее, сами осуществят поиск нужной причины.

НЕ ‘он’ пропускается.

WAS ‘был’ пропускается.

LED ‘уводимый’ интереса не представляет, опознается и затем пропускается.

AWAY ‘прочь’ пропускается.

BY (предлог) пропускается.

THE пропускается.

FRENCH ‘французский* пропускается.

OFFICERS ‘офицеры’ пропускается, потому что нет запросов, которые бы интересовались этим словом.

Конец абзаца говорит о том, что анализ закончен. Окон­чательное представление для этого предложения таково:

$TERRORISM ‘терроризм’

ACTOR ‘деятель’ — Arab gunman PLACE ‘место’ — Paris, Iraqi Embassy SCENES ‘сцены’

$HOSTAGES ‘заложники’ — some ‘несколько’ $CAPTURE ‘взятие в плен’

ACTOR — French policemen OBJ ECT — Arab gunman PLACE — Paris, Iraqi Embassy UNEXPECTED RESULT ‘неожиданный, результат’:

ACTOR — Iraqi officials ACTION - SHOOT OBJECT — Arab gunman R ESULT 4 результат’

ACTOR — Arab gunman

STATE ‘состояние’ —* dead ‘мертвый’

2.

<< | >>
Источник: В.А. ЗВЕГИНЦЕВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК XII. ПРИКЛАДНАЯ ЛИНГВИСТИКА. МОСКВА «РАДУГА» - 1983. 1983

Еще по теме ПРИМЕР: