МАШИННАЯ РЕАЛИЗАЦИЯ РИЗБЕКОМ ТЕОРИИ ШЕНКА
Теория концептуальных зависимостей Шенка[63] рассмотрена в статье Скрэгга. Она была применена в системе MARGIE (Schank et al., 1973), анализатор которой разработан Ризбеком (Riesbeck, 1974), аппарат вывода — Ригером (R і е g е г, 1974, см.
также вторую статью Чарняка), а синтезатор — Голдманом (Goldman, 1974). Нас интересует только первая часть системы — анализатор. Разработка анализа английских фраз на базе теории концептуальных зависимостей — задача далеко не простая; как помнит читатель из первой статьи Уилкса, Шенк предложил некоторые процедуры вывода, касающиеся концептуализаций (ср. глубинно*падежный вывод), однако совсем не рассматривал вопросов анализа естественного языка, то есть способов перехода от текста к его структуре в терминах концептуальных зависимостей и не пытался даже предоставить исходную информацию для последующей разработки подобных алгоритмов. Это означает не то, что Шенк отказался от решения таких проблем, как языковая неоднозначность, но только то, что применение правильного семантического представления, по его мнению, само по себе решит эти проблемы. Как мы видели выше, при рассмотрении системы Уилкса, для того чтобы проанализировать, к примеру, предложные группы, требуется значительный объем семантической информации и большое число различных критериев; разработкой всего этого и занялся Ризбек. Первым шагом перевода системы Шенка в форму, пригодную для машинного использования, была выработка линейной семантической записи, поскольку плоскостные структуры Шенка содержат многие сведения лишь в имплицитном виде.Анализ, предложенный Ризбеком, направлен в глубину (см. определение выше). Вскоре после своего начала он становится анализом сверху вниз. Мы говорим "вскоре", поскольку начинает анализ процедура "вызова" концептуальных структур на основе появления в тексте тех или иных слов, которые просматриваются слева направо.
Эти структуры Ризбек называет ожиданиями; они предугадывают, что было сказано раньше или что будет сказано в тексте дальше. Ожидания имеют форму запросов но тексту на основе появления в нем определенных слов.Весьма существенным аргументом в пользу такого подхода является то, что наиболее подходящие концептуальные структуры весьма далеки по своему виду от поверхностной структуры текста, и что эти наиболее подходящие структуры лучше всего применять как можно раньше, а не после завершения процесса последовательного "углубления" репрезентации, как, например, в системе Уилкса. Прекрасным примером в этом отношении является предложение John gave Mary a beating букв. ‘Джон дал Мери битье’, которое имеет очень мало общего с подлинным действием ‘давать’; этот пример будет подробно рассмотрен ниже.
В системе Ризбека правильная структура названного предложения фактически связана с толкованием для beating, поэтому, когда процедура анализа доходит до данного слова, эта правильная концептуализация (базирующаяся на ’’примитивном" действии PROPEL, которое выражает движение руки Джона) как бы ’’берет верх" и вытесняет предварительные структуры, построенные в ходе анализа четырех предшествующих слов предложения.
Ниже приводится разработанная Ризбеком таблица запросов, ассоциируемых со словами данного предложения в процессе его анализа слева направо (и записанных в таблице сверху вниз).
NP — сокращение для известного грамматического понятия "именная группа" (noun-phrase). Таблица легка для понимания, следует только иметь в виду, что пронумерованные вопросы в третьем столбце остаются активными (и, соответственно, "спускаются" по столбцу ниже), пока на них не будет получен положительный ответ. Запросы, состоящие из пометы’’истинно" (номер 5 и 6),— это просто пустые запросы (имеющие аналогию в языке LISP) [64], которые автоматически получают положительный ответ в том случае, если над ними ничего не остается.
В общих чертах анализ предложения проходит следую- щим образом.
Утвердительный ответ на запрос 2 приводитШаг | Анализи руемое слово | Текущие запросы | Вызв зап рос | Предпринимаемое действие |
0 | нет | 1 — ЭТО NP? | нет | нет |
1 | John | 1 — ЭТО NP? | 1 | Считать ”John“ субъектом при глаголе, который последует. |
2 | gave | 2 — текущая NP — человек? 3 — текущая NP — предмет? 4 — текущая NP — действие? 5 — истинно | 5 | Если появится ”to“, то далее следует реципиент действия ’’giving". |
3 | Mary | 2 — текущая NP — человек? 3 — текущая NP — предмет? 4 — текущая NP — действие? | 2 | Считать Магу реципиентом действия ’’giving". |
4 | a | 8 — текущая N Р — предмет? 4 — текущая NP — действие? 6 — истинно | 6 | Сохранить настоящий список запросов и заменить его на: 7 — текущее слово — это конец NP? |
5 | beating | 7 — текущее слово — это конец NP? | Нет | Нет |
6 | period | 7 — текущее слово — это конец NP? | 7 | Построить NP ”а beating" и снова дать список запросов. |
7 | none | 3 — текущая NP — предмет? 4 — текущая NP — действие? | 4 | Считать действие, выраженное данной NP, главным действием предложения, субъект (John) — деятелем, а реципиент (Магу), — объектом. |
к тому, что анализатор как бы считает, что он имеет дело с предложением типа John gave Mary a dollar.
‘Джон дал Мери доллар.’, и потому на шаге 2 он ожидает появления предлога to. Так продолжается до шага 7, когда выясняется, что ”дается“ не предмет (запрос 3), как было бы в случае типа John gave Mary a dollar, а действие (запрос 4). То, что существительное beating относится к классу действий, приводит к полной перестройке семантического представления, в основу которого теперь кладется элементарное действие PROPEL (для beat), а не PTRANS (для give).Та же процедура применяется к более сложным предложениям, например к таким, которые содержат предложение группы. Анализ предложения, содержащего предложную группу, рассмотрим на примере John prevented Магу from leaving by locking her. ‘Джон помешал Мери уйти, заперев ее’.
Анализ включает три стадии:
(i) Prevent генерирует запросы (ожидания), касающиеся предлогов FROM или BY1. Эти объекты назовем "предложными формами". Под BY1 имеется в виду одно из значений предлога by. Если использовать глубинно-падежные наименования, то смысл BY1 можно задать как ’’способ действия", в противоположность другим значениям предлога by.
(ii) Сам предлог FROM ассоциируется с очень сложными запросами; приведем пример для FROM0:
(Т (IMBED ((MOD QUOTE ((CANNOT))) (TIME CHOICE