МАСШТАБ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ
Дискуссия по поводу масштаба представления знаний связана с применением структур в процессе анализа и с независимостью анализа; суть ее сводится к выяснению практических функций крупномасштабных представлений знаний в форме фреймов.
В этой статье неоднократно указывалось, что цель крупных структур фреймового типа состоит в том, чтобы способствовать решению конкретных лингвистических задач, таких, как разрешение лексической или местоименно-референционной неоднозначности; в противном случае эти структуры имеют мало общего с автоматическим пониманием естественного языка. Другими словами, представление знаний как таковое, безотносительно к решению определенной задачи, не должно входить в сферу интересов ИИ.При такой постановке вопроса обратимся снова к "большим порциям" знаний, описываемых такими структурами, как фреймы Чарняка, которые были разработаны как целостные образования (см. часть II статьи Чарняка), или сценарии Шенка, которые были созданы путем соединения элементарных действий. В сущности, подобные структуры можно построить на основе самых разнообразных разрозненных фактов, отражаемых на формальном уровне в виде отдельных утверждений. Так, Уилкс мог бы "соединить" предлагаемые им правила вывода таким образом, чтобы они имели не форму отдельных утверждений вида ”Р ИМПЛИЦИРУЕТ Q", но обобщенную форму:
Р
ИМПЛИЦИРУЕТ Q ИМПЛИЦИРУЕТ R
ИМПЛИЦИРУЕТ S,
где на месте каждой буквы стоит сложный объект (например, шаблон) или одна из двух частей [посылка или следствие] правил "здравого смысла".
Однако целесообразность применения таких структур можно поставить под сомнение, если обратиться к текстам, которые описывают деятельность, выходящую за рамки повседневности.
Предположим, что мы рассматриваем предложения, касающиеся обрядов посвящения в мужчины в далеком племени. Комбинируя способы описания Чарняка (см.
часть II статьи Чарняка) и Шенка, мы получим такой фрейм:Сценарий: обряд посвящения в мужчины.
Роли: мальчик, старейшина, помощники, толпа.
Мотив: нанесение ритуальных насечек на спину мальчика.
(11) а) Цель: татуировать МАЛЬЧИКА
b) ПОМОЩНИКИ держат МАЛЬЧИКА (друмя руками)
c) СТАРЕЙШИНА берет ИНСТРУМЕНТЫ
d) СТАРЕЙШИНА обращается к толпе (с призывом должным образом себя вести)
e) (общее условие)
§ плохое поведение ТОЛПЫ -► действие приостанавливается
f) СТАРЕЙШИНА проверяет, достаточно ли чист МАЛЬЧИК (специальное условие)
g) МАЛЬЧИК не чист действие приостанавливается
h) СТАРЕЙШИНА делает НАСЕЧКУ на спине МАЛЬЧИКА
i) I используемый метод
I >► применяется для каждой НАСЕЧКИ.
Общая идея описания вполне понятна без дальнейших пояснений, а далекую или воображаемую культуру мы выбрали намеренно.
Предположим теперь, что мы имеем следующий рассказ:
(12) Little Kimathi’s mother accidentally touched his arm during the puberty rite. The crowd drew back in horror. ‘Мать маленького Киматхи случайно дотронулась до его руки во время обряда посвящения в мужчины. Толпа отпрянула в ужасе’.
Если мы хотим понять текст (12), то действительно ли нам нужен фрейм обряда посвящения в мужчины, приведенный выше? Фрейм (11) ’’покрывает" текст (12) с помощью строки (е), если имеется еще и список способов плохого поведения (который можно вообразить, что и символизирует значок ”§"). Однако ясно, что мы прекрасно понимаем
(12) и без всякого фрейма.
Попросту говоря, мы выводим из (12) следующее: то, что мать во время церемонии дотронулась до Киматхи — плохо, и для понимания этого соответствующая констатация в приведенном фрейме (11) нам не нужна. Марсианин, знающий смысл английских слов и имеющий минимальное представление о реакциях человека на дурные поступки, понял бы то же самое. Этим и объясняется то, что мы выбрали ситуацию обряда посвящения в мужчины, в котором мы разбираемся примерно так же, как марсианин, а не известную ситуацию покупки в магазине.
Если мы понимаем(12) , то не с помощью фрейма (11), поскольку, согласно допущению, у нас его нет.
Мы утверждаем здесь не то, что "крупномасштабные" фреймы не нужны вовсе, но только то, что с точки зрения конкретных проблем понимания естественного языка их роль еще не определена.
Одним из возможных способов уточнения роли фреймов может быть такой (и к этому уточнению близок Шенк в работе (Schank, 1975 а)): для того чтобы понять рассказ, нам нужны сведения о стандартном ходе событий в базисном рассказе (фрейме) данного типа; иначе говоря, мы можем понять конкретный рассказ только путем определения того, насколько он отклоняется (или не отклоняется) от стандартного рассказа данного типа. Эту гипотезу можно назвать "гипотезой стандартного сюжета"; однако пока неясно, как она соотносится с данными психологии.
ПРОЦЕДУРЫ, КАСАЮЩИЕСЯ МИРА ДЕЙСТВИТЕЛЬНОСТИ
В то время, к которому относится система Винограда и возникновение языка PLANNER (см. часть I статьи Чарняка), велась оживленная дискуссия о правомерности лозунга "значения суть процедуры". Она касалась того, каковы оптимальные формы "интеллектуальных" программ, а названный лозунг объединял сторонников фиксации смысла в форме процедур (в духе Винограда).
Эта дискуссия отошла в прошлое, но в современных работах, касающихся лингвистических систем ИИ, можно усмотреть ее аналог, который связан уже не с внутренними машинными процедурами, а с отношением процесса понимания к реальной деятельности во внешнем мире. Как уже заметил читатель, многие описанные в статьях данного сборника системы — Винограда, Чарняка, Скрэгга, Ригера (R і е g е г, 1975) — связаны с реальной деятельностью (поднятие предметов, приготовление пищи и т. п.) или, говоря более точно, с имитацией этой физической деятельности. Что это — простое совпадение или отражение действительно существующей связи между деятельностью и пониманием?
В основе многих современных работ лежит (не выраженная явно) гипотеза, которую можно назвать "проверка делом"; суть ее в том, что при представлении знаний надо выбирать знания о действиях, которые мы умеем выполнять — будь то строительство пирамид из кубиков, еда в ресторане, покупка в магазине, приготовление пищи или, как в системе Ригера (R і е g е г, 1975), сливание воды в унитазе.
Связь с естественным языком состоит в предположении, что нельзя понять тексты, описывающие человеческую деятельность, не выполняя или не умея выполнять эту деятельность. (В сущности, оно относится к утверждениям типа того, что дети начальных классов не поймут рассуждений о любви в пьесах Шекспира, которые они проходят, поскольку сами они еще этого чувства не испытали.)
Конечно, в этом предположении есть рациональное зерно, но на деле оказывается совсем не просто установить, что же именно не понимает человек, не совершавший самостоятельно тех или иных описываемых действий, если он тем не менее способен отвечать на соответствующие вопросы так, как если бы он все понимал. Так, человек может ответить на множество вопросов о катании на лыжах и, как будет казаться, понять газетную заметку на эту тему, даже если сам он не стоит на лыжах.
Более сильный аргумент в защиту релевантности фреймовых описаний реальной деятельности для понимания естественного языка — это указание на возможность обучения этой деятельности. Положительным моментом при этом является то, что такой взгляд позволяет избавиться от необходимости безусловного принятия "гипотезы стандартного сюжета" (что, по-видимому, делает Шенк); однако тут же возникают и возражения, поскольку деятельности рассматриваемого рода (еда в ресторане, покупка в магазине), скорее всего, вообще не обучаются, или, по крайней мере, обучаются не так, как учатся пользоваться ножницами или завязывать шнурки на ботинках.
Таковы основные моменты дискуссии между сторонниками (Чарняк, Шенк) и противниками (Уилкс) использования "крупномасштабных" фреймов.
В заключение кратко остановимся на основных задачах, которые (обычно в неявном виде) ставились при разработке систем, описанных выше. Этих задач, по-видимому, четыре.
(i) Создание сильного аппарата вывода умозаключений. Эта задача была основной для ранних систем, базирующихся на языке исчисления предикатов; она согласуется с выдвинутым Хейесом (Hayes, 1974) требованием применять такой семантический аппарат, который позволяет машине стать, как он говорит, "интеллектуально респектабельной".
Та же задача ставится и перед многими системами, использующими языки типа PLANNER.(ii) Накопление и формализация знаний о предметных областях, стоящих за входными текстами (при этом формализмы часто строятся на основе естественного языка).
(iii) Машинная реализация, создание действующей системы для решения таких задач, которые наглядно демонстрируют "автоматическое понимание".
(iv) Моделирование языковой и/или психической деятельности человека.
Значительно упрощая реальное положение дел, можно сказать, что задачи системы Чарняка — (ii) и отчасти (і) и (iv), Винограда — (iii), а также, в некоторой степени, три остальные, Колби (в аспекте языковой, а не психической деятельности) — (iii), Шенка и Уилкса — (ii), (iii) и
(iv).
Практика заинтересует только задача (iii), однако нет единого мнения относительно того, при каком результате эту задачу можно считать выполненной. Скептик скажет, что, в конце концов, все эти системы анализируют те предложения, которые они анализируют, или, при более строгом изложении, все системы (как упомянутые здесь, так и прочие) в некотором смысле определяют некий естественный язык, а именно тот, который задается входными предложениями, поддающимися анализу в данной системе. Вопрос только в том, насколько эти многочисленные ограниченные "естественные языки" близки английскому языку.
ЛИТЕРАТУРА
A b е 1 s о п, R. P. The Structure of Belief Systems.— In: "Computer Models of Thought and Language" (ed. by Schank and Colby). San Francisco, Freeman, 1973.
С h а г п і а к, Е. Toward a Model of Children’s Story Comprehension.— In: ’’Memoranda from the Artificial Intelligence Laboratory", MIT, TR266, 1972.
Clark, H. On Bridging.— In: ’’Position papers for the Workshop on Theoretical Issues in Natural Language Processing", Massachusetts Institute of Technology, 1975 (BBN, Cambridge, Mass., 1975).
Colby, К. M. and Parkinson, R. C. Pattern-Matching Rules for the Recognition of Natural Language Dialogue Expressions.— ’’American Journal of Computational Linguistics", No 1, 1974, p.
1—70.Colby, К. M. and H і 1 f, F. D. Multidimensional Analysis in Evaluating a Simulation of Paranoid Thought.— In: ’’Memoranda from the Artificial Intelligence Laboratory", Stanford University, California, Stanford, 1973.
Colby, К. M. et al. Artificial Paranoia.— ’’Artificial Intelligence", No 2, 1971, p. 1—25.
Conceptual Informational Processing (Schank R. ed.). Amsterdam, 1975.
E n e a, H. and Colby, К. M. Idiolectic Language Analysis for Understanding Doctor-Patient Dialogues.— In: ”Advanced papers for the Third International Joint Conference in Artificial Intelligence", USA, Stanford, 1973 (SRI, Menlo Park, 1973).
Goldman, N. M. Computer Generation of Natural Language from a Deep Conceptual Base.— In: ’’Memoranda from the Istituto per gli Studi Semantici e Cognitivi", Switzerland, Castagnola, 2, 1974.
Hayes, P. J. Some Problems and Non-Problems in Representation Theory.— In: ’’Proceedings of the Summer Conference of the Society for Artificial Intelligence and Simulation on Behaviour", University of Sussex, UK, 1974.
H e r s к о v і t s, A. The Generation of French from a Semantic Representation.— In: ’’Memoranda from the Artificial Intelligence Laboratory",Stanford University, Stanford, California, 212, 1973.
Johnson-Laird, P. Memory for Words.— ’’Nature", 1974, No. 251, p. 104—105.
R і e g e r, C. Conceptual Memory (Unpublished Ph. D. Thesis, Stanford University), 1974.
R і e g e r, C. The Common-Sense Algorithm.— In: ’’Position papers for the Workshop on Theoretical Issues in Natural Language Processing", MIT, 1975 (BBN, Cambridge, Mass., 1975).
R і e s b e с к, С. K. Computational Understanding: Analysis Sentences and Context.— In: ’’Memoranda from the Istituto per gli Studi Semantici e Cognitivi", 4, Switzerland, Castagnola, 1974.
Schank, R. Causality and Reasoning.— In: ’’Memoranda from the Istituto per gli Studi Semantici e Cognitivi, 1. Switzerland, Castagnola, 1973a.
Schank, R. Using Knowledge to Understand.— In: ’’Position papers for the Workshop on Theoretical Issues in Natural Language Processing", MIT, 1975 (BBN, Cambridge, Mass., 1975a).
Schank, R.,Gol dman, N., R і e g e r, C. and R і e s b e с k, R. MARGIE: Memory Analysis, Response, Generation and Inference on English.— In: ’’Advanced papers for the Third International Joint Conference in Artificial Intelligence", USA, Stanford, 1973 (SRI, Menlo Park, 1973).
Turing, A. Computing Machineiy and Intelligence,—’’Mind", 1951, p. 1—17.
Weber, S. Semantic Categories of Nominate for Conceptual Dependency Analysis of Natural Language.— In: "Memoranda from the Artificial Intelligence Laboratory", 172. Stanford University, Stanford, California, 1972.
Wilks, Y. A. An Artificial Intelligence Approach to Machine Translation.— In: "Papers in Computer Models of Thought and Language" (ed. by Schank and Colby), San Francisco, Freeman, 1973.
Wilks, Y. A. Seven Theses on Artificial Intelligence and Natural Language.— In: "Memoranda from the Istituto per gli Studi Se* mantici e Cognitivi", 17. Switzerland, Castagnola, 1975.