ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

В. Вопросы о гипотезах

Каждая интеллектуальная система, претендующая на автоматиче­ское понимание текста рассказа, должна порождать некоторое его внутреннее представление. На основе этого представления будут далее выполняться все поисковые задания, относящиеся к рассказу.

В частности, ответы на вопросы по поводу рассказа должны даваться исходя из репрезентации текста. Есть, однако, вопросы, требующие сообщить в ответе больше информации, нежели та, что содержится в одной только репрезентации. Мы уже видели в третьей главе, как общее знание о мире используется при понимании вопросов и при выдаче отрицательных ответов. Ниже мы обсудим класс вопросов, для ответов на которые необходимо иметь что-то еще, помимо репрезентации текста и знания о мире.

Приводимый ниже рассказ явился реальным входом в систему SAM. Три вопроса, которые мы здесь рассмотрим, были заданы системе после того, как та прочла этот рассказ, и ответы на них давала сама система. Описываемый процесс поиска по памяти—это именно тот, который осуществляется в SAM при ответе на почему- вопросы, относящиеся к не-событиям. Более детальное обсуждение представленного здесь процесса обработки информации можно найти в работе Lehnert, 1976.

ВХОД В SAM: Джон вошел в ресторан, и администратор дал ему меню. Когда Джон заказал горячие сосиски, официантка сказала, что сосисок нет. Тогда Джон заказал бифштекс по-гамбургски. Но когда принесли бифштекс, он был так пережарен, что Джон ушел из ресторана голодным.

Когда люди что-то рассказывают (или пишут), они обычно опускают информацию, легко выводимую из текста. По этой причине значительную часть процесса понимания составляет восста­новление опущенной информации через процедуру вывода. Если человек понимает рассказ типа того, который был приведен выше, он в действительности понимает не просто каждое отдельно взятое предложение текста. Для связи событий и действий, о которых идет речь в рассказе, используется знание о мире.

Эта связь осуществля­ется через заполнение текстовых лакун выводимыми состояниями и событиями. Поэтому репрезентация рассказа в памяти должна включать в себя все те выводы, которые объединяют предложения на вводе в связное целое. Следующий список действий содержит ряд выводов, которые должны быть сделаны при понимании приведенно­го рассказа. Наряду с этими выводами система SAM делает еще некоторые дополнительные выводы относительно местоположений объектов, отношений обладания и других изменений текущих состо­яний объектов.

Джон идет в ресторан.

Джон входит в ресторан.

Администратор видит Джона.

Администратор подходит к Джону.

Администратор подводит Джона к столику.

Джон садится за столик.

Джон берет у администратора меню.

Джон смотрит меню.

Официантка видит Джона.

Официантка подходит к столику Джона.

Джон заказывает горячие сосиски.

Официантка говорит Джону, что у них сосисок нет.

Джон заказывает бифштекс по-гамбургски.

Официантка относит заказ повару.

Повар готовит бифштекс по-гамбургски.

Официантка берет бифштекс у повара.

Официантка приносит Джону бифштекс.

Официантка подает Джону бифштекс.

Джон видит, что бифштекс пережарен.

Джон сердится.

Джон поднимается из-за столика.

Джон покидает ресторан.

Заметим, что все эти выводы являются заключениями, которые мог бы вывести каждый человек из общих знаний о том, как происходит посещение ресторана. Для целей настоящей статьи можно считать данный список концептуализаций репрезентацией текста приведенного рассказа. Она порождается по мере того, как прочитывается рассказ, и становится частью базы знаний системы, которая впоследствии используется для ответов на вопросы.

Рассмотрим теперь три вопроса по данному рассказу.

В23: Почему официантка не принесла Джону горячие сосиски?

В24: Почему Джон не стал есть бифштекс по-гамбургски?

В25: Почему Джон не оплатил счет?

Почему-вопросы требуют указания в ответах причины. В данном случае нас интересует причина, по которой официантка не принесла Джону горячих сосисок, причина, по которой он не стал есть бифштекс по-гамбургски, а также причина, по которой он не оплатил счет.

Но каким образом в процессе поиска информации в памяти можно найти информацию о несостоявшихся событиях: о том, что Джон не получил сосисок, не оплатил счет и т. п. Репрезентация рассказа—это последовательная цепочка событий, о которых шла речь выше. Проблема здесь состоит именно в том, что мы просим указать причины действий, которые не имели места, между тем как репрезентация не содержит информацию о „не-действиях".

Одно возможное решение этой проблемы заключается в том, чтобы рассмотреть репрезентацию также и для тех событий, которые „противоречат" указанным действиям. Например, когда мы пытаемся ответить на вопрос „Почему официантка не подала Джону горячих сосисок?", не исключено, что мы считаем действия „прине­сти Джону горячие сосиски" и „принести Джону бифштекс по- гамбургски" взаимоисключающими. Следовательно, последнее дей­ствие заменяет первое, и мы могли бы ответить на вопрос таким образом: „Потому что официантка подала Джону бифштекс по- гамбургски". Однако будет ли этот ответ наилучшим? Действительно ли имеет смысл утверждать, что официантка не подала горячие сосиски потому, что она вместо них принесла бифштекс? Никакой реальной причинной связи между этими двумя событиями или событием и не-событием нет. Но что еще более важно, так это то, что при таком подходе мы часто вообще не можем дать никакого ответа на вопрос.

Пусть в процессе поиска „взаимоисключающих" действий нам удается определить, что бифштекс принесли вместо горячих соси­сок, но что произойдет, если мы попытаемся подобным образом получить ответ и на второй вопрос: „Почему Джон не стал есть бифштекс по-гамбургски?"? Какому действию в репрезентации рас­сказа противоречит этот вопрос? Такого, связанного с едой дей­ствия, которое бы противоречило поеданию бифштекса, просто не существует. Хотя допустимыми ответами здесь будут „Потому что Джон рассердился" или „Потому что бифштекс был пережарен", вряд ли можно считать эти события „противоречащими" тому, что бифштекс съеден.

Аналогично обстоит дело и с последним вопросом „Почему Джон не оплатил счет?". Ведь получение пережаренного бифштекса и гнев по этому поводу отнюдь не всегда приводят к неоплате ресторанных счетов.

Иногда проникновение в существо процесса достигается путем анализа ситуаций, возникающих в случае, если последний прерывает­ся. Рассмотрим, что случится, если мы зададим вопрос „Почему Джон не переплыл озеро?". Вопрос этот попросту бессмыслен. Он мог бы быть осмысленным, если бы только по ходу рассказа возникла гипотеза о том, что Джон купается в озере или плывет через озеро. Вообще о ненаступившем событии имеет смысл спрашивать только тогда, когда в какой-то момент времени суще­ствовала возможность (или вероятность) его наступления, если известно при этом, что весь ход событий был иным, чем в действительности. Поэтому ответы на такого типа вопросы требуют рассмотрения гипотез, возникающих в процессе понимания текста.

Когда человек читает рассказ, у него появляется огромное количество гипотез о том, что, скорее всего, произойдет дальше или о чем ему далее будет сообщено. Хотя некоторые из них запомина­ются (например, то, что Джон в конце концов не дворецкий или другое высокопоставленное лицо), большинство гипотез относится к информации самого поверхностного уровня (так, если Джон заказы­вает горячие сосиски, вы ожидаете, что он будет их есть). Подобные гипотезы поверхностного уровня обработки текста не следует включать в его представление памяти, когда происходит процесс понимания, поскольку это может привести к переполнению памяти. Совсем не нужно хранить в памяти те гипотезы, которые относятся к поверхностному уровню и выводятся на основании самых обычных знаний о мире: всякая такая гипотеза легко может быть реконстру­ирована, если в этом возникнет необходимость. Когда же задается вопрос о событии, которое не наступило, то поиск, осуществляемый в памяти, не может основываться только на информации, содержа­щейся в репрезентации текста: должны быть реконструированы гипотезы, которые возникают по мере прочтения рассказа с тем, чтобы дальше их можно было анализировать.

Для реконструкции таких гипотез репрезентация текста подверга­ется исследованию на предмет выявления в ней точек интерферен­ции. А именно, выделяются те места в рассказе, где речь идет о событиях в какой-то степени неожиданных. Точки интерференции — это места, где происходит смена гипотез. До одной из таких точек у нас был один набор гипотез, а в ней этот набор сменяется другим. Поэтому мы идем по тексту до тех мест, которые предшествуют точкам интерференции, и восстанавливаем гипотезы, предполагая, что рассказ кончился именно в данном месте. В сущности, мы строим новый рассказ и производим его обработку. Когда рассказ заканчивается раньше времени, мы, исходя из наших знаний о мире, делаем выводы о том, какие события с наибольшей вероятностью произошли дальше в рассказе. Благодаря этим выводам, которые заканчивают незаконченные истории, удается восстановить гипоте­зы, сделанные в то время, когда читался первоначальный текст рассказа.

В нашем модельном рассказе есть две точки интерференции: место, когда официантка говорит Джону, что у них нет горячих сосисок, и момент, когда Джон обнаруживает, что его бифштекс пережарен. Действие, предшествующее первой точке,— это действие, состоящее в том, что „Джон заказывает столик". Поэтому мы, пользуясь тем, что мы знаем, каков обычный этикет в ресторане, „заканчиваем" рассказ, в котором Джон входит в ресторан, получает от администратора меню и заказывает горячие сосиски. Мы заканчи­ваем рассказ в том смысле, что порождаем цепочку вымышленных событий, которые, по нашему мнению, произойдут в рассказе дальше. Эта цепочка событий, порождаемая в данном месте расска­за, включает в себя следующие события: официантка приносит Джону горячие сосиски, Джон съедает горячие сосиски, получает счет, оплачивает его и уходит из ресторана. Аналогичным образом порождается и цепочка вымышленных событий с того места в представлении рассказа, когда официантка приносит Джону бифштекс по-гамбургски. Ср.: Джон входит в ресторан; Джон садится за столик; Джон получает меню от администратора; Джон заказывает горячие сосиски [Официантка приносит Джону горячие сосиски; Джон съедает горячие сосиски; Джон получает счет; Джон оплачивает счет; Джон уходит из ресторана]; Официантка говорит ему, что у них нет горячих сосисок; Джон заказывает бифштекс по-гамбургски; Официантка приносит Джо­ну бифштекс по-гамбургски [Джон съедает бифштекс; Джон получает счет; Джон оплачивает счет; Джон уходит из рестора­на]; Бифштекс пережарен; Джон сердится; Джон покидает ресто­ран.

При изучении таких цепочек мы обнаруживаем те несовершивши- еся действия, о которых идет речь в наших вопросах. Коль скоро каждое такое действие содержится в цепочке, мы можем ответить на заданный вопрос, идя по ней назад до места ветвления основного пути и далее от точки интерференции или от неожиданного события по основному пути. Так мы получаем ответы на вопросы 23 и 24:

В23: Почему официантка не принесла Джону горячие сосиски?

023: Потому что она сказала Джону, что у них сосисок нет.

В24: Почему Джон не стал есть бифштекс по-гамбургски?

024: Потому что бифштекс был пережарен.

Что же касается последнего из трех вопросов, то действие „Джон оплачивает счет" входит в обе цепочки вымышленных событий. Когда такое бывает, то в поиске ответа на вопрос мы проходим назад по последней (недавно построенной) цепочке. Кроме того, следует отметить, что событие „оплата счета" имеет большую вероятность, чем события „Официант приносит горячие сосиски" или „Джон ест бифштекс по-гамбургски". (Объяснение того, как это удается узнать, см. в Lehnert, 1976.) Отсюда следует, что было бы в высшей степени неожиданным, если бы событие „Джон оплачива­ет счет" не наступило. При ответах на вопросы следует руководство­ваться принципом, который звучит приблизительно следующим образом: чем более неожиданно событие, тем больше требуется информации для удовлетворительного объяснения причины его наступления. Поэтому устройство, осуществляющее поиск ответа на поставленный вопрос, ищет не только точки интерференции гипотез, но также связанные с выдвинутыми гипотезами решения, принятые субъектом, и возможные негативные изменения его ментальных и психических состояний.

В25: Почему Джон не оплатил счет?

025: Джон рассердился, потому что бифштекс, который ему принесли, был пережарен, и поэтому он покинул ресторан.

V. выводы

Вопросно-ответные диалоги предполагают семантический анализ на разных уровнях обработки текста. Мы рассмотрели ряд трудно­стей, которые появляются на трех уровнях — социального контекста, уровнях языковой обработки и поиска информации в памяти. Обсуж­даемые здесь проблемы возникли при построении вычислительной системы, способной понимать тексты рассказов и демонстрировать свое понимание, отвечая на вопросы по тексту.

Способность отвечать на самые разные вопросы в разнообразных контекстах обычно относят к разряду тривиальных умений человека. Однако когда вы пытаетесь создать интеллектуальную вычислитель­ную машину, моделирующую эту или сопоставимую с ней способ­ность, то сразу начинаете понимать, сколь нетривиальным в действи­тельности является это умение.

Одной из целей языковой обработки текста является создание в недалеком будущем компьютера, способного вести свободный диалог с человеком. Движение по направлению к этой цели предполагает решение следующих важнейших задач.

1. Большая часть знаний о мире должна быть организована в памяти таким образом, чтобы в ней при необходимости можно было легко найти всю релевантную информацию. Чтобы компьютер мог понимать естественный язык и порождать тексты на этом языке, он должен иметь некоторые знания о том, что говорится.

2. В компьютере должна быть определенным образом отражена теория языковой коммуникации людей. Прежде чем компьютер сможет принять участие в диалоге, он должен знать, Что представля­ет собой диалог.

Первая из этих задач стала основной для всей области искус­ственного интеллекта вообще. Отсюда большое число исследовате­лей, которые в настоящее время заняты проблемой организации и представления в памяти знаний о мире (см. работы В о brow and Collins, 1975; Norman and Rumelhart, 1975; Sc hank and A bel son, 1976). Вторая задача пока не столь актуальна, как первая, поскольку многое еще предстоит сделать прежде, чем она станет первоочередной. Верно также и то, что довольно общую систему (типа общего „понимателя рассказов") можно построить без введе­ния в нее полной теории диалога. Построение общей системы, которая понимала бы рассказы и умела отвечать на все вопросы так, как если бы все эти вопросы были СПРАВОЧНЫМИ и требовали ИНФОРМАТИВНЫХ ответов в контексте демонстрации знания, явилось бы весьма впечатляющим достижением в сфере естественно­языковой обработки информации.

В рамках такой общей системы ответы на вопрос образуют исключительно важный и полезный полигон для изучения широкой области семантической обработки информации, которая необходимо присутствует при человеческом общении. Анализируя рассказы самого общего содержания без ограничений на области знаний, мы непосредственно подходим к проблеме организации знаний о мире. Рассматривая множество всех вопросов, которые могут быть заданы по поводу рассказа, приходится иметь дело с разного рода СПРА­ВОЧНЫМИ вопросами на уровнях языковой обработки и поиска информации в памяти. Поскольку такое устройство, понимающее рассказы, имеет довольно общий характер, можно надеяться, что принципы, с успехом примененные при его разработке, могут быть распространены и на другие, более масштабные задачи.

<< | >>
Источник: В. В. ПЕТРОВ, В. И. ГЕРАСИМОВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫП. XXIII. КОГНИТИВНЫЕ АСПЕКТЫ ЯЗЫКА. МОСКВА «ПРОГРЕСС» - 1988. 1988

Еще по теме В. Вопросы о гипотезах: