УРОВЕНЬ ПРЕДСТАВЛЕНИЯ
Важный спорный момент в современных исследованиях по ИИ касается того, каким должен быть наилучший уровень представления текста на естественном языке. Первое направление, к которому принадлежит Колби и, с некоторыми оговорками, Чарняк, считает, что естественный язык в сущности самодостаточен; второе направление, представителями которого являются Шенк и Уилкс, придерживается мнения, согласно которому умозаключения, касающиеся текстов на естественном языке, можно делать лишь на некотором редуцированном уровне представления, использующем элементарные единицы.
Чарняк считает, что его структуры преобразований не зависят от того, на каком уровне они осуществляются, или, вернее, что их можно осуществлять на разных уровнях, диктуемых предметной областью. Однако не вызывает сомнений то, что представление в предикатной форме, предлагаемое Чарняком, находится во взаимно-однозначном соответствии со словами английского языка.Самой мощной системой в рамках первого направления является, несомненно, система Колби, который пытается осуществить непосредственный исключительно громоздкий переход от уровня английских слов к внутренним структурам. Однако подчеркнем, что два названных подхода различаются скорее количественно, чем качественно, поскольку никто не будет утверждать, что абсолютно любое выражение, распознаваемое "разумным" анализатором, должно непременно соотноситься с некоторым "глубинным" представлением. Так, было бы серьезной теоретической ошибкой разрабатывать такую систему, которая, получив на вход Good morning ‘Доброе утро’, прежде чем выбрать правильный ответ Good morning, производила бы перевод этого выражения в некоторое глубинное семантическое представление.
Однако эти споры всегда касались лишь степени использования семантического разложения. Так, Шенк, решительно высказываясь за необходимость использования семантических элементов, на деле разработал систему семантических представлений только для глаголов, хотя работа по созданию семантических представлений для имен в рамках теории Шенка и ведется без его непосредственного участия (см.
Weber, 1972). Уилкс же, разработав семантические представления для всех частей речи, вместе с тем сохраняет, в отличие от Шенка, в своей системе доступ к поверхностным единицам и сейчас занимается включением новых, менее элементарных, более поверхностных единиц в свои семантические формулы (Wilks, 1975).Однако самый серьезный аргумент против использования поверхностных уровней представления текста состоит не в. том, чта при таком подходе неизбежна громоздкая процедура перехода от текста к внутренним структурам, а в том, что теоретическая четкость возможна только в случае применения семантических элементов. Этот аргумент тесно связан со сложным вопросом о статусе семантических элементов, который сейчас широко обсуждается и которого мы можем коснуться лишь вскользь. К сожалению, обоснование необходимости упомянутых элементов часто ведется с неправильных позиций, что только вредит делу. Например, некоторые сторонники семантических элементов объявляют их объективно существующими, из чего заключают, что эмпирическими методами можно выявить их правильный и единственный набор. При такой точке зрения теряется языковая сущность структур семантических элементов [65], поскольку основное свойство языка состоит в том, что можно, меняя одни слова на другие, передать один и тот же смысл. Если бы существовал правильный единый список элементарных единиц (хранящихся в мозгу), то указанное свойство не было бы присуще языку. В действительности многочисленные психологические исследования - показы-? вают, что при пересказе и повторении люди не способны воссоздать ни точные слова, ни синтаксические конструкции. Из многочисленных работ на эту тему назовем две: W е t t 1 е г, 1973, HJohnson-Laird, 1974.
Хотя эти психологические данные и не доказывают существования семантических элементов, но, несомненно, свидетельствуют в пользу вероятности этого. Другим подтверждением их существования могут служить результаты кодирования третьего издания словаря Вебстера, проведенного Корпорацией разработки систем (Systems Development Corporation). Оказалось, что список самых частых слов в толкованиях этого огромного словаря (не считая артиклей а и the) почти полностью совпадает с набором семантических элементов, используемых авторами названных выше семантических систем, при том, что этот набор создавался априорно.
Вопрос об уровне семантических представлений следует четко отделить от связанного с ним вопроса о центральных знаниях, необходимых для автоматического понимания текста.