ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

УРОВЕНЬ ПРЕДСТАВЛЕНИЯ

Важный спорный момент в современных исследованиях по ИИ касается того, каким должен быть наилучший уро­вень представления текста на естественном языке. Первое направление, к которому принадлежит Колби и, с некото­рыми оговорками, Чарняк, считает, что естественный язык в сущности самодостаточен; второе направление, предста­вителями которого являются Шенк и Уилкс, придержива­ется мнения, согласно которому умозаключения, касаю­щиеся текстов на естественном языке, можно делать лишь на некотором редуцированном уровне представления, ис­пользующем элементарные единицы.

Чарняк считает, что его структуры преобразований не зависят от того, на каком уровне они осуществляются, или, вернее, что их можно осу­ществлять на разных уровнях, диктуемых предметной областью. Однако не вызывает сомнений то, что представ­ление в предикатной форме, предлагаемое Чарняком, нахо­дится во взаимно-однозначном соответствии со словами английского языка.

Самой мощной системой в рамках первого направления является, несомненно, система Колби, который пытается осуществить непосредственный исключительно громоздкий переход от уровня английских слов к внутренним структу­рам. Однако подчеркнем, что два названных подхода разли­чаются скорее количественно, чем качественно, поскольку никто не будет утверждать, что абсолютно любое выраже­ние, распознаваемое "разумным" анализатором, должно непременно соотноситься с некоторым "глубинным" пред­ставлением. Так, было бы серьезной теоретической ошибкой разрабатывать такую систему, которая, получив на вход Good morning ‘Доброе утро’, прежде чем выбрать правиль­ный ответ Good morning, производила бы перевод этого выражения в некоторое глубинное семантическое представ­ление.

Однако эти споры всегда касались лишь степени исполь­зования семантического разложения. Так, Шенк, решитель­но высказываясь за необходимость использования семанти­ческих элементов, на деле разработал систему семантичес­ких представлений только для глаголов, хотя работа по созданию семантических представлений для имен в рамках теории Шенка и ведется без его непосредственного участия (см.

Weber, 1972). Уилкс же, разработав семантические представления для всех частей речи, вместе с тем сохраняет, в отличие от Шенка, в своей системе доступ к поверхност­ным единицам и сейчас занимается включением новых, менее элементарных, более поверхностных единиц в свои семантические формулы (Wilks, 1975).

Однако самый серьезный аргумент против использо­вания поверхностных уровней представления текста состо­ит не в. том, чта при таком подходе неизбежна громоздкая процедура перехода от текста к внутренним структурам, а в том, что теоретическая четкость возможна только в слу­чае применения семантических элементов. Этот аргумент тесно связан со сложным вопросом о статусе семантических элементов, который сейчас широко обсуждается и которого мы можем коснуться лишь вскользь. К сожалению, обосно­вание необходимости упомянутых элементов часто ведется с неправильных позиций, что только вредит делу. Напри­мер, некоторые сторонники семантических элементов объяв­ляют их объективно существующими, из чего заключают, что эмпирическими методами можно выявить их правиль­ный и единственный набор. При такой точке зрения теря­ется языковая сущность структур семантических элементов [65], поскольку основное свойство языка состоит в том, что можно, меняя одни слова на другие, передать один и тот же смысл. Если бы существовал правильный единый список элементарных единиц (хранящихся в мозгу), то указанное свойство не было бы присуще языку. В действительности многочисленные психологические исследования - показы-? вают, что при пересказе и повторении люди не способны воссоздать ни точные слова, ни синтаксические конструк­ции. Из многочисленных работ на эту тему назовем две: W е t t 1 е г, 1973, HJohnson-Laird, 1974.

Хотя эти психологические данные и не доказывают су­ществования семантических элементов, но, несомненно, свидетельствуют в пользу вероятности этого. Другим под­тверждением их существования могут служить результаты кодирования третьего издания словаря Вебстера, проведен­ного Корпорацией разработки систем (Systems Development Corporation). Оказалось, что список самых частых слов в толкованиях этого огромного словаря (не считая артиклей а и the) почти полностью совпадает с набором семантических элементов, используемых авторами названных выше се­мантических систем, при том, что этот набор создавался априорно.

Вопрос об уровне семантических представлений следует четко отделить от связанного с ним вопроса о центральных знаниях, необходимых для автоматического понимания текста.

<< | >>
Источник: В.А. ЗВЕГИНЦЕВ. НОВОЕ В ЗАРУБЕЖНОЙ ЛИНГВИСТИКЕ. ВЫПУСК XII. ПРИКЛАДНАЯ ЛИНГВИСТИКА. МОСКВА «РАДУГА» - 1983. 1983

Еще по теме УРОВЕНЬ ПРЕДСТАВЛЕНИЯ: