ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ"

Необходимость принципиальной интеграции методов анализа письменной речи и методов распознавания устной речи очевидна. Вопрос состоит в том, каким образом нужно модифицировать методы обработки письменного текста, чтобы можно было преодолеть спе­цифические трудности устноречевого ввода, очерченные выше.

Ос­новные усилия в этом направлении до последнего времени велись в рамках метода анализа, основанного на „сетях переходов": сущ­ность такого подхода заключается в том, что ожидания (expecta­tions) анализатора закодированы с помощью сети переходов, в кото­рой дуги помечаются синтаксическими или семантическими катего­риями слов или непосредственных составляющих, а анализ поступив­шей на вход цепочки слов состоит в обнаружении такого пути в сети переходов, который будет соответствовать именно данной цепочке. Метки составляющих на дугах связаны с их собственными подсетя­ми, и прохождение дуги в сети верхнего уровня осуществляется путем прохождения через соответствующую подсеть. Типичный режим ра­боты анализатора сетей переходов состоит в движении по сети слева направо, синхронно, с просмотром входной цепочки слов, и обследо­вании подсетей сверху вниз по мере их появления. Хорошо известны такие анализаторы, основанные на сетях переходов, как ATN-анали- затор (W о о d s, 1970), использованный в системе LUNAR (W oods at al., 1972), RUS-анализатор (Bobrow, 1978) и анализатор систе­мы LIFER (Hendrix, 1977). В системе понимания слитной речи HARPY (Lowerre, 1976) используется интегрированная сеть, в которой закодирована и лингвистическая, и акустическая информа­ция.

Основная сложность применения анализаторов сетей переходов для распознавания речи заключается в их неспособности обрабаты­вать входное сообщение, если оно не отвечает их грамматическим ожиданиям. Часто во входной цепочке слов какое-то слово может быть пропущено в результате ошибки распознавания или по оплош­ности самого говорящего.

Если просмотр сети осуществляется слева направо, то поиск истинного пути в сети должен предусматривать „перескакивание" через дугу, которая соответствует пропущенному слову. Если бы вся проблема сводилась просто к перескакиванию, то это препятствие можно было бы легко преодолевать. Ситуация осложняется тем, что, как правило, приходится иметь дело одновре­менно с несколькими возможными вариантами разбора, особенно если словесная решетка содержит для одного и того же сегмента ре­чевого сигнала несколько альтернативных слов-кандидатов. Обычно, чтобы обнаружить в процессе поиска ложный вариант разбора, при­меняется следующий критерий: из текущего узла нельзя выйти ни по одной из дуг. Но ведь именно такая ситуация и возникает при про­пуске слова. Таким образом, в контексте реальной речи анализатор сетей лишается возможности использовать стандартные критерии останова при выходе на непродуктивный (нарушающий ограниче­ния) вариант поиска. Проблема осложняется еще больше, если слово, следующее за пропущенным словом, допускает прохождение по „незаконной" дуге, выходящей из того узла сети, в котором должно было бы быть распознано пропущенное слово. В этом случае обычно почти невозможно определить место, где действительно была допу­щена ошибка. Другие формы аграмматичности (вызваны ли они ошибками говорящего или являются артефактами акустического распознавания) приводят к аналогичным проблемам. В результате того, что на этапе акустического анализа не обеспечивается надеж­ное определение словесных границ, число неразрешимых проблем возрастает еще больше.

Неоднократно предпринимались попытки приспособить технику анализа сетей к решению этих проблем. В частности, предполагалось разрешить в случае необходимости вводить в сеть переходов допол­нительные дуги (см., например: Weischedel and Black, 1980; Weischedel and Sondheimer, 1984). Самый перспективный подход к адаптации сети переходов к речевому вводу, как нам пред­ставляется, состоял в отказе от просмотра сети слева направо и пере­ходе к методике анализа от центра к периферии. Суть этого метода состоит в том, что анализ начинается со слов, которые были распоз­наны на акустическом уровне с наибольшей достоверностью (см. W о о d s at al., 1976). Однако при выборе этих „островов достовер­ности" никогда не учитывались совместно критерии семантической значимости и акустической достоверности. Метод ATN-анализа стал­кивается с рядом серьезных проблем при практической реализации методики наращивания островов достоверности, — методики, столь привлекательной в теории. Одна из этих проблем — необходимость выполнения ATN-анализа справа налево. При таком требовании ме­тод интерпретации сетей, основанный на анализе от центра к пери­ферии, не срабатывает в тех случаях, когда тесты зависят от регист­ров, которые еще не были установлены. Ни одна из модификаций ме­тодов анализа сетей не была полностью успешной.

3.

<< | >>
Источник: Б.Ю. Городец­кий. Новое в зарубежной лингвистике: Вып. XXIV. Компьютерная лингвистика: Пер. с англ./Сост., ред. и вступ, ст. Б. Ю. Городец­кого.— М.: Прогресс,1989.—432 с.. 1989

Еще по теме НЕКОТОРЫЕ СЛОЖНОСТИ АНАЛИЗА УСТНЫХ ВХОДНЫХ СООБЩЕНИЙ,ОСУЩЕСТВЛЯЕМОГО С ПОМОЩЬЮ МЕТОДИКИ, ОСНОВАННОЙ НА „СЕТЯХ ПЕРЕХОДОВ":