ФОНЕТИЧЕСКИЙ звуко-буквенный разбор слов онлайн
 <<
>>

ПРЕДВАРИТЕЛЬНЫЕ АКУСТИЧЕСКИЕ ЗАМЕЧАНИЯ

На спектрограмме речи[181] распределение интенсивности по частотам представлено как функция от времени. При таком «скользящем анализе частот» («running frequency analysis») статистические свойства звуковой волны заме­ряются в интервалы, весьма короткие по сравнению с длительностью фонемы.

Спектрограммы и в дополнение к ним «поперечные сечения», отражающие распределение интенсивности по частотам, представляют собой источник информации, которая может показаться весьма трудной для анализа, если использовать не оптимальный набор пара­метров. Легче всего такие параметры обнаруживаются при выделении в языке различительных признаков.

Речевая волна может рассматриваться как продукция линейной системы (network), состоящей из голосового тракта в соединении с одним или несколькими другими источниками звука. Речевая волна не имеет никаких дру­гих свойств, кроме свойств этих источников и этой систе­мы. Таким образом, мы можем записать следующее отно­шение:

W=T.S,

где W обозначает речевую волну, Т — передающую функ­цию (transfer function) системы и S — источник звука.

В случае наличия двух источников одновременно мы будем иметь дело с наложением:

W=T1Sl+T2S2.

Анализ речи показывает, что в различных языках мира для передачи смысловых различий используется лишь весьма ограниченное число характеристик источника и передающей функции. Эти характеристики описываются ниже.

2.11. Свойства источников звука, используемые в языке

2.111. Тип источника звука. Существуют два основных типа источников — периодические источники и источники шума. Периодический источник опознается по характер­ной гармонической структуре спектрограммы. Напротив, источник шума дает нерегулярное распределение энергии во временном измерении. При произнесении одной фонемы могут одновременно действовать источники обоих родов.

2.112. Число источников звука. Некоторые звуки, например [v] или [z], имеют два источника. Один из них находится в точке максимального сужения голосового тракта, другой же — так называемый голос — локализован в гортани и является более или менее периодическим. Источник, лежащий в голосовом тракте выше гортани, производит антирезонанс в передающей функции (ср. 2.122).

2.113. Переходы между звуками. С лингвистической точки зрения важным является также и способ включения и выключения источника. Мы различаем резкие и ровные приступы и завершения фонем. Например, фонема /J7 в слове chip «щепка» имеет резкий приступ, а фонема /J7 в слове ship «корабль» — ровный приступ.

2.12. Передающие функции, используемые в языке

2.121. Общие свойства. В математической трактовке передаточных свойств голосового тракта оказалось удоб­ным использовать технику и понятия, разработанные при анализе систем связи (2). Одним из наиболее типич­ных примеров системы связи является линия передачи без потерь, не имеющая параллельных ветвей, у которой на одном конце находится вход (источник), а на другом конце измеряется выход. Спектр распределения интен­сивности по частотам на выходе такой линии передачи может быть полностью определен установлением частот, которые характеризуются бесконечным выходом (резо­нансом). При анализе систем связи такие резонансные частоты обычно называют полюсами.

Если на линии передачи без потерь некоторые из этих условий не выполняются (например, если источник на­ходится не в конце линии), то выход не будет таким, как в рассмотренном выше случае, а в некоторых полосах ча­стот выхода не будет вообще. Можно рассматривать это отклонение как результат действия антирезонанса или нуля, который подавляет энергию в данной полосе частот, т. е. действует противоположно резонансу. Таким обра­зом, для того чтобы определить спектр распределения ин­тенсивности по частотам на выходе системы без потерь, до­статочно установить частоты полюсов и нулей (если они имеются).

Если система имеет небольшие потери, то реакции (responses) на резонанс и антирезонанс являются конеч­ными.

В комплексной записи частот полюсы и нули имеют в этом случае две части, одна из которых отражает частот­ную локализацию резонанса или антирезонанса, а другая указывает на величину затухания (так называемая кон­станта затухания).

Полюсы зависят прежде всего от электрических свойств линии передачи с последовательным соединением. В слу­чае с речью это означает, что полюсы определяются фор­мой голосового тракта. Что же касается нулей, то они за­висят прежде всего от взаимодействия параллельных вет­вей. В случае с речью это означает, что нули зависят от взаимодействия двух параллельных резонирующих си­стем, которые создаются либо а) открытием дополнитель­ного прохода, либо б) расположением источника не в кон­це линии.

Если нуль расположен близко от полюса, он стремится нейтрализовать действие этого полюса. По мере того как расстояние между нулем и полюсом возрастает, подавляю­щее действие нуля уменьшается.

2.122. Расположение источника звука. Обычно нули встречаются на частотах, на которых сопротивление, соз­даваемое источником звука в направлении, противополож­ном движению воздуха, бесконечно велико. Источник, расположенный в гортани, не оказывает сколько-нибудь существенного противорезонансного действия на пере­дающую функцию. Именно поэтому мы можем полностью охарактеризовать гласные, указав их полюсы, которые определяют частотную локализацию и ширину ш>лосы час­тот (константу затухания) каждой форманты. Источник звука, расположенный в голосовом тракте выше гортани, между полостями, находящимися в отношении конечного соединения, создает шум в передающей функции.

2.123. Форма голосового тракта. Полюсы передающей функции связаны прежде всего с геометрической формой голосового тракта и не зависят от характера и расположе­ния источника звука. Расположение полюсов и нулей в спектре, вычисленное на основе рентгеновских данных, согласуется с данными измерения (3).

2.13. Нейтральное положение голосового тракта

В последующем изложении за отправную точку мы принимаем нейтральное положение голосового тракта.

Ней­тральным является положение голосовых органов при произнесении очень открытого [ае]. С точки зрения аку­стического результата лучше всего приближается к этому положению органов артикуляции труба, закрытая с одного конца. Как известно, труба длины L, закрытая с одного конца, резонирует на таких частотах, что L оказы­вается результатом умножения одной четвертой длины волны на нечетное число. Поскольку длина голосового тракта мужчины равна приблизительно 17,5 см, резонансы у него появляются на частотах приблизительно в 500, 1500, 2500 и т. д. гц. Нейтральное положение важно для предсказания тех вариаций в положении формант, ко­торые обусловлены различиями в длине голосового тракта у различных индивидов (3). Кроме того, нейтральное по­ложение служит в качестве точки отсчета для различи­тельного признака напряженности (ср. ниже, § 2.431).

2.14. Границы фонем

Для практических целей каждая фонема может быть представлена квазистатическим спектром, в котором передающая функция не изменяется во времени, если не считать того, что было сказано выше о явлениях, связан­ных с переходами (ср. § 2.113). Эти явления, обусловлен­ные быстрыми изменениями функции источника, могуі служить для разграничения отдельных фонем в речевом потоке. Резкие изменения передающей функции, связан­ные с быстрой сменой положения артикулирующих орга­нов, также указывают на границу (начало или конец) фонемы. Минимальная скорость изменения должна быть, однако, определена экспериментально для каждого слу­чая. Дополнительным средством для определения границы фонемы являются быстрые флуктуации общей интенсив­ности звуковой волны.

2.2.

<< | >>
Источник: В.А ЗВЕГИНЦЕВ. НОВОЕ В ЛИНГВИСТИКЕ Выпуск II. ИЗДАТЕЛЬСТВО ИНОСТРАННОЙ ЛИТЕРАТУРЫ Москва 1962. 1962

Еще по теме ПРЕДВАРИТЕЛЬНЫЕ АКУСТИЧЕСКИЕ ЗАМЕЧАНИЯ: