ПРЕДВАРИТЕЛЬНЫЕ АКУСТИЧЕСКИЕ ЗАМЕЧАНИЯ
На спектрограмме речи[181] распределение интенсивности по частотам представлено как функция от времени. При таком «скользящем анализе частот» («running frequency analysis») статистические свойства звуковой волны замеряются в интервалы, весьма короткие по сравнению с длительностью фонемы.
Спектрограммы и в дополнение к ним «поперечные сечения», отражающие распределение интенсивности по частотам, представляют собой источник информации, которая может показаться весьма трудной для анализа, если использовать не оптимальный набор параметров. Легче всего такие параметры обнаруживаются при выделении в языке различительных признаков.Речевая волна может рассматриваться как продукция линейной системы (network), состоящей из голосового тракта в соединении с одним или несколькими другими источниками звука. Речевая волна не имеет никаких других свойств, кроме свойств этих источников и этой системы. Таким образом, мы можем записать следующее отношение:
W=T.S,
где W обозначает речевую волну, Т — передающую функцию (transfer function) системы и S — источник звука.
В случае наличия двух источников одновременно мы будем иметь дело с наложением:
W=T1Sl+T2S2.
Анализ речи показывает, что в различных языках мира для передачи смысловых различий используется лишь весьма ограниченное число характеристик источника и передающей функции. Эти характеристики описываются ниже.
2.11. Свойства источников звука, используемые в языке
2.111. Тип источника звука. Существуют два основных типа источников — периодические источники и источники шума. Периодический источник опознается по характерной гармонической структуре спектрограммы. Напротив, источник шума дает нерегулярное распределение энергии во временном измерении. При произнесении одной фонемы могут одновременно действовать источники обоих родов.
2.112. Число источников звука. Некоторые звуки, например [v] или [z], имеют два источника. Один из них находится в точке максимального сужения голосового тракта, другой же — так называемый голос — локализован в гортани и является более или менее периодическим. Источник, лежащий в голосовом тракте выше гортани, производит антирезонанс в передающей функции (ср. 2.122).
2.113. Переходы между звуками. С лингвистической точки зрения важным является также и способ включения и выключения источника. Мы различаем резкие и ровные приступы и завершения фонем. Например, фонема /J7 в слове chip «щепка» имеет резкий приступ, а фонема /J7 в слове ship «корабль» — ровный приступ.
2.12. Передающие функции, используемые в языке
2.121. Общие свойства. В математической трактовке передаточных свойств голосового тракта оказалось удобным использовать технику и понятия, разработанные при анализе систем связи (2). Одним из наиболее типичных примеров системы связи является линия передачи без потерь, не имеющая параллельных ветвей, у которой на одном конце находится вход (источник), а на другом конце измеряется выход. Спектр распределения интенсивности по частотам на выходе такой линии передачи может быть полностью определен установлением частот, которые характеризуются бесконечным выходом (резонансом). При анализе систем связи такие резонансные частоты обычно называют полюсами.
Если на линии передачи без потерь некоторые из этих условий не выполняются (например, если источник находится не в конце линии), то выход не будет таким, как в рассмотренном выше случае, а в некоторых полосах частот выхода не будет вообще. Можно рассматривать это отклонение как результат действия антирезонанса или нуля, который подавляет энергию в данной полосе частот, т. е. действует противоположно резонансу. Таким образом, для того чтобы определить спектр распределения интенсивности по частотам на выходе системы без потерь, достаточно установить частоты полюсов и нулей (если они имеются).
Если система имеет небольшие потери, то реакции (responses) на резонанс и антирезонанс являются конечными.
В комплексной записи частот полюсы и нули имеют в этом случае две части, одна из которых отражает частотную локализацию резонанса или антирезонанса, а другая указывает на величину затухания (так называемая константа затухания).Полюсы зависят прежде всего от электрических свойств линии передачи с последовательным соединением. В случае с речью это означает, что полюсы определяются формой голосового тракта. Что же касается нулей, то они зависят прежде всего от взаимодействия параллельных ветвей. В случае с речью это означает, что нули зависят от взаимодействия двух параллельных резонирующих систем, которые создаются либо а) открытием дополнительного прохода, либо б) расположением источника не в конце линии.
Если нуль расположен близко от полюса, он стремится нейтрализовать действие этого полюса. По мере того как расстояние между нулем и полюсом возрастает, подавляющее действие нуля уменьшается.
2.122. Расположение источника звука. Обычно нули встречаются на частотах, на которых сопротивление, создаваемое источником звука в направлении, противоположном движению воздуха, бесконечно велико. Источник, расположенный в гортани, не оказывает сколько-нибудь существенного противорезонансного действия на передающую функцию. Именно поэтому мы можем полностью охарактеризовать гласные, указав их полюсы, которые определяют частотную локализацию и ширину ш>лосы частот (константу затухания) каждой форманты. Источник звука, расположенный в голосовом тракте выше гортани, между полостями, находящимися в отношении конечного соединения, создает шум в передающей функции.
2.123. Форма голосового тракта. Полюсы передающей функции связаны прежде всего с геометрической формой голосового тракта и не зависят от характера и расположения источника звука. Расположение полюсов и нулей в спектре, вычисленное на основе рентгеновских данных, согласуется с данными измерения (3).
2.13. Нейтральное положение голосового тракта
В последующем изложении за отправную точку мы принимаем нейтральное положение голосового тракта.
Нейтральным является положение голосовых органов при произнесении очень открытого [ае]. С точки зрения акустического результата лучше всего приближается к этому положению органов артикуляции труба, закрытая с одного конца. Как известно, труба длины L, закрытая с одного конца, резонирует на таких частотах, что L оказывается результатом умножения одной четвертой длины волны на нечетное число. Поскольку длина голосового тракта мужчины равна приблизительно 17,5 см, резонансы у него появляются на частотах приблизительно в 500, 1500, 2500 и т. д. гц. Нейтральное положение важно для предсказания тех вариаций в положении формант, которые обусловлены различиями в длине голосового тракта у различных индивидов (3). Кроме того, нейтральное положение служит в качестве точки отсчета для различительного признака напряженности (ср. ниже, § 2.431).2.14. Границы фонем
Для практических целей каждая фонема может быть представлена квазистатическим спектром, в котором передающая функция не изменяется во времени, если не считать того, что было сказано выше о явлениях, связанных с переходами (ср. § 2.113). Эти явления, обусловленные быстрыми изменениями функции источника, могуі служить для разграничения отдельных фонем в речевом потоке. Резкие изменения передающей функции, связанные с быстрой сменой положения артикулирующих органов, также указывают на границу (начало или конец) фонемы. Минимальная скорость изменения должна быть, однако, определена экспериментально для каждого случая. Дополнительным средством для определения границы фонемы являются быстрые флуктуации общей интенсивности звуковой волны.
2.2.