Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта. Тревор Кокс
выходит из легких и проходит через голосовые складки (часто называемые голосовыми связками), которые расположены в гортани. Голосовые связки быстро раскрываются и закрываются, перекрывая путь воздушной струе, выходящей из легких, таким образом создается вибрирующий звук. Скорость, с которой голосовые связки раскрываются и закрываются, определяет высоту голоса. Например, взрослая женщина раскрывает и закрывает голосовые связки в среднем двести раз в секунду, что соответствует частоте 200 Гц (частота мужского голоса ниже, около 110 Гц).
Вибрация голосовых связок далее переходит в голосовой тракт. Так называется воздушное пространство, которое составляют верхняя часть горла, рот и носовые ходы, и именно здесь звук изменяется. Подобно большинству звуков, вибрация голосовых связок происходит как на базовой частоте, так и на обертонах, которые кратны следующим величинам: 400, 600, 800 Гц и т. д. Эти обертоны необходимы для производства речи, потому что именно их относительная сила используется горлом, языком, ртом и носовыми ходами для получения разных гласных звуков. От других приматов человека отличает именно ловкость и скорость, с которой он может изменять голосовой тракт. Познавательные способности дают человеку возможность совершать невероятно быстрые и сложные изменения голосового тракта, скоординированные с изменением дыхания и мускулов, поддерживающих голосовые связки; именно это обеспечивает плавность речи.
Анатомия звука
Создание гласного звука с частотой 200 Гц и первым формантным резонансом 500 Гц [30]
Голосовой тракт подобен воздушной колонке внутри трубы: он имеет набор частот, при которых воздух внутри громко вибрирует. Это – резонансные частоты, и любые гармоники вибрации голосовой складки, которые совпадают с этими частотами, усиливаются. (Другие гармоники выравниваются не столь успешно и подавляются.) Резонансы голосового тракта называются формантами. Произнесите «ток – так – тень», и вы заметите, как изменяется форма рта при произнесении разных гласных. Мягкое нёбо, язык и губы, которые в совокупности называются артикуляторами, формируют голосовой тракт таким образом, чтобы получить подходящие для каждой гласной форманты.
Голосовой тракт должен обладать большой гибкостью, чтобы изменять форму для произнесения разных гласных звуков. Изображения получены методом ядерного магнитного резонанса [31]
Можно говорить скучным монотонным голосом и производить членораздельную речь, просто изменяя форманты с помощью артикуляторов. Поскольку высота звука определяется голосовыми связками, их можно заставить колебаться одинаково для каждого слова. Это пригодилось Клинту Иствуду в фильме «Хороший, плохой, злой», где его герой Блондин разговаривает хриплым монотонным голосом [32]. Как это демонстрирует Иствуд, высота голоса отличается от формантов, которые фильтруют звук и сообщают слушателю, какая из гласных произносится. Еще одна хорошая демонстрация этого явления