Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта. Тревор Кокс

Зачем мы говорим. История речи от неандертальцев до искусственного интеллекта

эксперимент, вам понадобится помощь друга. Попросите его очень быстро постукивать карандашом, а сами оценивайте скорость, подсчитывая количество постукиваний за пять секунд. Ваш друг сможет стучать значительно быстрее, чем вы – считать, особенно если он немножко попрактикуется. Самая большая скорость счета составляет около девяти постукиваний в секунду. Но, слушая речь, мы схватываем изменения со скоростью примерно от 20 до 30 звуков в секунду, примерно в три раза быстрее. Произнося, например, слово «кот», мы не произносим каждый звук отдельно ([к] – [о] – [т]), потому что это будет слишком медленно. Вместо этого мы позволяем звукам набегать друг на друга, что дает возможность передавать информацию очень быстро.

Чтобы речь была плавной и членораздельной, оральная и фарингальная трубки должны быть примерно одной длины. Горизонтальное расстояние от губ до задней части ротовой полости должно быть таким же, как расстояние от голосовых связок до мягкого нёба (задней части нёба). В таком случае чрезвычайно подвижный язык может изменять площадь поперечного сечения этих трубок независимо друг от друга. Посмотрите видео МРТ поперечного сечения головы: в покое язык представляет собой круглое пятно. Но как только человек начинает разговаривать, язык быстро трансформируется, принимая различные формы, движется назад и вперед, вверх и вниз, изменяя форму голосового тракта. Попробуйте сказать «вид», а потом «мам» и обратите внимание, как меняется положение языка при производстве гласных звуков. При произнесении слова «вид» язык двигается вверх, ограничивая полость рта, а для «мам» он опускается и расширяет трубку. Гораздо труднее ощутить, как изменяется вертикальная фарингальная трубка. Для «вид» язык движется во рту вперед и открывает фарингальную трубку, но для «мам» он сдвигается назад и ограничивает фарингальную трубку.

Гласный звук в слове «вид» называется гласным сверхвысокого уровня, потому что он играет решающую роль в способности понимать разговор разных людей. У людей голосовые тракты различаются, а это означает, что различаются и частоты формантов. Если вы скажете «бис – бес», различия в частотах гласных очень четкие, и это помогает слушателю догадаться, какие слова произносятся. Но эта разница может быть не такой ясной у разных людей. Когда человек маленького роста говорит «бес», может получиться так, что это будет похоже на то, как человек высокого роста говорит «бис», потому что различия в длинах голосовых трактов создадут схожие частоты первого форманта. Чтобы избежать такой путаницы, слушатель подсознательно оценивает длину голосового тракта говорящего. Когда мы произносим гласную в слове «липа», язык поднимается вверх и как можно дальше вперед. Попробуйте сказать «липа», а потом чуть-чуть продвинуть язык вперед: звук начнет дрожать. Эта гласная сверхвысокого уровня ставит язык в его самое крайнее положение: он не может продвинуться дальше, потому что звук не будет чистым, а именно это позволяет слушателю оценить длину голосового тракта говорящего и таким образом настроить свое восприятие.

Относительная

Скачать книгу