Бинауральный слух

13.09.2016
Бинауральное слияние звуков. Как правило, несмотря на то что в оба уха поступают звуки, различающиеся по фазе и интенсивности, мы воспринимаем единый слуховой образ. По этому поводу образно говорят, что мы слышим двумя ушами один мир. Это явление называется бинауральное слияние.

Для изучения бинаурального слияния звуки подают через наушники. Бинауральное слияние для сходных звуков имеет место в течение всего времени подачи звуков. Для получения эффекта бинаурального слияния наиболее важным является низкочастотный диапазон (до 1500 Гц). Одно из важных свойств бинаурального слуха можно продемонстрировать на следующем примере. При подаче в каждое ухо разных высокочастотных звуков они воспринимаются как раздельные звуки; но если эти звуки промодулировать одним низкочастотным звуком, то испытуемый сообщает о бинауральном слиянии. Считают, что слуховая система использует низкочастотную составляющую звука (т.е. макроструктуру звука) для получения единого звукового образа. Бинауральное слияние звуков речи происходит, даже если в одно ухо подается низкочастотная, а в другое высокочастотная составляющая. Когда в одно ухо подают звук одной частоты, а в другое несколько отличный по частоте звук, в едином звуковом образе прослушиваются биения. Считают, что феномен бинауральных биений имеет чисто центральное происхождение.

Бинауральные биения отличаются от монауральных рядом особенностей. Монауральные биения прослушиваются во всем звуковом диапазоне, тогда как бинауральные биения воспроизводятся только в диапазоне 300—600 Гц, даже при довольно большом различии в частотах звуков, подаваемых в каждое ухо. При разнице в частотах 2—10 Гц испытуемый сообщает о колебаниях громкости, а если разница достигает 20 Гц, начинает восприниматься «шероховатость» звука. При дальнейшем увеличении частотной разницы слуховой образ расщепляется на два и восприятие каждого из них перемещается в соответствующее для каждого тона ухо. Бинауральные биения прослушиваются при довольно большой разнице в интенсивностях звуков, подаваемых на каждое ухо, даже в том случае, если на одно ухо подается подпороговая интенсивность звука.

Суммация звуков при бинауральном слухе. При бинауральном слухе порог слухового восприятия примерно на 3 дБ ниже, чем при моноауральном слухе. Явление повышения уровня слухового ощущения при бинауральном слухе называют бинауральной суммацией. Суммация особенно хорошо проявляется для речи и вообще шумовых сигналов.

Громкость также увеличивается примерно в два раза при бинауральном слухе по отношению к моноауральному слуху при одинаковом уровне звукового давления. При высоких уровнях звукового давления (выше 35 дБ) улучшение уровня ощущения составляет уже около 6 дБ.

Направленный звук. Звуки, воспринимаемые через наушники, локализованы в плоскости, проходящей между ушами испытуемого, тогда как звуки в звуковом поле кажутся локализованными в окружающей среде. Для низких частот длина волны сравнима с размерами головы, поэтому они огибают голову, для того чтобы достичь дальнего уха. В отличие от этого звуки высокой частоты с длиной волны, сравнимой с диметром головы, образуют акустическую тень. Отсюда можно заключить, что для локализации звуков высокой частоты мозговые центры учитывают фазовый сдвиг между звуками, достигшими каждое ухо. Для локализации звуков высокой частоты учитывается разница интенсивностей звуков. Путь вокруг головы человека составляет 22—23 см, при частоте 1500 Гц время распространения, например, от левого уха к правому составит примерно 600 мкс. При уменьшении частоты разница в фазе растет, а при ее увеличении — снижается. При высокой частоте звука фазовая разница становится очень маленькой, локализация звука в пространстве затрудняется, что приводит к увеличению числа ошибок локализации.

Один из методов изучения механизма локализации звука в пространстве — определение наименьшего различия в местоположении двух источников звука. В психоакустике этот феномен называют минимально слышимым углом. Показано, что наилучшее различение азимута на источник звука было для звуков ниже 1600 и выше 2000 Гц. Наибольшая точность (1—2 угл. град) различения была при расположении источника звука непосредственно перед испытуемым. При смещении источника точность сильно уменьшалась и наименьшая точность была, когда источник находился напротив одного уха, это так называемый конус путаницы. Благодаря движениям головы конус путаницы уменьшается. Возможно, в этом состоит участие движений головы в локализации звука в пространстве.

Для локализации звука в пространстве используются разница во времени поступления звуков к ушам и разница их интенсивностей. Могут ли эти параметры быть взаимозаменяемыми? Например, испытуемым предлагали регулировать разницу между интенсивностями звука на каждом ухе или, наоборот, регулировать время поступления звуков к каждому уху до получения восприятия слухового слитного образа. Результаты по взаимозаменяемости этих двух параметров имеют большой разброс. В экспериментах со звуковыми щелчками определили отношение 25 мкс/дБ для звуковых щелчков, содержащих энергию частот ниже 1500 Гц, и 90 мкс/дБ для щелчков, содержащих энергию частот выше 1500 Гц.

Специальные исследования показали, что у испытуемых могут создаваться не один, а разные слуховые образы. Одни слуховые образы зависят преимущественно от разницы во времени поступления звука в оба уха (особенно для частот ниже 1500 Гц), а разница в интенсивностях звука существенно не влияет на этот образ («временной» образ). Другой слуховой образ возникает преимущественно от разницы интенсивностей, поступающих к каждому уху («интенсивный» образ). Взаимозаменяемое отношение для «временного» образа составляет 2—35 мкс/дБ, а для «интенсивного» образа — 85—150 мкс/дБ. Возможно, что большой разброс экспериментальных данных, полученных для разных испытуемых, связан с тем, что одни испытуемые преимущественно отвечают на «интенсивный» образ, а другие — на «временной».

Одно из объяснений латерализации восприятия звука предполагает, что «временной» образ возникает, когда слуховой центр сравнивает период звука, поступившего в одно ухо с периодом звука, поступившего в другое ухо. Другими словами, происходит сравнение тонкой структуры сигнала. «Интенсивный» образ возникает при сравнении огибающих звука (т. е. крупных структур) в обоих ушах.

Реверберация и локализация звуков. Реально встречаются две типичные ситуации:

1. При прослушивании разговора в небольшой комнате, в которой происходит реверберация звука, источник звука локализуется в направлении прямого звука, но отраженный звук окрашивает этот слышимый звук. Отраженные звуки воспринимаются как реверберация, а при определенном интервале отраженный звук воспринимается как эхо.

2. Прослушивается монозапись через два отдельных динамика стереоустановки. При нахождении слушателя на равном расстоянии от динамиков прослушивается фантомный источник звука. Однако, если приблизиться к одному из динамиков, то возникает впечатление, что звук исходит только из одного динамика.

Рассмотрим подробнее эффект предшествования. Он состоит в том, что в пределах небольшого интервала прослушивается ранее поступивший звук. При увеличении интервала между этими двумя звуками воспринимается эхо. Схема эксперимента, которая позволяет количественно изучить данный феномен, приведена на рис. 14.42. Два звуковых щелчка (А и Б) подаются в левое ухо, а два других (В и Г) в правое. Все звуки следуют в интервале 2 мс и воспринимаются как слившийся звуковой образ. При этом звук А (в левое ухо) опережает В (в правое ухо) на время Вторые звуки Б и Г сдвинуты относительно друг друга так, что Г (в правое ухо) опережает звук Б (в левое ухо). Таким образом, восприятие первой пары звуков должно латерализоваться в левом ухе, а второй — в правом. Если оба интервала t1 и t2 играют одинаковую роль в латерализации звука, то при t1 = t2, слуховой образ должен восприниматься в центре головы. Однако прямые измерения показали, что это далеко не так. При равенстве t1 = t2 слуховой образ будет латерализован по времени t1. Для того чтобы слуховой образ воспринимался в центре головы, при времени t1, равном 50 мкс, время t2 должно быть увеличено до 400 мкс. Все это, несомненно, указывает на ведущую роль в локализации источника звуков, сигнал которого поступает по времени первым. Эффект предшествования сохраняется даже в том случае, если вторая пара звуков больше по интенсивности первой пары на 15 дБ.
Бинауральный слух

Временной интервал t3 может изменяться в интервале от 2 до 40 мс, и это не нарушает бинаурального слияния слухового образа. При дальнейшем увеличении времени t3 слушатель воспринимает два раздельных сигнала, по одному в каждом ухе.

Если звуки подавать через два динамика и сделать между ними задержку порядка 35 мс, звук воспринимается только из одного динамика. При увеличении задержки слушатель начинает воспринимать звук второго (задержанного) динамика, несмотря на то что звук все еще воспринимается как исходящий из первого динамика. Когда задержка достигает 50 мс, от второго динамика прослушивается эхо. В общем, это соответствует величине времени t3 в вышеприведенном примере. Таким образом, отраженный звук, поступивший с определенной задержкой (не более 30 мс) после прямого звука, сливается с предшествующим звуком в единый слуховой образ. Для восприятия разборчивой речи отраженный звук, поступивший через 30 мс, приводит к уменьшению разборчивости речи; если этот интервал не превышает 20 мс, слушатель воспринимает разборчивую речь.