如何定位聲音?如何重現(xiàn)真實的聲學體驗?
我們的聽覺系統(tǒng)的顯著能力之一是可以確定聲源的位置。
這在生活中的許多情況下都是至關重要的,例如交通的安全導航。但聲音的空間屬性對于在游戲和家庭影院配置中實現(xiàn)真實的聲學環(huán)境也很重要。
一、我們如何定位聲音?
我們的聽力使用的個線索是雙耳時間差(圖1a)。來自我們正前方或正后方的聲音會同時到達雙耳。如果信號源向左或向右移動,我們的聽覺系統(tǒng)會識別出來自同一信號源的聲音分別到達雙耳,但是會有一定的延遲,或者從另一個角度看,兩只耳朵接收到同一個信號的不同相位。
兩耳時差 圖1a:當聲音來自前方,雙耳時間差為零(左)。當聲音來自側面,頭的尺寸約為20厘米,聲速為340米/秒,時差為0.58毫秒(右)
在低頻下可以地破譯相位差。在較高的頻率下,與頭部的尺寸相比,波長可能太短,以至于信號模式自身重復,兩只耳朵可能碰巧接收到相同的相位(圖1b)。
兩耳相位差 圖1b:通常耳朵會感測到相位差(左),根據(jù)頻率和入射角度,它們可以檢測到虛假相位匹配(右)。
幸運的是,聽覺系統(tǒng)可以借助另一個線索:當聲音從側面到達時,我們的頭部會產生聲影區(qū),并隨頻率上升而擴大。
在非常低的頻率下,我們頭部的尺寸與空氣中的聲音的波長相比是小的。因此,無論聲音從哪個方向到達,左耳和右耳的聲壓基本相同。
然而,隨著頻率的增加,波長減小,此時我們的頭部尺寸不能再被忽略了。它成為屏蔽和反射聲音的障礙物,使得與面向聲源的耳朵相比,當其到達頭部另一側的耳朵時,較高頻率的成分將被衰減。
我們的耳廓的形狀還可提供豐富的頻譜(依賴于頻率)線索。像頭部的聲影區(qū)一樣,耳廓起到一個屏蔽層的作用,使不是從前面直接進入的較高頻率的聲音衰減。你可以通過轉離再轉向一個聲源來體驗這一點。這樣做的時候,你應該能感受到高頻率的微小變化,而這種變化你通常是不會注意到的。
另外,根據(jù)頻率和入射方向,聲音在耳廓內反射到耳道時,耳廓的形狀會影響聲音,從而增強某些頻率并衰減其他頻率。
二、雙耳聲記錄和重放
一般來說,要獲得正確的空間聲學體驗,我們需要兩只耳朵(雙耳),因為左耳和右耳之間的對比給出了關于聲源位置的線索。中正面上的聲源是最難定位,因為在中正面上幾乎沒有耳間差異。
然而,我們的方向感多數(shù)是建立在經驗之上的,這與我們自己的生理(我們的頭、耳廓和耳道的大小和形狀)有關。隨著時間的推移,我們的聽覺系統(tǒng)建立了一個參考數(shù)據(jù)庫,例如注意到來自后面的聲音聽起來稍顯沉悶。因此,為了創(chuàng)造令人信服的空間體驗,并感知聲源的確切位置,聲音的再現(xiàn)必須提供我們的聽覺系統(tǒng)所習慣的所有信息。
目前主流的雙耳聲記錄與重放是采用人頭與軀干模擬器(Head and Torso Simulator, HATS)采集聲音,再用耳機播放出來,這種方式能夠真實地模擬人與聲場環(huán)境的相互影響,廣泛應用于聲品質主觀評價,這屬于靜態(tài)的雙耳聲重放。
隨著“元宇宙"時代的到來,我們在AR/VR場景中希望更加身臨其境的感受雙耳聲音,比如,頭部可以任意轉動,聽到不同方向的聲音。或者同樣的音頻信號,在不同的虛擬或現(xiàn)實環(huán)境中會有怎樣的表現(xiàn),等等,這屬于動態(tài)的雙耳聲重放。