關于語言清晰度(可理解性)的深入洞察(二)
來源:同創(chuàng)音頻 編輯:ZZZ 2024-06-18 09:42:23 加入收藏
在上一期的探討中,我們深入了解了語音產(chǎn)生的原理,并分享了關于錄擴音的實用建議。本期,我們將繼續(xù)這一旅程,聚焦于語音頻譜、共振峰以及影響語言清晰度的關鍵因素,以期為大家呈現(xiàn)更全面的語言清晰度(可理解性)洞察。
語音頻譜
語音的頻譜覆蓋了可聽頻譜的廣泛區(qū)域,其中元音 和輔音 構(gòu)成了語音的基本元素。元音 由聲帶振動產(chǎn)生,經(jīng)過聲腔的精細過濾,賦予聲音獨特的音色。而輔音 則是由空氣在喉嚨和口腔中的流動,特別是舌頭和嘴唇的精細操作產(chǎn)生的。
元音的特征,即使是在講悄悄話中也能被識別,這是因為形成不同元音的空腔結(jié)構(gòu)依然影響著空氣的流動。男性復雜語音音調(diào)的基頻通常在100-120 Hz之間,女性則高出一個八度,而兒童則更高。輔音則通常位于500 Hz以上的高頻區(qū)域,對語音的清晰度至關重要。
共振峰
在語音中,共振峰是另一個重要的概念。它們是通過聲道中空腔的共振“調(diào)諧”而產(chǎn)生的,
如果你聽兩個人以相同的音高說或唱同一個元音,那么在這兩種情況下,元音可能是相同的。然而,任何兩種聲音都不一定產(chǎn)生完全相同的頻譜。共振峰為元音提供了可感知的特征,每個人獨特的聲道結(jié)構(gòu)使得共振峰具有個體差異,這也是我們能夠區(qū)分不同說話者聲音的原因。
影響語言清晰度的關鍵因素
一、輔音的重要性:
在漢語、泰語等聲調(diào)語言中,語調(diào)或基本頻率承載著意義。而在非聲調(diào)語言中,如英語、西班牙語和日語,元音和輔音的變化則是區(qū)分單詞的關鍵。其中,輔音的重要性尤為突出。輔音主要位于高頻區(qū)域,對于語言的清晰度具有決定性作用。
二、頻率的重要性:
西方語音中,頻率的重要性如下圖所示:
在圖中我們可以看到,2kHz左右的頻帶是感知清晰度方面最重要的頻率范圍。因為大多數(shù)輔音都在這個頻帶中。
(Ref: N.R. French & J.C. Steinberg: Factors governing the intelligibility of speech sounds. JASA vol. 19, No 1, 1947).
對語音信號進行高通或低通濾波的實驗也驗證了這一點。使用20 Hz的高通濾波器,語音可以100%被理解,這是因為完整的語音頻譜并未被過濾。當高通濾波器切斷500Hz以下的信號時,因為即使一部分語音能量被刪除,語音的可理解性僅降低5%;但當低通濾波器在1kHz處切斷時,可理解性已大幅下降至40%以下。這再次強調(diào)了1kHz至4kHz頻率范圍對語音清晰度的重要性。
三、背景噪聲:
背景噪聲是影響語音清晰度的另一重要因素。在語音系統(tǒng)中,除了語音本身之外的所有信號都可以被認為是噪聲。因此,在禮堂或教室里,空調(diào)和其他嘈雜的設備運行時都會使語音變得不那么清晰。此外,其他人的存在也會產(chǎn)生噪音。在電視或電影音效中,對白的電平與背景音樂或氛圍聲音電平之間的關系問題也是非常重要的。
在這個圖表中,語音可理解度是根據(jù)信噪比(S/N)繪制的。較低的曲線表明,即使信噪比為負,也就是說噪聲比語音水平高10 dB,語音仍然可以在一定程度上被理解。但在任何情況下,最佳的感知語音水平約為60 dB或20 μPa。
通過大量的研究,總的來說結(jié)果表明:
1. 當背景噪音低于40dBA時,最佳語音電平不變。
2. 當背景噪聲電平大于40 dB(A)時,最佳語音電平或信噪比保持在+15 dB(A)左右的電平。
3. 在信噪比足夠好的情況下,聽力可理解性的難度隨著語音電平的增加而增加,使可理解性接近完美。
此外,1kHz-4kHz的頻率范圍應該“保持清晰”。例如,當添加音樂在影視作品中作為背景時,參量均衡器在該頻率范圍內(nèi)衰減音樂5-10 dB,這樣將會提高語音對白的可理解性。
四、混響:
在談論語音清晰度時,混響也被視為一種“噪音”。雖然輕微的混響可以支持講話,但一旦輔音被抹去,可理解性將大幅下降。因此,在錄音和擴聲過程中,需要仔細控制混響的影響。
通過深入了解語音頻譜、共振峰以及影響語言清晰度的關鍵因素,我們可以更好地掌握如何確保在各種場景下維持高質(zhì)量的語音清晰度。無論是面對面交流還是通過擴聲系統(tǒng)傳播聲音,這些洞察都將為我們提供寶貴的指導。
評論comment