首页 > 代码库 > 数字语音信号处理学习笔记——语音信号的数字模型(3)
数字语音信号处理学习笔记——语音信号的数字模型(3)
2.4 语音的感知
2.4.1 几个概念
语音的听觉感知是一个复杂的人脑-心理过程。对听觉感知的研究还很不成熟。听觉感知的试验主要还在测试响度、音高和掩蔽效应等。人耳听觉界限的范围大约为20Hz~20kHz。在频率范围低端,感觉声音变成低频脉冲串,在高端感觉声音减小直至完全听不到一点儿声响。语音感知的强度范围是0~130dB声压级,声音强度太高,感到难以忍受,强度太低则感到寂静无声。
1.响度
这是频率和强度级的函数。通常用响度(单位为宋)和响度级(单位为方)来表示。
人耳刚刚可以听到的声音强度,称为“听阈”。另外,加大声音的强度,使听起来令耳朵感到疼痛,这个阈值称为“痛阈”。
2.音高
音高也称基音。物理单位为赫兹,主观感觉的音高单位是美(Mel)。
响度与音高之间具有互为补充的关系。
2.4.2 掩蔽效应
两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变的不易察觉,这种现象称为掩蔽效应。
2.4.3 临界带宽
用一中心频率为f,带宽为delta-f的白噪声来掩蔽一频率为f的纯音,先将这个白噪声的强度调节到使被掩蔽纯音恰好听不见为止。然后将delta-f由大到小逐渐变化,而保持单位频率的噪声强度不变,起初这个纯音一直听不见,但当delta-f小到某个临界值时,这个纯音就突然可以听见了。如果再进一步减小delta-f,被掩蔽音f就会越来越清晰。这里刚刚开始能听到的被掩蔽声时的delta-f宽的频带,叫做频率f处的临界带。
2.5 语音信号模型
语音生成系统的传递函数由这个三个函数级联而成:
2.5.1 激励模型
发浊音时,由于声门不断开启和关闭,产生间隙的脉冲。经仪器测试它类似于斜三角形的脉冲。也就是说,这时的激励波是一个以基音周期为周期的斜三角脉冲串。
在发清音的场合,声道被阻碍形成湍流,所以可以模拟成随机白噪声。
2.5.2 声道模型
典型的声道模型有两种,即无损声管模型和共振峰模型。
2.5.3 辐射模型
从声道模型输出的是速度波,而语音信号是声压波。二者的倒比称为辐射阻抗,它表征口唇的辐射效应。
2.6 语音信号数字模型