语音:以给定自然语言所讲的话音模式或模拟这种模式的声学信号。(语言符号的载体)
四要素:音高(声波频率即振动次数)、音强(声波振幅的大小)、音长(声波振动持续的时间长短)、音色(声音的特色和本质)
语音信号:特点(1)语音信号的带宽(约5KHz,主要能量集中在低频段)。
(2)典型的随机信号(通常假设语音信号是短时平稳的[5-10ms] 内)
语音信号短时谱分析:
通过短时傅里叶谱分析噪音值还原初始语音得到原始语音。
语谱图:分析语音信号的频率。
浊音普:与基音及谐波相对应的谱线。
基 音:
周期:声带振动的周期,与人的声带长度,质量等物理量有关,人的年龄,性别,情绪等生理状态有关。(音高[听觉量]与基音[物理量]的关系如同冷热与温度的关系)
语音时域信号的特点:(1)清音段:能量低,过零率高,像随机的噪音常与语音的辅音段对应
(2)浊音段:能量高,过零率低,波形具有周期性,所谓的短时平稳性质就处于这个语音浊音段中
(3)过渡段:指辅音段像元音段信号变化之间的部分,信号变化快,是语音信号处理中最复杂困难的部分
声音根据使用范围分为三级:1.电话语音级:300-3.4KHz 11.025KHz
2.调幅广播级:50-7KHz 采样频率22.05KHz
3.高保真立体声级:20-20KHz 44.1KHz
语音信号的数字化:频率(单位时间内振动的次数)约为300-3400Hz。一种模拟信号,为了使用计算机处理必须将它转换成数字编码的形式。
转载于:https://www.cnblogs.com/Watermelon-Liu/p/Watermelon_Liu.html