语音基础知识

mac2022-07-05 9

语音：以给定自然语言所讲的话音模式或模拟这种模式的声学信号。（语言符号的载体）

四要素：音高（声波频率即振动次数）、音强（声波振幅的大小）、音长（声波振动持续的时间长短）、音色（声音的特色和本质）

语音信号：特点（1）语音信号的带宽（约5KHz，主要能量集中在低频段）。

（2）典型的随机信号（通常假设语音信号是短时平稳的[5-10ms] 内）

语音信号短时谱分析：

通过短时傅里叶谱分析噪音值还原初始语音得到原始语音。

语谱图：分析语音信号的频率。

浊音普：与基音及谐波相对应的谱线。

基音：

周期：声带振动的周期，与人的声带长度，质量等物理量有关，人的年龄，性别，情绪等生理状态有关。（音高[听觉量]与基音[物理量]的关系如同冷热与温度的关系）

语音时域信号的特点：（1）清音段：能量低，过零率高，像随机的噪音常与语音的辅音段对应

（2）浊音段：能量高，过零率低，波形具有周期性，所谓的短时平稳性质就处于这个语音浊音段中

（3）过渡段：指辅音段像元音段信号变化之间的部分，信号变化快，是语音信号处理中最复杂困难的部分

声音根据使用范围分为三级：1.电话语音级：300-3.4KHz 11.025KHz

2.调幅广播级：50-7KHz 采样频率22.05KHz

3.高保真立体声级：20-20KHz 44.1KHz

语音信号的数字化：频率（单位时间内振动的次数）约为300-3400Hz。一种模拟信号，为了使用计算机处理必须将它转换成数字编码的形式。

转载于:https://www.cnblogs.com/Watermelon-Liu/p/Watermelon_Liu.html

最新回复(0)