V1

2022/08/17阅读:14主题:橙心

音频基础 从上到下深挖

声音

声音:是由物体振动产生的声波。是通过介质(空气或固体、液体)进行传播,振动人耳膜,刺激听觉神经,传输声音信号到人的大脑。要注意的是,在真空是无法传播声音。

为了方便理解,可以想象声音在空气中的信号是一个正弦波。

声音的三要素

  • 音量: 声音的大小,振幅大小.

  • 音调: 生活中说到高音和低音,即声音的频率.

  • 音色:不同的介质,在相同的音量和音调下,发出声音给人的感觉是不一样,例如鼓声和吉他.(本质谐波不同)

人耳可听声的频率范围为 20Hz~20KHz.

人声频率:

男低音82~392Hz,基准音64~523Hz; 男中音123~493Hz,男高音164~698Hz;
女低音82~392Hz,基准音164~698Hz; 女中音123~493Hz,女高音220~1.1kHz;

频段划分: 低频:30Hz--200Hz 中频:300Hz--5KHz 高频:6KHz--18KHz

超声波是一种频率高于20kHz的声波。

次声波是一种频率 低于20Hz的声波。

dB分贝

分贝代表是声音强度,振幅是我们认为给定声音的音量,用分贝 (dB) 表示。声音的频率和幅度是完全分开的。 关于分贝要记住的一件关键事情是它们呈指数增长,而不是线性增长。这意味着音量增加 10 dB 实际上响亮 10 倍,而增加 20 dB 则响亮 20 倍。

多媒体音频处理

打开多媒体音视频文件,例如xxx.mp4,xxx.flv,对文件的解封装音频压缩数据和视频压缩数据进行分离;得到音频压缩数据(这部分数据经过音频编码);解码得到原始音频数据PCM数据.

音频编码的主要作用是将音频采样数据(数字信号原始PCM数据等)压缩成为音频码流,从而降低音频的数据占用。音频编码也是互联网视音频技术中一个重要的技术。但是一般情况下音频的数据量要远小于视频的数据量,因而即使使用稍微落后的音频编码标准,而导致音频数据量有所增加,也不会对视音频的总数据量产生太大的影响。高效率的音频编码在同等的码率下,可以获得更高的音质。

音频编码有AAC、AC-3 、MP3和WMA等。

音频的三元组:采样率、采样大小和通道数。

数字功放芯片音频处理流程

Input Mixer数字信号输入 :左右声道的混音成一个声道 或者颠倒声道,底层寄存器一些操作。

Equalizer数字均衡EQ: 经过傅里叶变化将音频信号时域转换成频域信号分出不同的频段,针对每一个频率不同的振幅对每一频段进行增大或者减小。因为喇叭物理结构,不同的频率可能出现振幅不同,不同频段出现衰减或者放大。为了解决这个问题,尽量拉平频响,实现弥补喇叭频响。还可以做一些音效)PEQ(可以调节寄存器参数,对每一个频段进行放大或缩小)。在音频信号中,频响又代表什么?频响是在电子学上用来描述一台仪器对于不同频率的信号的处理能力的差异。来判断一个耳机音质好坏。好的频响曲线并不代表音质好,但是差的频响曲线一定音质很差。

Volume: 达到喇叭功率放大,实现喇叭最大功率的效果,输入-12dB信号 调节Volume 达到喇叭实现最大功率。-12db作为标准信号,不同的产品又不同标准,不同国家也有不同标准。

DRC:动态范围控制,在时域范围检测振幅,是在时域范围内放大缩小,如果输入0db信号,在调节Volume不做任何处理可能会把喇叭烧掉,通过设置门限值,达到输出信号的振幅不超出喇叭满振幅的范围,避免烧坏喇叭。为什么要选择0dB?因为在实际场景中输入信号不可能都是标准的-12db,需要找比标准值大几倍0db(音量非常大),来测试,避免烧坏喇叭。还有类外一个作用,举例说明,一个人唱歌中间出现了鼓声,导致DRC压制振幅,鼓声以来就会压低唱歌的声音,鼓声消失时,人的声音就出现忽大忽小的情况,针对这个问题 DRC会针对每一个频段进行增益或者衰减混成一路信号(分成高低中频,分的越细越好)。

AGL:自动增益调节 当输入信号大于一定阈值时,会对进行降低,当输入信号振幅小于一定的阈值 会对其进行放大 。夜间模式,飞机扔炸弹的声音和窃窃私语(可能音量变小,导致听不见)的声音,可以实现用户可以听出人窃窃私语的声音。

THD:chiper限幅,有点类似DRC,来达到不超出喇叭满功率范围。DRC类似弹簧,内置有(attact time)攻击时间当输出信号振幅超出阈值,不会马上降到阈值 ,有一个攻击时间。而chiper超出阈值直接消顶处理 ,不会升上去。

Amp:I2S引脚给到SOC,回声信号输入作为喇叭参考音 一些语音算法需要用到这部分回声(避免小爱同学语音,被唤醒) 将麦克风听到喇叭信号去掉,避免自己喇叭的声音回声干扰进入输入信号 。

Level METER:实时监测 输入信号和输出信号进行匹配,筛选掉这部分信号。

输出(PWM载波信号)接入喇叭。

扩展知识点:

什么是频响?

增益随频率的变化曲线.简单认为,喇叭对频率的响应程度。喇叭的特性。提到的声压数值。 所以频响曲线是否平直,只代表了某只音箱或者某个系统对于各个频段的声音的音量表现是否大致相同而已,而于音质无关。 会有失真的情况。

分类:

后端

标签:

C++

作者介绍

V1