张春成

V2

2022/03/24阅读:62主题:默认主题

声音的谱

声音的谱

本文对英文中易混淆发音的单词进行谱分析, 从谱分析结果中, 可以看出一些不容易听出来的东西。


单词选择

易混淆的单词我选择了两组, 分别是

  • race 和 rice
  • test 和 text

Voicemaker[1]网站中, 将它们的文本转换为声音。

VoiceMaker
VoiceMaker

频谱计算及可视化

之后,计算它们的频谱, 并使用小波方法计算时间-频率谱

其中, 的结果如下

在时间方向上

Race-Rice-1
Race-Rice-1

可以看出, 中的 更“浊”一些, 的发音也更多。

在频率方向上

Race-Rice-2
Race-Rice-2

另一组, 的结果如下

在时间方向上

Test-Text-1
Test-Text-1

可以看出, 的后一个 明显被吞掉了, 而 的后一个 是发音的。

在频率方向上

Test-Text-2
Test-Text-2

可见,在频率方向上, 两组单词都是低频成分占主导, 看上去没什么差别。

另外, 其他的英文单词也可以用来比较, 三维时频图如下所示。

参考资料

[1]

Voicemaker: https://voicemaker.in/

分类:

后端

标签:

后端

作者介绍

张春成
V2