语音识别---纯音

⚠申明：未经许可，禁止以任何形式转载，若要引用，请标注链接地址。全文共计3077字，阅读大概需要3分钟
🌈更多学习内容，欢迎👏关注👀【文末】我的个人微信公众号：不懂开发的程序猿
个人网站：https://jerry-jy.co/

❗❗❗知识付费，🈲止白嫖，有需要请后台私信或【文末】个人微信公众号联系我

语音识别---纯音

纯音
- 一、任务需求
- 二、任务目标
- - - - 1、掌握纯音信号生成方法
      - 2、掌握两个纯音信号的合成方法
- 三、任务环境
- - - - 1、jupyter开发环境
      - 2、python3.6
      - 3、tensorflow2.4
- 四、任务实施过程
- - 1、生成单独的纯音
  - 2、两个纯音的合成
- 五、任务小结
说明

纯音

一、任务需求

所谓纯音（pure tone），本质是单一的音。具有音高和响度两个基本特征。前者主要取决于机械波的频率和波长，后者主要取决于机械波的振幅。

不同波长的纯音通常是实验室内生成的机械波信号。尽管自然界很少有纯音，但对于复杂的声波，我们还是可以使用傅里叶变换，将多种频率的纯音组合实现近似。因此生成纯音，也是很重要的功能。

要求：本节实验我们将使用librosa构造给定频率的纯音（余弦）信号。

二、任务目标

1、掌握纯音信号生成方法

2、掌握两个纯音信号的合成方法

三、任务环境

1、jupyter开发环境

2、python3.6

3、tensorflow2.4

四、任务实施过程

1、生成单独的纯音

首先加载工具

import librosa
import librosa.display
import numpy as np
import IPython.display as ipd
import matplotlib.pyplot as plt

然后使用librosa.tone生成纯音，该函数有两种方法可以生成纯音，如下所示

# 生成440纯音信号
tone440 = librosa.tone(440, duration=1)

# 使用另一种方法生成440纯音信号
tone440 = librosa.tone(440, sr=22050, length=22050)

tone440

array([ 6.12323400e-17,  1.25050524e-01,  2.48137848e-01, ...,-3.67329594e-01, -2.48137848e-01, -1.25050524e-01])

为了更好的了解什么叫纯音，我们绘制出纯音的波形图

plt.figure(figsize=(12,2))
librosa.display.waveshow(tone440[:1000],sr=22050)

可以看出，纯音其实就是一条正（余）弦曲线。接下来我们播放纯音听一听。

ipd.Audio(tone440, rate=22050)

提取纯音的梅尔频谱图进行观察

import matplotlib.pyplot as plt
fig, ax = plt.subplots()
# 生成梅尔倒谱图
S = librosa.feature.melspectrogram(y=tone440)
librosa.display.specshow(librosa.power_to_db(S, ref=np.max),x_axis='time', y_axis='mel', ax=ax)

2、两个纯音的合成

实验开始前，我们提到复杂信号可以通过傅里叶变换，转换成纯音信号的组合。接下来我们将尝试将两个纯音组合成一个新的信号。

首先生成一个110hz的纯音。

tone110 = librosa.tone(110, sr=22050, length=22050)

然后将110hz的音频，和440hz的音频合成，只需简单的加法即可

tone_synth = tone110+tone440

绘制合成前后三种声音的波形图进行比较

fig,ax = plt.subplots(nrows=3,sharex=True,figsize=(12,6))
# 演示复合波形图
librosa.display.waveshow(tone_synth[:500],sr=22050,ax=ax[0],label='tone_synthesis')
# 演示合成复合波形的单一纯音信号
librosa.display.waveshow(tone440[:500],sr=22050,ax=ax[1],label='tone_440',color='b')
librosa.display.waveshow(tone110[:500],sr=22050,ax=ax[2],label='tone_110',color='r')
[ax[i].set_xlabel('') for i in range(2)]
[ax[i].legend() for i in range(3)]plt.tight_layout()