一种信号帧矩阵化的音乐信息记录方法与流程

文档序号:21709509发布日期:2020-08-05 00:54阅读:327来源:国知局
一种信号帧矩阵化的音乐信息记录方法与流程

本发明属于声音信号处理与音乐信息识别与储存领域,涉及音乐信息记录方法,尤其涉及一种信号帧矩阵化的音乐信息记录方法。



背景技术:

随着人类的科学技术的不断发展和上层精神世界的不断丰富,音乐信息检索技术(mir)的重要性越发的凸显。日常人们听到自己喜欢的音乐时,通常想要立刻获取音乐的相关信息,这时就需要进行音乐的信息检索。音乐信息检索技术的发展同时带来了音乐检索数据库的建立问题。

虽然目前已经存在音乐信息记录与检索的方法,例如midi检索。但midi检索较为适用于标准电子音乐的检索,因为在midi信息中,记录着标准的时长、声音音色、音高等信息,这些信息可以通过音乐接口直接形成音乐,该过程形成了标准的音乐类型。但若该音乐在数据库中无对应的数据,需要通过现有的演唱和音乐录音进行转化时,由于演唱和音乐录音具有较大的随机性和不准确性变化,例如演唱时出现滑音、颤音等装饰音,则无法通过midi记录。

因此,该方式记录的midi文件对原有的信号的复原度较低,一般应用midi的情况为单向输出,对于该情况,又出现了一种完整的记录方法,声音信号频域全信息记录法。该方法对声音信号的每一帧信号的内的整个频谱信息进行记录,以实现声音信号的完整复原。但由于音乐信号在低频区域与高频区域中分布密度区别较大,这就会使该方法在有效信号较为稀疏的高频区域浪费大量的储存空间。



技术实现要素:

本发明的目的在于克服现有技术的不足,提供一种信号帧矩阵化的音乐信息记录方法,用于解决现有的音乐数据记录中的空间浪费与音乐复原度较低的问题,提高音乐信号记录的完整性并同时节约信息存储空间。

本发明解决其技术问题是通过以下技术方案实现的:

一种信号帧矩阵化的音乐信息记录方法,其特征在于:所述方法的步骤为:

s1、音乐时域信号及参数的采集;

s2、音乐信号的时域及参数分帧;

s3、音乐信号帧的频域信号转换;

s4、音乐信号帧的频域坐标转换;

s5、音乐信号帧频域内频带划分;

s6、音乐信号帧各频带权重计算。

而且,所述步骤s1中音乐时域信号及参数的采集采用cd标准音质的44.1khz、16bits。

而且,所述步骤s2中音乐信号的时域及参数分帧选取矩形窗,窗长为68.03ms,帧移为17ms。

而且,所述步骤s4中音乐信号帧的频域坐标转换采用以为底数的对数坐标。

而且,所述步骤s5中音乐信号帧频域内频带划分使用以f'∈[47.8,155.8]范围内,每间隔1/3个值划分为一个频带的方式。

而且,所述步骤s6中音乐信号帧各频带权重计算使用能量积分并做归一化。

本发明的优点和有益效果为:

1、本发明信号帧矩阵化的音乐信息记录方法,以矩阵化信息记录音乐帧,可以提高声音谐波组成部分的可视性。

2、本发明信号帧矩阵化的音乐信息记录方法,以矩阵化的形式记录音乐帧信息,可以有效的节约大量的存储空间,实现音乐信息的压缩,同时更完整的复原音乐信号。

3、本发明信号帧矩阵化的音乐信息记录方法,对声音频带进行划分估计,再进行整合估计,模拟人耳的听觉场景,更具有准确性和可信性。

附图说明

图1为本发明的声音信号帧频谱频带划分图;

图2是本发明的基于声音信号频谱频带划分后形成的声音帧信息记录的归一化权重矩阵图。

具体实施方式

下面通过具体实施例对本发明作进一步详述,以下实施例只是描述性的,不是限定性的,不能以此限定本发明的保护范围。

一种信号帧矩阵化的音乐信息记录方法,其创新之处在于:该方法的步骤包括以下部分:

s1、音乐时域信号及参数的采集;s2、音乐信号的时域及参数分帧;s3、音乐信号帧的频域信号转换;s4、音乐信号帧的频域坐标转换;s5、音乐信号帧频域内频带划分;s6、音乐信号帧各频带权重计算。

s1、音乐时域信号及参数的采集:基于计算机声卡,采样率为44.1khz、16bits,为普通cd的音质记录标准。

s2、音乐信号的时域及参数分帧:本发明中,时域信号分帧的作用是将时域信号局部化处理,以便获得一段短时间内的声音分布情况。

本发明中将声音时域信号的截取窗设定为矩形窗,窗长为68.03ms,即为44.1khz下3000个采样点。选取68.03ms的原因是基于乐谱的基本知识:在音乐演奏中,谱面存在的最快速度为“最急板-prestissimo”,对应的演奏速度为208拍每分钟。又因为在乐谱中一般最多将表示一拍的音符拆解为四分之一拍。与之对应的音符变化速度为832拍每分钟,即每个音符在演奏中可能会出现的最快速度一般不超过832拍每分钟——72.12ms。故选取68.03ms可以保证音符在最快变化情境下可以被完整的记录。选取68.03ms作为帧长的同时,选取帧移为750个采样点——17ms,每个部分的采样点被重复利用四次,以保证时域信号采集的连续性。

s3、音乐信号帧的频域信号转换:在本发明中,每一帧的频域变换利用已经采样得到的3000个采样点进行快速傅里叶变换(fft)。

s4、音乐信号帧的频域坐标转换:经过快速傅里叶变换后的图像为纵坐标为振幅y,横坐标为线性分布的频率f,将频域分布图像的纵坐标表示为y'=20*logy,横坐标表示为以此进行频域的坐标转换。

s5、音乐信号帧频域内频带划分:基于上一步中转换完毕的频域图像,在频域图像f'∈[47.8,155.8]范围内,每间隔1/3个值划分为一个频带,共计324个频带,划分方式如图1所示。

s6、音乐信号帧各频带权重计算:采用如下公式进行计算,

其中:

q(m,n)表示小频带(m,n)内的声音能量;

maxmn表示小频带(m,n)的横坐标上限;

minmn表示小频带(m,n)的横坐标下限;

adb为某个位置的声音分贝数;

计算出所有频带的能量后,进行无关信息过滤运算,计算公式如下:

其中:

qm为横向大频带m的能量总和;

q(m,i)为(m,j)小频带内的能量总和;

对网格频带内的权重值进行处理:

即得到每个频带的q'(m,n)值,即可得到权重矩阵r如下所示:

对权重矩阵进行归一化处理:

其中:r(i,j)为矩阵r第i行第j列的元素。得到归一化矩阵rn,该操作第一步的目的是将矩阵的所有元素值先进行归一化,找出矩阵内的最大值元素,使矩阵内所有元素都除以该最大值,使矩阵内的所有元素r(i,j)∈[0,1];第二步的目的是将元素向上取整,使矩阵中的0元素保持为0,介于(0,1)之间的元素全部为1,之前值为1的元素仍然为1,归一化矩阵rn即用以记录音乐信息,如图2所示。

尽管为说明目的公开了本发明的实施例和附图,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换、变化和修改都是可能的,因此,本发明的范围不局限于实施例和附图所公开的内容。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1