一种将录音音频分割成段的方法与流程

文档序号:12475846阅读:6210来源:国知局

本发明属于 本发明涉及音频处理领域,特别涉及一种将录音音频分割成段的方法。



背景技术:

随着互联网技术的不断发展,图像、视频、音频等多媒体数据已逐渐成为互联网信息处理领域中主要的信息媒体形式。其中,音频数据占有很重要的位置。原始音频数据本身是一种非语义符号表示和非结构化的二进制流。在大型会议上形成的录音音频往往容量很大,时间很长,并且录音者有多人,而用户需要的往往是其中一小段,或者是某个人的音频,这时候就需要把大容量的音频分割成若干段,方便存储取用,在分割的过程中往往分割形成的节点处不是句尾或者段尾(将其定义为停顿处),会造成音频损失,同时也造成用户体验不好。



技术实现要素:

本发明所要解决的技术问题是音频分割形成的节点处不是停顿处从而造成音频损失及用户体验不好的问题,而改善这一问题的办法就是将分割节点处调整至停顿处。

为解决上述技术问题,本发明提供了一种将录音音频分割成段的方法,其特征是包括以下步骤:

获取并遍历录音音频数据,获取语音部分和静音部分;

设定停顿处;

根据时间分割形成若干个节点,设置节点编号;

相邻的两个节点之间形成段;

对节点进行修正;

所述对节点进行修正的方法是判断节点是否属于停顿处,如果节点不属于停顿处,那么把节点调整至上一个停顿处;

如果节点属于停顿处,继续修正下一个节点直至结束;

所述静音部分的时间为相邻的两个语音部分之间的时间差。

进一步,所述设定停顿处的方法是,根据静音部分的时间计算平均静音时间,将大于平均静音时间的阈值的静音部分判断为停顿处。

进一步,所述根据静音部分的时间计算平均静音时间的步骤是,获取静音部分的总时长,以及静音部分的数量,用静音部分的总时长除以静音部分的数量计算出平均静音时间。

进一步,所述设定停顿处的方法是,取静音部分的时间的中位数并设定为停顿处。

进一步,所述设定停顿处的方法是,由录音者按照习惯语速录制录音音频的样本,所述录音音频的样本包括一个停顿处,将录音音频的样本的停顿处设定为录音音频的停顿处。

进一步,所述修正节点的方法还包括节点前和/或节点后的字符是否与节点标签库中的标签匹配,所述节点标签库是存储了若干句子的段开始或段结束的词标签的语料库。

进一步,所述修正节点的方法还包括判断节点的字符是否与人物更换标签匹配,所述人物更换标签是在录音时根据人的声音不同形成的用以区分的人物差异化标识符。

采用上述技术方案,可达到以下效果:

1.大容量的音频分割成若干段,方便存储取用;

2.在分割的过程中分割形成的节点属于停顿处(一般是句尾或段尾),避免了音频损失,增强了用户体验。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定,在附图中:

图1示出了一种将录音音频分割成段的方法的流程示意图。

具体实施方式

下面结合附图和具体实施方式对本发明的技术方案作进一步具体说明。

为解决上述技术问题,如图1所示,本发明提供了一种将录音音频分割成段的方法,其特征是包括以下步骤:

获取并遍历录音音频数据,获取语音部分和静音部分;

设定停顿处;

根据时间分割形成若干个节点,设置节点编号;

相邻的两个节点之间形成段;

对节点进行修正;

所述对节点进行修正的方法是判断节点是否属于停顿处,如果节点不属于停顿处,那么把节点调整至上一个停顿处;

如果节点属于停顿处,继续修正下一个节点直至将所有节点处理结束;

所述静音部分的时间为相邻的两个语音部分之间的时间差。

进一步,所述设定停顿处的方法是,根据静音部分的时间计算平均静音时间,将大于平均静音时间的阈值的静音部分判断为停顿处。

进一步,所述根据静音部分的时间计算平均静音时间的步骤是,获取静音部分的总时长,以及静音部分的数量,用静音部分的总时长除以静音部分的数量计算出平均静音时间。

进一步,所述设定停顿处的方法是,取静音部分的时间的中位数并设定为停顿处。

进一步,所述设定停顿处的方法是,由录音者按照习惯语速录制录音音频的样本,所述录音音频的样本包括一个停顿处,将录音音频的样本的停顿处设定为录音音频的停顿处。

进一步,所述修正节点的方法还包括节点前和/或节点后的字符是否与节点标签库中的标签匹配,所述节点标签库是存储了若干句子的段开始或段结束的词标签的语料库。

进一步,所述修正节点的方法还包括判断节点的字符是否与人物更换标签匹配,所述人物更换标签是在录音时根据人的声音不同形成的用以区分的人物差异化标识符。

本领域技术人员还应当理解,以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1