本发明涉及通信领域,具体而言,涉及一种语音信息的优化能力的确定方法及装置、存储介质。
背景技术:
随着语音识别技术(automaticspeechrecognition,简称为asr,也成为自动语音识别)的兴起,针对语音识别优化的录音设备越来越多,很多录音设备都开始支持针对非人声部分进行降噪处理从而对人声进行优化,但是目前无法对设备人声优化能力进行量化,不方便进行设备选型。
针对相关技术中,无法对设备的人声优化能力进行量化分析,进而无法选择最合适的设备等问题,尚未提出有效的技术方案。
技术实现要素:
本发明实施例提供了一种语音信息的优化能力的确定方法及装置、存储介质,以至少解决相关技术中无法对设备的人声优化能力进行量化分析,进而无法选择最合适的设备等问题。
根据本发明的一个实施例,提供了一种语音信息的优化能力的确定方法,包括:获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
可选地,根据所述采集音序列得到所述测试音序列的分词结果矩阵,包括:对所述采集音序列进行解析,得到文本结果序列;对所述文本结果序列进行分词处理,得到分词结果矩阵。
可选地,获取在无噪音环境下的生物对象的语音信息之后,所述方法还包括:对获取到的语音信息进行分词,得到正确分词矩阵。
可选地,使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,包括:将所述分词结果矩阵的每一行按照所述正确分词矩阵对齐,进而得到分词差异;使用所述词向量差异对所述分词差异进行处理,得到所述差异结果。
可选地,通过固定的播音设备,在与所述待测试设备固定的距离上播放所述测试音序列。
根据本发明的另一个实施例,还提供了一种语音信息的优化能力的确定装置,包括:获取模块,用于获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;第一处理模块,用于采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;第二处理模块,用于通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;第三处理模块,用于使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
可选地,所述第二处理模块,还用于对所述采集音序列进行解析,得到文本结果序列;对所述文本结果序列进行分词处理,得到分词结果矩阵。
可选地,通过固定的播音设备,在与所述待测试设备固定的距离上播放所述测试音序列。
根据本发明的另一个实施例,还提供了一种存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行以上任一项所述的语音信息的优化能力的确定方法。
根据本发明的另一个实施例,还提供了一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行以上任一项所述的语音信息的优化能力的确定方法。
通过本发明,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力,即在语音信息的优化能力的确定过程中引入测试音序列,采用上述技术方案,解决了相关技术中,无法对设备的人声优化能力进行量化分析,进而无法选择最合适的设备等问题,进而提供了一种能够确定语音信息的优化能力的确定方法,也方便了后续选择合适的待测试设备。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为根据本发明实施例的语音信息的优化能力的确定方法的流程图;
图2是根据本发明实施例的语音信息的优化能力的确定装置的结构框图;
图3是根据本发明实施例的语音信息的优化能力的确定装置的另一结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
本发明实施例提供了一种语音信息的优化能力的确定方法,图1为根据本发明实施例的语音信息的优化能力的确定方法的流程图,如图1所示,包括:
步骤s102,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;
步骤s104,采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;
步骤s106,通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;
步骤s108,使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
通过本发明,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力,即在语音信息的优化能力的确定过程中引入测试音序列,采用上述技术方案,解决了相关技术中,无法对设备的人声优化能力进行量化分析,进而无法选择最合适的设备等问题,进而提供了一种能够确定语音信息的优化能力的确定方法,也方便了后续选择合适的待测试设备。
在本发明一可选实施例中,根据所述采集音序列得到所述测试音序列的分词结果矩阵,包括:对所述采集音序列进行解析,得到文本结果序列;对所述文本结果序列进行分词处理,得到分词结果矩阵。
在本发明一可选实施例中,获取在无噪音环境下的生物对象的语音信息之后,所述方法还包括:对获取到的语音信息进行分词,得到正确分词矩阵。
在本发明一可选实施例中,使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,包括:将所述分词结果矩阵的每一行按照所述正确分词矩阵对齐,进而得到分词差异;使用所述词向量差异对所述分词差异进行处理,得到所述差异结果。
在本发明一可选实施例中,通过固定的播音设备,在与所述待测试设备固定的距离上播放所述测试音序列。
以下结合一示例对上述语音信息的优化能力的确定过程进行解释说明,但不用于限定本发明实施例的技术方案,本发明示例的技术方案如下:
步骤1,采集一段设备运用场景(相当于上述实施例的当前测试环境)的环境噪音n;
步骤2,采集一段安静环境下正常的人声说话音v,通过asr引擎得到正确的文本结果sr,使用nlp工具对其进行分词,得到正确分词序列[rw0,rw1,rw2……rwn];
步骤3,对说话音v使用不同的增益系数g进行处理,然后与环境噪音n合并,得到测试音序列[a0,a1,a2……an];
步骤4,使用固定的播音设备,固定的距离播放测试音序列a,并使用待测试设备得到采集音序列[r0,r1,r2……rn];
步骤5,使用同样的asr引擎对采集音序列r得到解析的文本结果序列[s0,s1,s2……sn];
步骤6,使用同样的nlp工具对文本结果序列[s0,s1,s2……sn]进行分词,得到分词结果矩阵m;
[
[w00,w01,w02……w0m],
[w10,w11,w12……w0m],
[w20,w21,w22……w2m],
……
[wn0,wn1,wn2……wnm]
]
步骤7,对于分词结果矩阵m中每一行和正确分词序列进行对齐,统计增减的词语得到词数差异d;对于对齐的词使用词向量工具计算词差距l,使用v=αd+βl得到每个测试音序列的差异结果,从而可以得到设备在固定环境噪音下对人声优化能力的量化结果。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
实施例2
在本实施例中还提供了一种语音信息的优化能力的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图2是根据本发明实施例的语音信息的优化能力的确定装置的结构框图,如图2所示,该装置包括:
获取模块20,用于获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;
第一处理模块22,用于采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;
第二处理模块24,用于通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;
第三处理模块26,用于使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
通过本发明,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力,即在语音信息的优化能力的确定过程中引入测试音序列,采用上述技术方案,解决了相关技术中,无法对设备的人声优化能力进行量化分析,进而无法选择最合适的设备等问题,进而提供了一种能够确定语音信息的优化能力的确定方法,也方便了后续选择合适的待测试设备。
在本发明一可选实施例中,所述第二处理模块24,还用于对所述采集音序列进行解析,得到文本结果序列;对所述文本结果序列进行分词处理,得到分词结果矩阵。
在本发明一可选实施例中,通过固定的播音设备,在与所述待测试设备固定的距离上播放所述测试音序列。
在本发明一可选实施例中,如图3所示,所述装置还包括:第四处理模块28,用于对获取到的语音信息进行分词,得到正确分词矩阵。
在本发明一可选实施例中,第三处理模块26,还用于:将所述分词结果矩阵的每一行按照所述正确分词矩阵对齐,进而得到分词差异;使用所述词向量差异对所述分词差异进行处理,得到所述差异结果。
以下再结合优选实施例对上述语音信息的优化能力的确定过程进行进一步说明,但不用于限定本发明实施例的技术方案。
通过语音信息“你好,北京欢迎你”得到的正确分词序列如下:
[你好,北京,欢迎,你];
进而得到分词结果矩阵m:
[
[你,北京,你],
[你,北京,换,你],
[你好,北京,欢迎,你],
[你好,北京,欢迎,你,啊],
];
分词结果矩阵m和正确分词序列对齐:
[
[你,北京,add_tag,你],
[你,北京,换,你],
[你,北京,欢迎,你],
[你,北京,欢迎,你,del_tag],
];
分词差异d[1,0,0,1];
词向量差异
[
[α*(0+0+1+0)+β*1],
[α*(0+0+1+0)+β*0],
[α*(0+0+0+0)+β*0],
[α*(0+0+0+0)+β*1],
]
[α+β,α,0,β]。
综上可知,该测试设备在第3级音量环境下,效果最好。
本发明的实施例还提供了一种存储介质,该存储介质包括存储的程序,其中,上述程序运行时执行上述任一项的方法。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的程序代码:
s1,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;
s2,采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;
s3,通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;
s4,使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-onlymemory,简称为rom)、随机存取存储器(randomaccessmemory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
s1,获取待测试设备运行在当前测试环境中的噪音信息和在无噪音环境下的生物对象的语音信息;
s2,采用预先设定的不同的增益系数对所述语音信息进行处理,得到的结果与所述噪音信息进行合并,得到测试音序列;
s3,通过所述待测试设备对所述测试音序列进行采集,得到采集音序列,根据所述采集音序列得到所述测试音序列的分词结果矩阵;
s4,使用预设的词向量工具对所述分词结果矩阵进行处理,得到所述测试音序列的差异结果,其中,所述差异结果用于指示所述待测试设备对于不同的语音信息的优化能力。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。