用于智能设备的声源定位性能的测试方法和系统与流程

文档序号:15097185发布日期:2018-08-04 14:51阅读:193来源:国知局

本发明涉及声学技术领域,尤其涉及一种用于智能设备的声源定位性能的测试方法和系统。



背景技术:

智能设备逐渐进入人们的生活。其中部分智能设备能够接拾取户的语音指令并正确做出响应。例如现已有智能音箱,因其具有智能的语音拾取算法、较高的语音识别率、完善的电器控制方案,可作为其他智能家居的控制入口。一般这类智能设备均需支持声源定位算法,这种算法可保证智能设备有效地识别出用户所发出的语音指令的来源方向。但现并无针对智能设备声源定位性能的测试方法和测试系统。



技术实现要素:

本发明的一个方面提供了一种用于智能设备的声源定位性能的测试方法,其包括:

控制指令播放装置播放语音指令;

获取智能设备识别语音指令、及识别指令播放装置相对自身的设置角度的正确率;

根据正确率判定智能设备的声源定位性能。

可选地,智能设备与指令播放装置位于噪声声压级小于38dB的测试环境中。

可选地,本发明实施例的方法还包括:

控制噪声播放装置播放噪声,以使智能设备与指令播放装置位于具有噪声的测试环境中。

可选地,噪声播放装置有多个,且围绕智能设备均匀分布,控制噪声播放装置播放噪声包括:

控制每个噪声播放装置播放相同声压级的噪声。

可选地,控制噪声播放装置播放噪声包括:

调整噪声的声压级和/或语音指令的声压级,以在不同信噪比的测试环境下测试智能设备的声源定位性能。

本发明的另一方面提供了一种用于智能设备的声源定位性能的测试系统,其包括:

角度控制装置、指令播放装置和处理装置;

角度控制装置用于设置指令播放装置相对于智能设备的角度;

指令播放装置用于播放语音指令;

处理装置用于获取智能设备识别语音指令、及识别指令播放装置相对自身的设置角度的正确率,并根据正确率判定智能设备的声源定位性能。。

可选地,测试系统还包括用于播放噪声的噪声播放装置,以使智能设备与指令播放装置位于具有噪声的测试环境中。

可选地,测试系统包括至少两个噪声播放装置,至少两个噪声播放装置围绕智能设备均匀分布,且每个噪声播放装置播放相同声压级的噪声。

可选地,处理装置还用于调整噪声播放装置所播放的噪声的声压级和/或调整指令播放装置所播放的语音指令的声压级,以在不同信噪比的测试环境下测试智能设备的声源定位性能。

可选地,角度控制装置包括转盘,智能设备固定设置在转盘上,处理装置通过控制转盘转动设置指令播放装置相对于智能设备的角度。

本发明的一个有益效果在于,根据本发明实施例,可以通过测试得到智能设备识别语音指令及该语音指令发出时指令播放装置相对自身的设备角度的正确率,进而能够根据该正确率评估智能音箱的声源定位性能,本发明实施例可以根据需要在研发时、出厂前、使用中等各个阶段实施,是一种全新的标准化的测试方法。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。

图1是根据本发明实施例1的用于智能设备的声源定位性能的测试方法的流程图。

图2是根据本发明实施例2的用于智能设备的声源定位性能的测试系统的框图。

图3是根据本发明的实施例3的用于智能设备的声源定位性能的测试系统的硬件配置的原理框图。

具体实施方式

现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,该技术、方法和设备应当被视为说明书的一部分。

在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

<测试方法>

本发明实施例的测试方法可以在噪声声压级小于38dB的测试环境中实施,以提高测试的一致性和标准性,例如,本发明实施例的测试方法可以在消音室或听音室中完成。在该测试环境中至少设置有指令播放装置和智能设备。

参见图1所示,本发明实施例1所提供的测试方法可以包括以下步骤。

步骤11,控制指令播放装置播放语音指令。

在步骤11中,指令播放装置相对智能设备具有确定的设置角度,以实现对智能设备的声源定位性能的测试。

为提高测试的可信度,在步骤11中,可以针对同一设置角度控制指令播放装置播放一组语音指令,以测试智能设备在该设置角度下识别语音指令及识别该设置角度的正确率。

该一组语音指令可以包括由不同种人声发出的指令,例如,包括由成人女性声音发出的至少一个指令、及由成人男性声音发出的至少一个指令。

指令播放装置例如可以是监听级音箱,这种音箱所播放的语音指令更加标准。

语音指令的声压级是可以精确控制的。

在步骤12,获取智能设备识别语音指令、及识别指令播放装置相对自身的设置角度的正确率。

在本发明的一个例子中,该步骤11可以由测试人员完成。在该例子中,可以根据智能设备是否正确地执行了该语音指令对应的操作来判断智能设备是否正确识别了该语音指令,及通过智能设备上的声源方向指示灯的点亮状态判断智能设备是否正确识别了指令播放装置相对自身的设置角度。

在本发明的一个例子中,该步骤11也可以是由计算机设备来完成。在该例子中,一方面,计算机设备可以读取智能设备所识别出的指令,再将识别出的指令与该计算机设备内预存的测试文件中所设置的实际播放指令进行比较,进而判断智能设备是否正确识别了该语音指令,在此,指令播放装置可以在计算机设备的控制下根据该测试文件播放语音指令。另一方面,计算机设备读取智能设备所识别出的设置角度,再将识别出的设置角度与当前的实际设置角度相比较,以判断智能设备是否正确识别了指令播放装置相对自身的设置角度,

在该例子中,计算机设备可以从角度设置装置处获取当前的实际设置角度,即角度设置装置在调节完设置角度后,会将当前的实际设置角度发送至计算机设备供比较。

在该例子中,计算机设置也可以在预存的测试文件中记录指令播放装置相对于智能设备的设置角度序列,并根据该设置角度序列依次调节每次测试的设置角度,这样,计算机装置便可以获知每次测试对应的实际设置角度。

在本发明的一个例子中,可以综合各个设置角度的测试结果,确定智能设备识别语音指令、及识别指令播放装置相对自身的设置角度的正确率。例如,一共进行了8个设置角度的测试,如果在其中4个设置角度实现了正确识别,则正确率为50%。

在以上步骤11中,对于任一设置角度,可以控制指令播放装置播放一组语音指令。这样,在本发明的一个例子中,可以设置在智能设备正确识别出该一组语音指令及对应的设置角度的情况下,判定智能设备在对应的设置角度下实现了正确识别。在本发明的一个例子中,也可以设置在智能设备大比例正确识别出该一组语音指令及对应的设置角度的情况下,判定智能设备在对应的设置角度下实现了正确识别,该大比例为超过50%的比例,例如,一组语音指令包括5个语音指令,智能设备正确识别出该一组语音指令中的三个语音指令及对应的设置角度,则判定智能设备在对应的设置角度下实现了正确识别。

指令播放装置相对于智能设备的设置角度指的是指令播放装置相对于智能设备正面(声音入射面)的角度,这可以是将入射面的中心与指令播放装置的出射面的中心连线,该连线与入射面法线之间的角度即为指令播放装置相对于智能设备的设置角度。例如,指令播放装置被设置在智能设备的正前方(0度位置)、左侧30度角位置、右侧30度角位置等。

在上述不同设置角度的情况下,指令播放装置与智能设备的距离可以是等距的,该距离为指令播放装置的定位中心与智能设备的定位中心之间的距离。

例如,可以将智能设备固定在可旋转的转盘上,由实验人员手动转动转盘,或者由计算机设备控制转盘转动,从而设置指令播放装置相对于被测智能设备的角度。

在本发明的一个例子中,上述计算机设备可以是相对智能设备单独设置的至少一个设备,也可以与智能设备集成在一起成为一个整体设备。

在步骤13,根据正确率判定智能设备的声源定位性能。

在步骤13中,正确率越高,智能设备的声源定位性能越好。

在步骤13中,可以将声源定位性能分为几个等级,并设置正确率与声源定位性能的等级之间的对应关系,这样,便可根据该对应关系及步骤12获取到的正确率,确定智能设备的声源定位性能。

由此,本发明提供一种全新的用于智能设备的声源定位性能的测试方法,由于以上方法中的测试环境及测试的参数均可实现准确和一致的控制,使得该方法具有良好的标准性和测试的一致性。此外,在一些情况下,虽然被测智能设备能够正确地识别出语音指令,但其判定的声源的角度也可能是不准确的,或者虽然被测智能设备能够在误差允许范围内识别出声源的角度,但并不足以识别出语音指令,采用以上两个指标共同判断被测智能设备的声源定位性能,结果更加准确。

以上测试方法可以在安静环境下进行,也可以是在噪声环境下进行,或者在被测智能设备播放音频的场景下进行。

在噪声环境下进行测试,可以进一步测试智能设备在一定信噪比环境下或者不同信噪比环境下的声源定位性能。这样,本发明测试方法还可以包括如下步骤:

控制噪声播放装置播放噪声,以使智能设备与指令播放装置位于具有噪声的测试环境中。

为提高智能设备的噪声环境的均匀性和一致性,在本发明的一个例子中,噪声播放装置可以有多个,且围绕智能设备均匀分布,这样,上述控制噪声播放装置播放噪声可以进一步包括:控制每个噪声播放装置播放相同声压级的噪声。

噪声的声压级可实现精确控制。

以上各声压级的设定可以是人工完成,也可以是计算机控制完成。

在本发明的一个例子中,上述控制噪声播放装置播放噪声也可以进一步包括:调整噪声的声压级和/或语音指令的声压级,以在不同信噪比的测试环境下测试智能设备的声源定位性能。

这样,在步骤13中,便可以得到在不同信噪比情况下智能设备的声源定位性能。

<测试系统>

图2示出了用于智能设备的声源定位性能的测试系统,以实现上述实施例的测试方法。该测试系统至少包括:角度控制装置24、指令播放装置22和处理装置23。该测试系统用于对智能设备20进行测试。该测试系统可以设置在消音室或听音室中,以便于形成所需要的测试环境。

角度控制装置24用于设置指令播放装置22相对于智能设备20的角度。

在本发明的一个例子中,角度控制装置24可以包括可旋转的转盘,智能设备20固定设置在该转盘上。这样,例如是通过处理装置23或者其他的控制模块控制转盘转动来设置指令播放装置22相对于智能设备20的角度。

在本发明的一个例子中,角度控制装置24可以包括旋转中心在智能设备20处的转盘,指令播放装置22固定设置在该转盘上。这样,例如是通过处理装置23或者其他的控制模块控制转盘转动,便可控制指令播放装置22围绕智能设备20转动设置指令播放装置22相对于智能设备20的角度等等。

指令播放装置22用于播放语音指令。具体播放的内容可以是通过处理装置23来设定的,也可以是由测试人员直接操作指令播放装置22来设定。

为提高测试的标准性和一致性,噪声播放装置例如是监听级音箱。

处理装置23用于获取智能设备20识别语音指令、及识别指令播放装置22相对自身的设置角度的正确率,并根据该正确率判定智能设备20的声源定位性能。。

在本发明的一个例子中,处理装置23可以读取智能设备20所识别出的指令,再将识别出的指令与处理装置23内预存的测试文件中所设置的实际播放指令进行比较,进而判断智能设备20是否正确识别了该语音指令,在此,指令播放装置22可以在处理装置23的控制下根据该测试文件播放语音指令。另一方面,处理装置23读取智能设备20所识别出的设置角度,再将识别出的设置角度与当前的实际设置角度相比较,以判断智能设备20是否正确识别了指令播放装置22相对自身的设置角度。

在该例子中,处理装置23可以从角度设置装置24处获取当前的实际设置角度,即角度设置装置在调节完设置角度后,会将当前的实际设置角度发送至处理装置23供比较。

在该例子中,处理装置23也可以在预存的测试文件中记录指令播放装置相对于智能设备的设置角度序列,并根据该设置角度序列控制角度设置装置24依次调节每次测试的设置角度,这样,处理装置23便可以获知每次测试对应的实际设置角度。

在本发明的一个例子中,可以综合各个设置角度的测试结果,确定智能设备识别语音指令、及识别指令播放装置相对自身的设置角度的正确率。例如,一共进行了8个设置角度的测试,如果在其中4个设置角度实现了正确识别,则正确率为50%。

对于任一设置角度,例如是处理装置23可以控制指令播放装置22播放一组语音指令。这样,在本发明的一个例子中,可以设置在智能设备20正确识别出该一组语音指令及对应的设置角度的情况下,判定智能设备在对应的设置角度下实现了正确识别。在本发明的一个例子中,也可以设置在智能设备大比例正确识别出该一组语音指令及对应的设置角度的情况下,判定智能设备20在对应的设置角度下实现了正确识别,该大比例为超过50%的比例,例如,一组语音指令包括5个语音指令,智能设备正确识别出该一组语音指令中的三个语音指令及对应的设置角度,则判定智能设备在对应的设置角度下实现了正确识别。

处理装置23在判定智能设备的声源定位性能时,正确率越高,智能设备的声源定位性能越好。

处理装置23可以将声源定位性能分为几个等级,并设置正确率与声源定位性能的等级之间的对应关系,这样,便可根据该对应关系及获取到的正确率,确定智能设备的声源定位性能。

上述测试系统可被设置在安静环境中;或者上述测试系统还可以包括用于播放噪声的噪声播放装置;或者上述被测智能设备20被设置为播放音频。从而实现在不同的模式下,测试被测智能设备的声源定位性能。

四个噪声播放装置21a、21b、21c、21d均用于播放设定声压级的噪声。噪声播放装置的数量不限于4个,例如是3个或5个等。为了提高测试环境中噪声的均匀性和测试的一致性,这些噪声播放装置可以围绕被测智能设备20均匀分布,且每个噪声播放装置播放的噪声具有相同的声压级。本领域技术人员还可以对噪声播放装置的位置分布及各自噪声的声压级做出不同的设定,但均需保障测试的一致性。

噪声播放装置21a-21d所播放的噪声种类及声压级等可以是通过处理装置23来设定的,也可以由测试人员直接操作噪声播放装置来设定。

可选地,处理装置23还用于调整噪声播放装置21a-21d所播放的噪声的声压级和/或调整指令播放装置22所播放的语音指令的声压级,以在不同信噪比环境下测试被测智能设备20的声源定位性能。

对于本领域技术人员来说,可以通过硬件方式、软件方式或软硬件结合的方式实现前述用于智能设备的声源定位性能的测试方法。基于同一发明构思,参考图3介绍本发明实施例的用于智能设备的声源定位性能的测试系统,以执行前述用于智能设备的声源定位性能的测试方法。

<硬件结构>

图3是显示可用于实现本发明的实施例的用于智能设备的声源定位性能的测试系统的硬件配置的例子的框图,用于智能设备的声源定位性能的测试系统3000包括处理器3010、存储器3020、接口装置3030、通信装置3040、显示装置3050、角度控制装置3060、噪声播放装置3070、指令播放装置3080,等等。

存储器3020用于存储指令,该指令用于控制处理器3010进行操作以执行根据前述任一实施例的用于智能设备的声源定位性能的测试方法。

处理器3010例如可以是中央处理器CPU、微处理器MCU等。存储器3020例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。

接口装置3030例如包括USB接口等,可用于读取被测设备所识别出的角度。通信装置3040例如能够进行有线或无线通信。显示装置3050例如是液晶显示屏、触摸显示屏等。角度控制装置3060例如可旋转的工作台等。用户可以通过:噪声播放装置3070和指令播放装置3080输出噪声和指令。

图3所示的测试系统仅是解释性的,并且决不是为了要限制本发明、其应用或用途。本领域技术人员应当理解,尽管在图3中示出了多个装置,但是,本发明可以仅涉及其中的部分装置。本领域技术人员可以根据本发明所公开方案设计指令,指令如何控制处理器进行操作是本领域公知技术,故在此不再详细描述。

本发明实施例的方法、系统可以通过测试得到智能设备识别语音指令及该语音指令发出时指令播放装置相对自身的设备角度的正确率,进而能够根据该正确率评估智能音箱的声源定位性能。本发明实施例的方法、系统可以根据需要在研发时、出厂前、使用中等各个阶段实施,是一种全新的标准化的测试方法。

虽然已经通过例子对本发明的一些特定实施例进行了详细说明,但是本领域的技术人员应该理解,以上例子仅是为了进行说明,而不是为了限制本发明的范围。本领域的技术人员应该理解,可在不脱离本发明的范围和精神的情况下,对以上实施例进行修改。本发明的范围由所附权利要求来限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1