一种语音识别测试系统和方法与流程

文档序号：11202326阅读：1289来源：国知局

本发明属于语音识别领域，具体地涉及一种语音识别测试系统和方法。

背景技术：

语音交互是目前ai近年来发展速度较快的一种，它脱离常规的人与机器界面交互的方式，语音智能的产品在国内外不断的升温，占据了市场上不小的份额，而语音识别测试繁冗而复杂，涉及各方面的因素较多，特别是针对前期麦克风拾音方位、唤醒，回音消噪、背景消噪声纹识别等评估。然而现有的语音识别测试系统功能都较单一，要完成整个语音识别测试则需要用到许多测试系统，使得整个测试流程复杂繁琐，操作麻烦，测试效率低，且测试不够系统全面，测试准确率较低。

技术实现要素：

本发明目的在于为解决上述问题而提供一种系统集成度高，使整个测试流程操作简便，测试效率高，测试系统全面，提高测试准确率的语音识别测试系统和方法。

为此，本发明公开了一种语音识别测试系统，包括主控制模块、实时信号测试模块、录音质量测试模块、标准环境下语音测试模块和常规情景下语音测试模块，所述实时信号测试模块、录音质量测试模块、标准环境下语音测试模块和常规情景下语音测试模块分别与主控制模块连接，所述实时信号测试模块用于测试拾取信号的质量完整性及电性能参数，所述录音质量测试模块用于测试录音信号质量的电性能参，所述标准环境下语音测试模块用于测试标准环境下语音识别率，所述常规情景下语音测试模块用于测试常规使用环境下语音识别率。

进一步的，所述实时信号测试模块包括标准信号源播放模块、麦克风、信号采集处理模块、主控制模块和信号分析仪，所述标准信号源播放模块设置在消音室内，用于播放标准信号声源，所述麦克风采集标准信号源，并将采集到的信号传输给信号采集处理模块，信号采集处理模块对信号进行处理后传输给主控制模块，主控制模块对信号进行处理后传输给信号分析仪，信号分析仪对信号的电性能进行数据分析。

更进一步的，所述信号采集处理模块通过有线或无线与主控制模块通信连接。

进一步的，所述录音质量测试模块包括标准信号源/声源播放模块、麦克风、信号采集处理模块、主控制模块、功放模块和信号分析仪，所述标准信号源/声源播放模块设置在消音室内，用于播放智能合成的语音语料库音频文件，所述麦克风采集标准信号源/声源播放模块播放的标准信号源/声源，并将采集到的信号传输给信号采集处理模块，信号采集处理模块对信号进行处理后传输给主控制模块，主控制模块对信号进行录制后将录音信号传输给功放模块，功放模块对录音信号进行功放后传输给信号分析仪，信号分析仪对录音信号的电性能进行数据分析。

进一步的，所述标准环境下语音测试模块包括标准声源播放模块、麦克风、信号采集处理模块、主控制模块和离线语音合成模块，所述离线语音合成模块将被测试的语音语料库的内容转换成内置文件传输至主控制模块，所述标准声源播放模块设置在消音室内，用于播放语音语料库音频文件，所述麦克风采集标准声源播放模块播放的标准声源，并将采集到的信号传输给信号采集处理模块，信号采集处理模块对信号进行处理后传输给主控制模块，主控制模块对信号进行语音合成，并与离线语音合成模块的内置文件进行对比，显示测试数据的分析结果并计算语音识别准确率。

进一步的，所述常规情景下语音测试模块包括标准声源播放模块、麦克风、信号采集处理模块、主控制模块和离线语音合成模块，所述离线语音合成模块将被测试的语音语料库的内容转换成内置文件传输至主控制模块，所述标准声源播放模块设置在常规使用环境中，用于播放语音语料库音频文件，所述麦克风采集标准声源播放模块播放的标准声源，并将采集到的信号传输给信号采集处理模块，信号采集处理模块对信号进行处理后传输给主控制模块，主控制模块对信号进行语音合成，并与离线语音合成模块的内置文件进行对比，显示测试数据的分析结果并计算语音识别准确率。

进一步的，所述麦克风包括麦克风单体或麦克风阵列。

更进一步的，所述麦克风为驻极体麦克风、模拟mems麦克风或数字mems麦克风。

本发明还公开一种基于上述的语音识别测试系统的语音识别测试方法，包括如下步骤：

s1，采用实时信号测试模块测试拾取信号的质量完整性及电性能参数是否达到设计要求，如果是，则进入步骤s2；如果否，则改善实时信号后重复步骤s1；

s2，采用录音质量测试模块测试录音信号质量，确保其与实时测试信号电性能参数保持一致，进入步骤s3；

s3，采用标准环境下语音测试模块测试标准环境下语音识别率，进入步骤s4；

s4，采用常规情景下语音测试模块测试常规使用环境下语音识别率。

进一步的，所述步骤s3中还包括整体在标准测试环境中对测试标准声源的录音质量的维度进行主观音质评价量化；所述步骤s4中还包括整体在情景交互测试环境中对测试标准声源的录音质量的维度进行主观音质评价量化。

本发明的有益技术效果：

1、方便评估前期单体麦克风或阵列麦克风模型声学模型。

2、系统集成度高，提高测试效率：系统集成度高，包含实时信号测试、标准环境下语音测试、常规情景下语音测试和录音质量测试（兼容信号和语音质量），方便各阶段的测试数据分析，提高了测试效率。

3、提高测试准确率：从拾取信号质量分析到主客观判定语音测试结果，整体综合性强，减少误差，提高了测试准确率。

附图说明

图1为本发明具体实施例的系统结构示意图；

图2为本发明具体实施例的实时信号测试模块的结构示意图；

图3为本发明的实时信号测试模块的另一种结构示意图；

图4为本发明具体实施例的录音质量测试模块的结构示意图；

图5为本发明具体实施例的标准环境下语音测试模块的结构示意图；

图6为本发明具体实施例的常规情景下语音测试模块的结构示意图；

图7为本发明具体实施例的方法流程图；

图8为本发明具体实施例的测试流程图。

具体实施方式

现结合附图和具体实施方式对本发明进一步说明。

如图1-6所示，一种语音识别测试系统，包括主控制模块1、实时信号测试模块2、录音质量测试模块3、标准环境下语音测试模块4和常规情景下语音测试模块5，所述实时信号测试模块2、录音质量测试模块3、标准环境下语音测试模块4和常规情景下语音测试模块5分别与主控制模块1连接，主控制模块1控制实时信号测试模块2、录音质量测试模块3、标准环境下语音测试模块4和常规情景下语音测试模块5按照一定逻辑顺序进行测试。

本具体实施例中，主控制模块1为mcu处理器，其操作系统可以是android或ios操作系统，当然，在其它实施例中，主控制模块1也可以是单片机、plc控制器等。

所述实时信号测试模块2用于测试拾取信号的质量完整性及电性能参数，得出信号的幅度、失真、信噪比、频响范围等参数，本具体实施例中，如图2所示，实时信号测试模块2为有线实时信号测试模块，包括标准信号源播放模块21、麦克风3、信号采集处理模块7、主控制模块1和信号分析仪8，所述标准信号源播放模块21设置在消音室内，以排除环境的噪声，混响，回音，简正振动等对标准信号的干扰，标准信号源播放模块21用于播放由主控制模块1提供的标准信号源，所述麦克风6采集标准信号源，并将采集到的信号传输给信号采集处理模块7，信号采集处理模块7对信号进行处理后传输给主控制模块1，主控制模块1对信号进行处理后即转换成audio信号后传输给信号分析仪8，信号分析仪8对信号的电性能进行数据分析，得出信号的幅度，失真，信噪比，频响范围等参数。

当然，在其它实施例中，实时信号测试模块2可以为无线实时信号测试模块，如图3所示，包括标准信号源播放模块21、麦克风3、信号采集处理模块7、rf信号发射模块22、rf信号接收模块23、主控制模块1和信号分析仪8，所述标准信号源播放模块21设置在消音室内，以排除环境的噪声，混响，回音，简正振动等对标准信号的干扰，标准信号源播放模块21用于播放由主控制模块1提供的标准信号源，所述麦克风6采集标准信号源，并将采集到的信号传输给信号采集处理模块7，信号采集处理模块7对信号进行处理后传输给rf信号发射模块22，rf信号发射模块22将信号无线发射给rf信号接收模块23，rf信号接收模块23接收后将信号传输给主控制模块1，主控制模块1对信号进行处理后即转换成audio信号后传输给信号分析仪8，信号分析仪8对信号的电性能进行数据分析，得出信号的幅度，失真，信噪比，频响范围等参数。

所述录音质量测试模块3用于测试录音信号质量的电性能参，本具体实施例中，如图4所示，所述录音质量测试模块3包括标准信号源/声源播放模块31、麦克风6、信号采集处理模块7、主控制模块1、功放模块32和信号分析仪8，所述标准信号源/声源播放模块31设置在消音室内，用于播放主控制模块1中存储的智能合成的语音语料库音频文件，所述麦克风6采集标准信号源/声源播放模块31播放的标准信号源/声源，并将采集到的信号传输给信号采集处理模块7，信号采集处理模块7对信号进行处理后传输给主控制模块1，主控制模块1对信号进行录制后将录音信号传输给功放模块32，功放模块32对录音信号进行功放后传输给信号分析仪8，信号分析仪8对录音信号的电性能进行数据分析。

所述标准环境下语音测试模块4用于测试标准环境下语音识别率，本具体实施例中，如图5所示，标准环境下语音测试模块4包括标准声源播放模块41、麦克风6、信号采集处理模块7、主控制模块1和离线语音合成模块9，所述离线语音合成模块9将被测试的语音语料库的内容转换成内置文件传输至主控制模块1，所述标准声源播放模块41设置在消音室内，用于播放主控制模块1存储的被测试的语音语料库音频文件，所述麦克风6采集标准声源播放模块41播放的标准声源，并将采集到的信号传输给信号采集处理模块7，信号采集处理模块7对信号进行处理后传输给主控制模块1，主控制模块1对信号进行语音合成后与离线语音合成模块9的内置文件进行对比，显示测试数据的分析结果并计算语音识别准确率。

本具体实施例中，标准环境下语音测试模块4还包括录音文件播放模块10，主控制模块1还对信号进行录音，并将录音信号传输给录音文件播放模块10进行播放，以进行主观音质评价量化。

所述常规情景下语音测试模块5用于测试常规使用环境下语音识别率，本具体实施例中，如图6所示，常规情景下语音测试模块5包括标准声源播放模块51、麦克风6、信号采集处理模块7、主控制模块1和离线语音合成模块9，所述离线语音合成模块9将被测试的语音语料库的内容转换成内置文件传输至主控制模块1，所述标准声源播放模块51设置在常规使用环境中，用于播放主控制模块1存储的被测试的语音语料库音频文件，所述麦克风6采集标准声源播放模块51播放的标准声源，并将采集到的信号传输给信号采集处理模块7，信号采集处理模块7对信号进行处理后传输给主控制模块1，主控制模块1对信号进行语音合成，并与离线语音合成模块9的内置文件进行对比，显示测试数据的分析结果并计算语音识别准确率。

本具体实施例中，常规情景下语音测试模块5还包括录音文件播放模块10，主控制模块1还对信号进行录音，并将录音信号传输给录音文件播放模块10进行播放，以进行主观音质评价量化。

本具体实施例中，所述麦克风6可以是麦克风单体或麦克风阵列，麦克风的类型可以是驻极体麦克风、模拟mems麦克风或数字mems麦克风。

本具体实施例中，标准声源可以可以是人工合成声源，也可是人声录音标准普通话版声源。

本具体实施例中，信号分析仪8可以是audioprecision音频测试分析仪或b&k音频测试仪等相关设备。

本具体实施例中，信号采集处理模块7采用现有的信号采集处理芯片，功放模块32采用现有的功率放大芯片，此是本领域技术人员可以轻易实现的，不再详细说明。

本具体实施例中，常规使用环境可以是真实的常规使用环境，也可以是在室内模拟常规使用环境。

本具体实施例中，标准信号源播放模块21、标准信号源/声源播放模块31、标准声源播放模块41和标准声源播放模块51采用同一个高保真音响来实现，高保真音响校准并根据所需音量进行播放。当然，在其它实施例中，也可以采用人工嘴来实现。录音文件播放模块10为高保真音响。

本具体实施例中，测试中可自由对被测麦克风6的位置进行变动。

如图7所示，本发明还公开一种基于上述的语音识别测试系统的语音识别测试方法，包括如下步骤：

s1，采用实时信号测试模块测试拾取信号的质量完整性及电性能参数，包括幅度，失真，信噪比，频响范围等参数是否达到设计要求，如果是，则进入步骤s2；如果否，则改善实时信号后重复步骤s1。

本步骤主要是确定测试系统的拾取信号线路是否完整，还原的波形是否异常，信号的完整的电性能测试否达到设计标准等环节定义拾音信号的质量，为后续标准化测试做优先平台，从而提高测试准确度。

s2，采用录音质量测试模块测试录音信号质量，确保其与实时测试信号电性能参数保持一致，进入步骤s3。

录音质量测试综合反馈测试系统的录制信号完整性，信号处理，信号质量并对比实时信号参考要求，确认录音信号质量与实时测试信号电性能参数保持一致

通过录音信号质量与实时信号质量进行对比，确认录音信号的电性能达到与实时信号电性能同样的设计要求，另外通过对录音的标准声源进行主观音质评价维度，综合了主观和客观的数据分析。

s3，采用标准环境下语音测试模块测试标准环境下语音识别率，进入步骤s4。

具体的，本步骤的测试环境仍定义在消音室内，主要目的是确认标准环境下语音识别率，其结果可参照常规情境下测试的语音识别率作对比，为后续优化语音识别或提高准确提供参考依据，同时整体在标准测试环境中对测试标准声源的录音质量的维度进行主观音质评价量化。

s4，采用常规情景下语音测试模块测试常规使用环境下语音识别率。

具体的，模拟常规使用环境测试，考虑室内噪声，混响，回音，简正振动等因素，确认其语音识别率，及结果更加偏向用户使用模式，同时整体在情景交互测试环境中对测试标准声源的录音质量的维度进行主观音质评价量化。

具体测试流程图可以参见图8，此不再细说。

通过以上四个步骤测试对信号数据分析，并结合主观音质考评进一步提高语音识别测试准确率。

本发明同样适用于在线语音识别测试，即联网推送云端

尽管结合优选实施方案具体展示和介绍了本发明，但所属领域的技术人员应该明白，在不脱离所附权利要求书所限定的本发明的精神和范围内，在形式上和细节上可以对本发明做出各种变化，均为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：童平
技术所有人：厦门盈趣科技股份有限公司
我是此专利的发明人