语音评测方法及系统与流程

文档序号：11521411阅读：431来源：国知局

本发明涉及语音处理技术领域，尤其涉及一种语音评测方法及系统。

背景技术：

语言是最重要的交际工具和信息载体，民族共同语的普及是国家统一、民族团结、社会进步的重要基础，我国是一个多民族、多语言的国家，母语环境较为宽松，人们最初所习得的语言多为本民族语或是方言，使得不同地区的人们交流出现阻碍，而普通话作为全国通用的语言，大力推广。积极普及普通话，有利于消除语言隔阂，促进社会交往，对社会主义经济、政治、文化建设和社会发展具有重要意义。推广普及普通话有利于增进各民族各地区的交流，有利于维护国家统一，增强中华民族凝聚力。普通话测试作为推广普通话过程中的重要一环，当前仍多采用人工评分的方式，一名被考核人需要3到5名考核人员进行长时间的考核，但每年的各行业都需要大量普通话测试合格人员，这种方法耗时费力、成本高昂、主观性强，显然不能满足当前的社会需求。而移动领域硬件技术的高速发展赋予了智能移动终端更广阔的应用前景，智能移动终端成为个人连接网络和企业提供服务的重要平台，人们可以尝试通过智能移动终端来进行普通话测试。例如，基于android设备的普通话评价与指导系统来进行普通话测试，耗时短，成本低，使用方便，客观公正。

技术实现要素：

本发明目的在于公开一种语音评测方法及系统，以提高评测的精确性。

为实现上述目的，本发明公开了一种语音评测方法，包括：

客户端采集用户的语音数据，并将采集的语音以均匀的时间间隔进行逐字的拆分，然后将拆分后的语音录播给用户，供客户端用户确认；

在客户端用户确认拆分正确后，将拆分后的语音数据打包发送给服务器供其进行识别及评测。

与上述评测方法相对应的，本发明还公开一种语音评测系统，包括客户端和服务器：

所述客户端，用于采集用户的语音数据，并将采集的语音以均匀的时间间隔进行逐字的拆分，然后将拆分后的语音录播给用户，供客户端用户确认；以及在客户端用户确认拆分正确后，将拆分后的语音数据打包发送给所述服务器供其进行识别及评测。

本发明具有以下有益效果：

由于不同评测用户的语速不一致，通过客户端对所采集语音进行逐字的拆分并录播给用户来确保拆分的正确性，并使得不同用户的拆分时间间隔控制在服务器的可识别范围之内，方便服务器根据该拆分信息做相应的语音识别及评测的同时，也提高了语音识别及评测的精确性。优选的，基于本发明所公开的语音评测方法及系统，上述拆分的时间间隔可由客户端自定义设置，且客户端发送给服务器的语音数据包中包含有拆分用的自定义时间间隔信息，以供服务器根据差异化的时间间隔信息对不同用户进行自适应的语音识别及评测。

下面将参照附图，对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是本发明实施例公开的语音测评方法的流程示意图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明，但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

实施例1

本发明实施例公开一种语音评测方法，如图1所示，包括：

步骤s1、客户端采集用户的语音数据，并将采集的语音以均匀的时间间隔进行逐字的拆分，然后将拆分后的语音录播给用户，供客户端用户确认。

在该步骤中，由于不同评测用户的语速不一致，通过客户端对所采集语音进行逐字的拆分并录播给用户来确保拆分的正确性，并使得不同用户的拆分时间间隔控制在服务器的可识别范围之内，方便服务器根据该拆分信息做相应的语音识别及评测的同时，也提高了语音识别及评测的精确性。

步骤s2、在客户端用户确认拆分正确后，将拆分后的语音数据打包发送给服务器供其进行识别及评测。当用户认为拆分不正确时，可删除当前录入的语音数据并返回步骤s1重新进行语音数据的采集。相对应的，服务器在具体的识别及评测时，可将所采集语音的特征值与预先存储的相应的标准语音特征值进行相关性比较；并将相关性比较的结果返回该客户端；其中，具体的相关性比较可基于皮尔森相关系数进行相关性比较。

在本实施例中，通常在采集语音数据的同时，首尾会或多或少夹杂环境噪音。为此，本实施例可提供如下两种不同的处理方式：

方式一、在客户端将采集的语音以均匀的时间间隔进行拆分前，由客户端对所采集的语音数据进行首尾的环境噪音去除处理。例如：预先采集一段环境音频，获得该环境音频的频率信息，然后与测试语音的频率信息相减，得到去除环境噪声的测试语音的音频信息。

方式二、在客户端将拆分后的语音录播给用户时，在客户端显示语音的录播进度，并在播放完之后提供剪辑界面供用户剪辑掉首尾的环境噪音。

此外，在本发明实施例中，上述拆分的时间间隔可由客户端与服务器进行约定，其可采用固定的无需用户设置的固定时长，也可采用下述优选的用户可自定义的方式：

拆分的时间间隔由客户端自定义设置，且客户端发送给服务器的语音数据包中包含有拆分用的自定义时间间隔信息，以供服务器根据差异化的时间间隔信息对不同用户进行自适应的语音识别及评测。

更进一步的，考虑现有语种的多样性，本实施例还可通过客户端设置有至少两种不同类型的语种测试模式以供用户选择，并在发送的语音数据包中携带相应的语种标记以供服务器识别，其中，服务器所连接的数据库中预先存储有相应测试题目中各语种标记与相对应标准音频数据的映射表。其中，本实施例中的语种，既可以是常规的普通话、英语、法语等通用语种等，也可以是地方方言等。

在本实施例中，除上述对语音的逐字拆分外，客户端与服务器的其他交互设计包括但不限于：

服务器获取客户端用户的语音测试请求，然后判断用户选择进行哪一种具体测试，比如普通话或地方方言等；然后根据用户发出的请求随机将对应的测试用的段落或句子显示在屏幕上，供用户测试并采集用户朗读该段落或句子的音频数据；

与之相对应的，服务器在语音的识别及评测过程中，可将所接收的音频数据转换为文字，然后将该音频所转换成的文字与所测试的段落或句子进行比较，并通过布尔变量来逐字标记正确与否；进一步的，还可以在返回客户端的评测界面中，提供任一字、词或句的标准语音训练界面的跳转链接，必要时，还可以进一步提供男音版和女音版两种标准语音信息。

综上，本实施例提供的语音评测方法，由于不同评测用户的语速不一致，通过客户端对所采集语音进行逐字的拆分并录播给用户来确保拆分的正确性，并使得不同用户的拆分时间间隔控制在服务器的可识别范围之内，方便服务器根据该拆分信息做相应的语音识别及评测的同时，也提高了语音识别及评测的精确性。优选的，基于本发明所公开的语音评测方法，上述拆分的时间间隔可由客户端自定义设置，且客户端发送给服务器的语音数据包中包含有拆分用的自定义时间间隔信息，以供服务器根据差异化的时间间隔信息对不同用户进行自适应的语音识别及评测。

实施例2

与上述方法实施例相对应的，本实施例公开一种语音评测系统，包括客户端和服务器，其中，客户端用于：采集用户的语音数据，并将采集的语音以均匀的时间间隔进行拆分，然后将拆分后的语音录播给用户，供客户端用户确认；以及在客户端用户确认拆分正确后，将拆分后的语音数据打包发送给服务器供其进行识别及评测。

可选的，上述客户端还用于：在将拆分后的语音录播给用户时，显示语音的录播进度，并在播放完之后提供剪辑界面供用户剪辑掉首尾的环境噪音；又或者：在将采集的语音以均匀的时间间隔进行拆分前，对所采集的语音数据进行首尾的环境噪音去除处理。

优选的，上述客户端还用于自定义设置拆分的时间间隔，且在发送给服务器的语音数据包中包含有拆分用的自定义时间间隔信息。更进一步的，本实施例客户端还用于：设置有至少两种不同类型的语种测试模式以供用户选择，并在发送的语音数据包中携带相应的语种标记以供服务器识别，其中，服务器所连接的数据库中预先存储有相应测试题目中各语种标记与相对应标准音频数据的映射表。

同理，本实施例提供的语音评测系统，由于不同评测用户的语速不一致，通过客户端对所采集语音进行逐字的拆分并录播给用户来确保拆分的正确性，并使得不同用户的拆分时间间隔控制在服务器的可识别范围之内，方便服务器根据该拆分信息做相应的语音识别及评测的同时，也提高了语音识别及评测的精确性。优选的，基于本发明所公开的语音评测系统，上述拆分的时间间隔可由客户端自定义设置，且客户端发送给服务器的语音数据包中包含有拆分用的自定义时间间隔信息，以供服务器根据差异化的时间间隔信息对不同用户进行自适应的语音识别及评测。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李淼磊;蒋直平;于健昕;崔玉杰;赵杨;党伟然
技术所有人：中南大学
我是此专利的发明人

上一篇：一种智能汽车语音登录方法及系统与流程
上一篇：一种语音识别中便于人工修改文字的方法与流程