识别语音数据的方法和装置的制造方法

文档序号：8223500阅读：410来源：国知局

识别语音数据的方法和装置的制造方法
【技术领域】
[0001]本发明涉及车载语音识别技术领域，特别涉及一种识别语音数据的方法和装置。
【背景技术】
[0002]随着汽车电子技术的快速发展，车载娱乐功能越来越丰富，对其进行操作的过程也越来越复杂，通过手动操作对各娱乐功能进行控制，会使得驾驶员在驾驶车辆时分神，使得行车安全受到威胁。通过语音识别技术可以在一定程度上解决行车安全问题。
[0003]通常使用的语音识别技术是基于本地指令式的语音识别技术，即预先在本地设置多个指令词，当驾驶员需要启动车辆的某项功能时，向语音设备输入相应指令词的语音数据，该语音设备接收到该指令词的语音数据时，将语音数据转换为文字信息后，将该文字信息与本地存储的指令词进行对比，如果本地存储的指令词中包括该文字信息，则确定该语音数据对应的指令词，作为识别结果，进而可以输出并响应该识别结果。
[0004]在实现本发明的过程中，发明人发现现有技术至少存在以下问题:
[0005]由于基于本地指令式的语音识别技术，只能够对预设的指令词的语音数据进行识另IJ，这样就需要驾驶员记忆大量指令词，如果驾驶员输入了非指令词的语音数据，则通过上述方法无法得到识别结果，这样使得对语音数据进行识别的灵活性较差。

【发明内容】

[0006]为了解决现有技术的问题，本发明实施例提供了一种识别语音数据的方法和装置。所述技术方案如下:
[0007]第一方面，提供了一种识别语音数据的方法，所述方法包括:
[0008]接收用户输入的待识别语音数据，将所述待识别语音数据发送给语音识别服务器，记录所述待识别语音数据的发送时间；
[0009]根据所述待识别语音数据的采样时间，将所述待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与所述待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取所述待识别语音数据对应的第一控制指令；
[0010]如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，则将所述第一控制指令确定为所述待识别语音数据的识别结果；如果从所述发送时间开始，在预设时长内，接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，则将所述第二控制指令确定为所述待识别语音数据的识别结果O
[0011 ] 可选地，所述方法还包括:
[0012]根据所述第一语音特征信息与所述第一基准信息的匹配程度，获取所述第一控制指令的置信度；
[0013]所述如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，则将所述第一控制指令确定为所述待识别语音数据的识别结果，包括:
[0014]如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，且所述第一控制指令的置信度不小于预设的置信度阈值，则将所述第一控制指令确定为所述待识别语音数据的识别结果。
[0015]可选地，所述方法还包括:
[0016]如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，但所述第一控制指令的置信度小于预设的置信度阈值，则发出所述待识别语音数据识别失败的提示信号。
[0017]可选地，所述接收用户输入的待识别语音数据，包括:
[0018]当接收到语音输入请求时，接收用户输入的语音数据，当用户停止输入后的时长达到预设的接收时长阈值时，将用户停止输入之前输入的语音数据确定为待识别语音数据。
[0019]可选地，所述方法还包括:
[0020]发出确定出的所述待识别语音数据的识别结果的提示信号。
[0021]第二方面，提供了一种识别语音数据的装置，所述装置包括:
[0022]收发模块，用于接收用户输入的待识别语音数据，将所述待识别语音数据发送给语音识别服务器，记录所述待识别语音数据的发送时间；
[0023]第一获取模块，用于根据所述待识别语音数据的采样时间，将所述待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与所述待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取所述待识别语音数据对应的第一控制指令；
[0024]确定模块，用于如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，则将所述第一控制指令确定为所述待识别语音数据的识别结果；如果从所述发送时间开始，在预设时长内，接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，则将所述第二控制指令确定为所述待识别语音数据的识别结果。
[0025]可选地，所述装置还包括第二获取模块，用于:
[0026]根据所述第一语音特征信息与所述第一基准信息的匹配程度，获取所述第一控制指令的置信度；
[0027]所述确定模块，用于:
[0028]如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，且所述第一控制指令的置信度不小于预设的置信度阈值，则将所述第一控制指令确定为所述待识别语音数据的识别结果。
[0029]可选地，所述装置还包括第一提示模块，用于:
[0030]如果从所述发送时间开始，在预设时长内，未接收到所述语音识别服务器发送的携带有第二控制指令的识别消息，但所述第一控制指令的置信度小于预设的置信度阈值，则发出所述待识别语音数据识别失败的提示信号。
[0031]可选地，所述收发模块，用于:
[0032]当接收到语音输入请求时，接收用户输入的语音数据，当用户停止输入后的时长达到预设的接收时长阈值时，将用户停止输入之前输入的语音数据确定为待识别语音数据。
[0033]可选地，所述装置还包括第二提示模块，用于:
[0034]发出确定出的所述待识别语音数据的识别结果的提示信号。
[0035]本发明实施例提供的技术方案带来的有益效果是:
[0036]本发明实施例提供中，接收用户输入的待识别语音数据，将待识别语音数据发送给语音识别服务器，记录待识别语音数据的发送时间，根据待识别语音数据的采样时间，将待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取待识别语音数据对应的第一控制指令，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第一控制指令确定为待识别语音数据的识别结果；如果从发送时间开始，在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第二控制指令确定为待识别语音数据的识别结果，这样，可以将本地的语义识别方式和语音识别服务器的识别方式相结合，分别获取每种识别方式的识别结果，从中选取一个识别结果确定为待识别语音数据的识别结果，而不需要用户记忆大量指令词，从而，可以提高对语音数据进行识别的灵活性。
【附图说明】
[0037]为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
[0038]图1是本发明实施例提供的一种识别语音数据的方法流程图；
[0039]图2是本发明实施例提供的一种系统的结构示意图；
[0040]图3是本发明实施例提供的一种识别语音数据的装置结构示意图；
[0041]图4是本发明实施例提供的一种语音识别设备的结构示意图。
【具体实施方式】
[0042]为使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明实施方式作进一步地详细描述。
[0043]实施例一
[0044]本发明实施例提供了一种识别语音数据的方法，如图1所示，该方法中的处理流程可以包括如下的步骤:
[0045]步骤101，接收用户输入的待识别语音数据，将待识别

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：丁小燕;
技术所有人：奇瑞汽车股份有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。