识别语音数据的方法和装置的制造方法_3

文档序号：8223500阅读：来源：国知局

>[0065]在实施中，由于往往会遇到上述设备无法连接到语音识别服务器的情况，这样，语音识别服务器将无法及时将其识别出的识别结果发送给该设备，为了能够及时向用户反馈待识别语音数据的识别结果，即执行相应的控制指令，可以预先设置以发送时间为开始时间点的一定时长，如果该设备在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则该设备可以将第一控制指令确定为待识别语音数据的识别结果，如果在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，则该设备可以将第二控制指令确定为待识别语音数据的识别结果。其中，如果在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，该设备也可以通过某些识别结果选择方法，从第一控制指令和第二控制指令中，选择一个控制指令作为待识别语音数据的识别结果。
[0066]可选地，对于上述步骤103中将第一控制指令确定为待识别语音数据的识别结果的情况，该设备还可以通过置信度对第一控制指令是否可以作为待识别语音数据的识别结果作进一步的判断，具体可以包括以下内容:如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，且第一控制指令的置信度不小于预设的置信度阈值，则将第一控制指令确定为待识别语音数据的识别结果。
[0067]在实施中，可以在上述设备中预先设置该设备确定出的控制指令的置信度阈值，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则该设备可以获取第一控制指令的置信度，并将其与置信度阈值进行比较，如果第一控制指令的置信度的数值大于或等于预设的置信度阈值，则将第一控制指令确定为待识别语音数据的识别结果。
[0068]可选地，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，但第一控制指令的置信度小于预设的置信度阈值，则发出待识别语音数据识别失败的提示信号。
[0069]在实施中，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则该设备可以获取第一控制指令的置信度，并将其与置信度阈值进行比较，如果第一控制指令的置信度的数值小于预设的置信度阈值，则可以通过预先设置的语音，提示用户该设备识别待识别语音数据失败。
[0070]可选地，上述设备确定出待识别语音数据的识别结果后，可以向用户发出提示信号，其处理过程可以包括以下内容:发出确定出的待识别语音数据的识别结果的提示信号。
[0071]在实施中，当该设备确定出待识别语音数据的识别结果时，可以通过扬声器播放预先存储的语音，以提示用户识别结果，此时，用户还可以判断该识别结果是否正确，如果正确，用户可以向该设备输入用于确认的语音数据，该设备接收到该语音数据时，可以执行相应的控制指令，如果错误，用户可以向该设备输入相应的语音数据，该设备接收到该语音数据时，可以停止执行相应的控制指令，并发出提示信号，以提示用户重新输入待识别语音数据。
[0072]本发明实施例提供中，接收用户输入的待识别语音数据，将待识别语音数据发送给语音识别服务器，记录待识别语音数据的发送时间，根据待识别语音数据的采样时间，将待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取待识别语音数据对应的第一控制指令，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第一控制指令确定为待识别语音数据的识别结果；如果从发送时间开始，在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第二控制指令确定为待识别语音数据的识别结果，这样，可以将本地的语义识别方式和语音识别服务器的识别方式相结合，分别获取每种识别方式的识别结果，从中选取一个识别结果确定为待识别语音数据的识别结果，而不需要用户记忆大量指令词，从而，可以提高对语音数据进行识别的灵活性。
[0073]实施例三
[0074]基于相同的技术构思，本发明实施例还提供了一种识别语音数据的装置，如图3所示，该装置包括:
[0075]收发模块310，用于接收用户输入的待识别语音数据，将待识别语音数据发送给语音识别服务器，记录待识别语音数据的发送时间；
[0076]第一获取模块320，用于根据待识别语音数据的采样时间，将待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取待识别语音数据对应的第一控制指令；
[0077]确定模块330，用于如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第一控制指令确定为待识别语音数据的识别结果；如果从发送时间开始，在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第二控制指令确定为待识别语音数据的识别结果。
[0078]可选地，该装置还包括第二获取模块，用于:
[0079]根据第一语音特征信息与第一基准信息的匹配程度，获取第一控制指令的置信度；
[0080]确定模块330，用于:
[0081]如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，且第一控制指令的置信度不小于预设的置信度阈值，则将第一控制指令确定为待识别语音数据的识别结果。
[0082]可选地，该装置还包括第一提示模块，用于:
[0083]如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，但第一控制指令的置信度小于预设的置信度阈值，则发出待识别语音数据识别失败的提示信号。
[0084]可选地，收发模块310，用于:
[0085]当接收到语音输入请求时，接收用户输入的语音数据，当用户停止输入后的时长达到预设的接收时长阈值时，将用户停止输入之前输入的语音数据确定为待识别语音数据。
[0086]可选地，该装置还包括第二提示模块，用于:
[0087]发出确定出的待识别语音数据的识别结果的提示信号。
[0088]本发明实施例提供中，接收用户输入的待识别语音数据，将待识别语音数据发送给语音识别服务器，记录待识别语音数据的发送时间，根据待识别语音数据的采样时间，将待识别语音数据分割成多个预设时长的数据段，将得到的每个数据段的语音特征信息与预先存储的基准信息进行匹配检测，确定与待识别语音数据中的第一语音特征信息相匹配的第一基准信息，基于确定出的第一基准信息，获取待识别语音数据对应的第一控制指令，如果从发送时间开始，在预设时长内，未接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第一控制指令确定为待识别语音数据的识别结果；如果从发送时间开始，在预设时长内，接收到语音识别服务器发送的携带有第二控制指令的识别消息，则将第二控制指令确定为待识别语音数据的识别结果，这样，可以将本地的语义识别方式和语音识别服务器的识别方式相结合，分别获取每种识别方式的识别结果，从中选取一个识别结果确定为待识别语音数据的识别结果，而不需要用户记忆大量指令词，从而，可以提高对语音数据进行识别的灵活性。
[0089]需要说明的是:上述实施例提供的识别语音数据的装置在识别语音数据时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将设备的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的识别语音数据的装置与识别语音数据的方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
[0090]实施例四
[0091]图4是本发明实施例提供的一种语音识别设备结构示意图。参见图4，该语音识别设备可以用于实施上述实施例中提供的识别语音数据的方法。其中，该语音识别设备可以为手机、平板电脑pad、穿戴式移动设备(如智能手表)等。优选的:
[0092]语音识别设备700可以包括通信单元110、包括有一个或一个以上计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、WiFi (wireless fidelity，

完整全部详细技术资料下载

当前第3页1 2 3 4 5