一种语音识别方法及电子设备与流程

文档序号:16046990发布日期:2018-11-24 10:57阅读:181来源:国知局

本发明涉及电子设备技术领域,具体涉及一种语音识别方法及电子设备。

背景技术

目前,市面上越来越多的电子设备配备有语音识别功能,且随着人工智能的发展,很多电子设备均具备声控唤醒功能,用户可以输入电子设备预置的声音信息从而唤醒电子设备,但是电子设备在设置声音模型库时通常是面向成年人的,成年人的声音比较稳定,辨识度比较高,能够快速地完成将成年人的声音信息与声音模型库的声音匹配。对于处于发育期的学生而言,声音会在发育期中发生变化,导致采用面向成年人的声音模型库来识别发育期学生的声音相对困难、识别效率较低。



技术实现要素:

本发明实施例公开一种语音识别方法及电子设备,能够根据基于语音发展规律模型生成的声音变化曲线,提高语音识别的准确率。

本发明实施例第一方面公开一种语音识别方法,所述方法包括:

从用户预先输入的目标语音中提取目标声音因子;

基于预设的语音发展规律模型以所述目标声音因子为依据,确定出所述用户的声音变化曲线;

根据所述声音变化曲线识别所述用户的当前语音。

作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述声音变化曲线识别所述用户的当前语音,包括:

检测所述用户输入的当前语音;

根据所述声音变化曲线,获取所述用户的声音在当前日期所处的声音变化阶段以及所述用户的声音在所述声音变化阶段内的当前声音因子;

以所述当前声音因子为依据,识别所述当前语音。

作为一种可选的实施方式,在本发明实施例第一方面中,所述基于预设的语音发展规律模型以所述目标声音因子为依据,确定出所述用户的声音变化曲线之前,所述方法还包括:

收集海量用户的语音信息,所述语音信息至少包含每个用户各个年龄段对应的声音因子;

依据大数据计算方法对性别相同的所有所述语音信息进行计算,以生成与性别对应的所述语音发展规律模型;

所述基于预设的语音发展规律模型以所述目标声音因子为依据,确定出所述用户的声音变化曲线,包括:

基于预设的与所述用户的性别对应的语音发展规律模型,以所述目标声音因子为依据,确定出所述与用户的声音变化曲线。

作为一种可选的实施方式,在本发明实施例第一方面中,所述从用户预先输入的目标语音中提取目标声音因子,包括:

识别用户预先输入的目标语音的声纹;

提取所述声纹中的若干个声纹节点;

基于所述若干个声纹节点,计算生成所述目标语音包含的声音因子。

作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述声音变化曲线识别所述用户的当前语音之后,所述方法还包括:

通过语义分析识别所述当前语音包含的目标指令,并检测电子设备是否处于黑屏状态;

如果所述电子设备处于黑屏状态,控制所述电子设备执行唤醒操作以及执行与所述目标指令对应的操作;

如果所述电子设备未处于黑屏状态,控制所述电子设备执行与所述目标指令对应的操作。

本发明实施例第二方面公开一种电子设备,其特征在于,包括:

提取单元,用于从用户预先输入的目标语音中提取目标声音因子;

确定单元,用于基于预设的语音发展规律模型以所述目标声音因子为依据,确定出所述用户的声音变化曲线;

识别单元,用于根据所述声音变化曲线识别所述用户的当前语音。

作为一种可选的实施方式,在本发明实施例第二方面中,所述识别单元包括:

检测子单元,用于检测所述用户输入的当前语音;

获取子单元,用于根据所述声音变化曲线,获取所述用户的声音在当前日期所处的声音变化阶段以及所述用户的声音在所述声音变化阶段内的当前声音因子;

第一识别子单元,用于以所述当前声音因子为依据,识别所述当前语音。

作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:

收集单元,用于在所述确定单元基于预设的语音发展规律模型以所述目标声音因子为依据,确定出所述用户的声音变化曲线之前,收集海量用户的语音信息,所述语音信息至少包含每个用户各个年龄段对应的声音因子;

生成单元,用于依据大数据计算方法对性别相同的所有所述语音信息进行计算,以生成与性别对应的所述语音发展规律模型;

所述确定单元,具体用于基于预设的与所述用户的性别对应的语音发展规律模型,以所述目标声音因子为依据,确定出所述与用户的声音变化曲线。

作为一种可选的实施方式,在本发明实施例第二方面中,所述提取单元包括:

第二识别子单元,用于识别用户预先输入的目标语音的声纹;

提取子单元,用于提取所述声纹中的若干个声纹节点;

计算子单元,用于基于所述若干个声纹节点,计算生成所述目标语音包含的声音因子。

作为一种可选的实施方式,在本发明实施例第二方面中,所述电子设备还包括:

检测单元,用于在所述识别单元根据所述声音变化曲线识别所述用户的当前语音之后,通过语义分析识别所述当前语音包含的目标指令,并检测电子设备是否处于黑屏状态;

第一控制单元,用于在所述检测单元检测的结果为是时,控制所述电子设备执行唤醒操作以及执行与所述目标指令对应的操作;

第二控制单元,用于在所述检测单元检测的结果为否时,控制所述电子设备执行与所述目标指令对应的操作。

本发明实施例第三方面公开另一种电子设备,包括:

存储有可执行程序代码的存储器;

与所述存储器耦合的处理器;

所述处理器调用所述存储器中存储的所述可执行程序代码,执行第一方面的任意一种方法的部分或全部步骤。

本发明实施例第四方面公开一种计算机可读存储介质,所述计算机可读存储介质存储了程序代码,其中,所述程序代码包括用于执行第一方面的任意一种方法的部分或全部步骤的指令。

本发明实施例第五方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

本发明实施例第六方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行第一方面的任意一种方法的部分或全部步骤。

与现有技术相比,本发明实施例具有以下有益效果:

本发明实施例中,电子设备从用户预先输入的语音中提取声音因子,并且根据预设的语音发展规律模型,生成以声音因子为依据的用户的声音变化曲线;电子设备可以根据声音变化曲线识别出用户的当前语音。可见,实施本发明实施例,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例公开的一种语音识别方法的流程示意图;

图2是本发明实施例公开的另一种语音识别方法的流程示意图;

图3是本发明实施例公开的另一种语音识别方法的流程示意图;

图4是本发明实施例公开的一种电子设备的结构示意图;

图5是本发明实施例公开的另一种电子设备的结构示意图;

图6是本发明实施例公开的另一种电子设备的结构示意图;

图7是本发明实施例公开的另一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

需要说明的是,本发明实施例及附图中的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

本发明实施例公开一种语音识别方法及电子设备,能够根据基于语音发展规律模型生成的声音变化曲线,提高语音识别的准确率。以下分别进行详细说明。

实施例一

请参阅图1,图1是本发明实施例公开的一种语音识别方法的流程示意图。如图1所示,该语音识别方法可以包括以下步骤:

101、电子设备从用户预先输入的目标语音中提取目标声音因子。

本发明实施例中,电子设备可以为家教机、学习机、学习平板等,对此,本发明实施例不做限定。用户可以是任意年龄段以及任意年龄的电子设备的使用者。目标语音可以是电子设备的用户在第一次使用电子设备时输入的语音,已使电子设备根据该目标语音生成声音变化曲线。声音因子可以是用户的声纹中有独特的特征的声纹节点,与用户匹配的声音因子的数量不做限定。

作为一种可选的实施方式,电子设备执行步骤101之前,还可以执行以下步骤:

电子设备检测当前用户是否存在注册账号;

如果不存在,电子设备显示输出用户信息收集页面,并且输出语音收集提示;以及当电子设备检测到用户输入的目标语音时,电子设备将该目标语音与用户信息关联并保存。

其中,实施这种实施方式,可以在用户最初使用电子设备时获取到用户的目标语音,已使用户可以直接使用语音识别功能,提升了用户基于电子设备的用户体验。

102、电子设备基于预设的语音发展规律模型以目标声音因子为依据,确定出用户的声音变化曲线。

本发明实施例中,语音发展规律模型可以是根据海量用户的语音信息分析得到的模拟用户的语音发展趋势,电子设备可以根据该语音发展规律模型,以目标声音因子为基础计算出用户的声音变化曲线。因为用户的声音在发育期是持续变化的,但是在用户发育期结束后声音可能不会继续发生变化,因此,声音变化曲线可以是用户发育期间的声音变化趋势,也可以是用户一生的声音变化曲线,对此,本发明实施例不做限定。

作为一种可选的实施方式,电子设备执行步骤102之后,还可以执行以下步骤:

电子设备每隔预设时间间隔获取一次用户的当前年龄;

电子设备根据当前年龄更新用户的声音变化曲线,并删除与声音变化曲线无关的信息;

电子设备将更新后的用户的声音变化曲线进行存储。

其中,实施这种实施方式,可以定时更新用户对应的声音变化曲线,以使电子设备对用户进行的语音识别更加准确。

103、电子设备根据声音变化曲线识别用户的当前语音。

本发明实施例中,电子设备通过识别电子设备所处环境中的与声音变化曲线匹配的语音,从而识别出电子设备的用户。声音变化曲线可以通过语音发展规律模型生成的若干声音因子计算生成的。

在图1所描述的方法中,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以将语音发展规律预存至电子设备的存储器中,避免了出现声音变化曲线丢失以至于无法进行语音识别的情况。此外,可以生成电子设备的用户专有的声音变化曲线,以使电子设备的功能更加人性化。

实施例二

请参阅图2,图2是本发明实施例公开的另一种语音识别方法的流程示意图。如图2所示,该语音识别方法可以包括以下步骤:

201、电子设备收集海量用户的语音信息,语音信息至少包含每个用户各个年龄段对应的声音因子。

本发明实施例中,海量用户的语音信息可以是电子设备收集所有电子设备的使用者的语音信息,也可以是从第三方语音分析软件中获取的,对此,本发明实施例不做限定。

本发明实施例中,用户的各个年龄段可以通过预设的时间间隔进行划分,也可以为用户自行划分,其中,预设时间间隔可以是一个月、一年、两年、五年等,对此,本发明实施例不做限定。

作为一种可选的实施方式,电子设备收集海量用户的语音信息的方式可以包括以下步骤:

电子设备获取每个电子设备的用户的每个年龄段对应的声音因子,其中,用户的年龄段根据预设的规则划分;

电子设备将所有声音因子与其对应的用户及用户的年龄段进行关联匹配,并将每个用户对应的所有的年龄段以及每个年龄段对应所有声音因子进行整合,以生成与用户对应的语音信息包;

电子设备向服务器发送该语音信息包。

其中,实施这种实施方式,可获取所有电子设备用户的详细的语音信息,并将每个用户的语音信息依据年龄段进行整合和存储,以使电子设备能够随时调用海量用户的语音信息,以及提高生成语音发展规律模型的准确性。

202、电子设备依据大数据计算方法对性别相同的所有语音信息进行计算,以生成与性别对应的语音发展规律模型。

本发明实施例中,由于男性和女性的声音在发育期产生的差异较大,因此,需要将男性的声音信息与女性的声音信息分开计算,从而保证生成的男性的语音发展规律模型以及女性的语音发展规律模型的准确性。

作为一种可选的实施方式,电子设备执行步骤202之后,还可以执行以下步骤:

电子设备分析语音发展规律模型,以根据该语音发展规律模型的变化将语音发展规律模型划分为若干个声音变化阶段;

电子设备获取每个声音变化阶段对应的用户的平均年龄范围;

电子设备将每个声音变化阶段与其对应的用户的平均年龄范围进行关联,并保存至与电子设备预先建立连接的服务设备。

其中,实施这种实施方式,可以综合分析海量用户的声音变化模式,以得到依据声音变化模式划分的声音变化阶段,从而使得声音变化阶段的划分更加合理。

本发明实施例中,实施上述的步骤201~步骤202,可以将海量的语音信息以性别为依据分为两组,再通过大数据计算得到与性别对应的两种语音发展规律模型,从而根据性别得到更加精准的语音发展规律模型。

可选的,步骤201~步骤202可以在步骤203之前执行,也可以在步骤203之后以及步骤204之前执行,对此,本发明实施例不做限定。

203、电子设备从用户预先输入的目标语音中提取目标声音因子。

204、电子设备基于预设的与用户的性别对应的语音发展规律模型,以目标声音因子为依据,确定出与用户的声音变化曲线。

本发明实施例中,可以依据与用户性别对应的语音发展规律模型确定出用户的声音变化曲线,由于男性和女性的声音变化差异较大,因此对男性和女性的语音发展规律模型进行区分可以使确定的用户的声音变化曲线更加准确。

205、电子设备检测用户输入的当前语音。

本发明实施例中,用户输入的当前语音可以是用户随机说的语音,也可以是用户用于触发电子设备启动和/或电子设备开启目标应用程序的带有指令的语音。

206、电子设备根据声音变化曲线,获取用户的声音在当前日期所处的声音变化阶段以及用户的声音在声音变化阶段内的当前声音因子。

207、电子设备以当前声音因子为依据,识别当前语音。

本发明实施例中,实施上述的步骤205~步骤207,可以获取用户的声音变化曲线的当前声音因子,通过对比当前声音因子与当前语音的声音因子,识别出与声音变化曲线匹配的用户,提高了语音识别的准确性。

作为一种可选的实施方式,电子设备以当前声音因子为依据,识别当前语音的方式可以包括以下步骤:

电子设备获取电子设备所处环境中的当前语音;

电子设备识别该当前语音包含的若干目标声音因子;

电子设备判断该若干目标声音因子中是否存在与电子设备预先获取的当前声音因子匹配的任意一个目标声音因子;

如果存在,电子设备确定当前语音对应的用户为电子设备预先存储的用户。

其中,实施这种实施方式,可以获取若干个声音因子,当若干个声音因子中的任意一个声音因子与电子设备的用户的当前声音因子匹配,就可以识别出电子设备的用户,从而减少了电子设备语音识别用户的误差,保证电子设备语音识别的准确性。

在图2所描述的方法中,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以通过大数据技术分析海量的用户语音信息,可以快速的得到语音发展规律模型,保证了电子设备的运算效率。此外,电子设备可以根据用户独有的声音变化模型在嘈杂的环境中唯一地识别出电子设备的用户,以使用户在各种环境中都可以成功使用电子设备的语音识别功能。

实施例三

请参阅图3,图3是本发明实施例公开的另一种语音识别方法的流程示意图。如图3所示,该语音识别方法可以包括以下步骤:

步骤301~步骤302与步骤201~步骤202相同,以下内容不做赘述。

303、电子设备识别用户预先输入的目标语音的声纹。

本发明实施例中,声纹(voiceprint)是一种携带语言信息的声波频谱,声纹不仅具有特定性,还具有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变,但在发育期,人的声音通常处于变化的状态。

304、电子设备提取声纹中的若干个声纹节点。

本发明实施例中,声纹节点可以是能够明显的表现用户声纹的特征的节点,且用户的声纹中包含的声纹节点数量不做限定。

305、电子设备基于若干个声纹节点,计算生成目标语音包含的声音因子。

本发明实施例中,电子设备可以综合分析若干个声纹节点,以使电子设备从若干个声纹节点中分析得到用户的特定的声音因子。

本发明实施例中,实施上述的步骤303~步骤305,可以从用户声音的声纹获取到具有用户个人特征的声纹节点,以生成具有用户个人特征的声音因子,从而降低了语音识别的难度。

306、电子设备基于预设的与用户的性别对应的语音发展规律模型,以目标声音因子为依据,确定出与用户的声音变化曲线。

307、电子设备根据声音变化曲线识别用户的当前语音。

308、电子设备通过语义分析识别当前语音包含的目标指令,并检测电子设备是否处于黑屏状态,如果是,执行步骤309;如果否,执行步骤310。

本发明实施例中,目标指令可以是包含特定词语的语音,且不同的指令可以对应不同的词语(如唤醒指令对应的词语可以是‘小天’,语音搜题指令对应的的词语可以是‘小步’,复习指令对应的词语可以是‘小才’等)。电子设备的黑屏状态可以是电子设备当前处于关机模式,也可以是电子设备当前处于待机模式,当电子设备当前处于关机模式时,若电子设备要执行唤醒操作,电子设备需要自动开机;当电子设备当前处于待机模式时,若电子设备要执行唤醒操作,电子设备需要将电子设备的模式更改为工作模式,并开启电子设备的显示屏。

309、电子设备控制电子设备执行唤醒操作以及执行与目标指令对应的操作。

310、电子设备控制电子设备执行与目标指令对应的操作。

本发明实施例中,实施上述的步骤308~步骤310,可以直接根据用户的当前语音开启电子设备,以及开启用户想要开启的应用程序,简化了用户使用电子设备的步骤,也提升了用户使用电子设备的效率。

举例来说,电子设备可以是家教机,当家教机识别出当前语音为家教机的用户的语音时,家教机可以识别当前语音的内容;当家教机识别出当前语音的内容为“小步小步”时,家教机可以判断该内容包含的目标指令,“小步小步”包含的目标指令可以是开启家教机的语音搜题功能,因此家教机需要开启语音搜题功能;家教机可以判断家教机的当前状态是否处于黑屏状态,如果处于黑屏状态,家教机需要点亮家教机的显示屏;家教机在点亮显示屏时,可以直接触发包含语音搜题功能的页面或应用程序开启;如果不处于黑屏状态,家教机可以立即触发包含语音搜题功能的页面或应用程序开启。除此之外,家教机还可以检测包含更多功能的指令,更多功能包括但不限于语音搜题功能、测试功能、音频和/或视频学习功能、笔记功能、拍照搜题功能及复习功能等。通过识别当前语音中的目标指令,可以快速的触发与目标指令对应的功能启动,提高了用户使用家教机的效率。

在图3所描述的方法中,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以通过提取用户声音的声纹节点,计算生成声音因子,以使电子设备计算得到的声音因子更加精确。

实施例四

请参阅图4,图4是本发明实施例公开的一种电子设备的结构示意图。如图4所示,该电子设备可以包括:

提取单元401,用于从用户预先输入的目标语音中提取目标声音因子。

作为一种可选的实施方式,提取单元401还可以用于:

检测当前用户是否存在注册账号;

如果不存在,显示输出用户信息收集页面,并且输出语音收集提示;以及当检测到用户输入的目标语音时,将该目标语音与用户信息关联并保存。

其中,实施这种实施方式,可以在用户最初使用电子设备时获取到用户的目标语音,已使用户可以直接使用语音识别功能,提升了用户基于电子设备的用户体验。

确定单元402,用于基于预设的语音发展规律模型以提取单元401提取的目标声音因子为依据,确定出用户的声音变化曲线。

作为一种可选的实施方式,确定单元402还可以用于:

每隔预设时间间隔获取一次用户的当前年龄;

根据当前年龄更新用户的声音变化曲线,并删除与声音变化曲线无关的信息;

将更新后的用户的声音变化曲线进行存储。

其中,实施这种实施方式,可以定时更新用户对应的声音变化曲线,以使电子设备对用户进行的语音识别更加准确。

识别单元403,用于根据确定单元402确定的声音变化曲线识别用户的当前语音。

可见,实施图4所描述的电子设备,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以将语音发展规律预存至电子设备的存储器中,避免了出现声音变化曲线丢失以至于无法进行语音识别的情况。此外,可以生成电子设备的用户专有的声音变化曲线,以使电子设备的功能更加人性化。

实施例五

请参阅图5,图5是本发明实施例公开的另一种电子设备的结构示意图。其中,图5所示的电子设备是由图4所示的电子设备进行优化得到的。与图4所示的电子设备相比,图5所示的电子设备的识别单元403可以包括:

检测子单元4031,用于检测用户输入的当前语音。

获取子单元4032,用于根据确定单元402确定的声音变化曲线,获取用户的声音在当前日期所处的声音变化阶段以及用户的声音在声音变化阶段内的当前声音因子。

第一识别子单元4033,用于以获取子单元4032获取的当前声音因子为依据,识别检测子单元4031检测的当前语音。

作为一种可选的实施方式,第一识别子单元4033以当前声音因子为依据,识别当前语音的方式可以为:

获取电子设备所处环境中的当前语音;

识别该当前语音包含的若干目标声音因子;

判断该若干目标声音因子中是否存在与电子设备预先获取的当前声音因子匹配的任意一个目标声音因子;

如果存在,确定当前语音对应的用户为电子设备预先存储的用户。

其中,实施这种实施方式,可以获取若干个声音因子,当若干个声音因子中的任意一个声音因子与电子设备的用户的当前声音因子匹配,就可以识别出电子设备的用户,从而减少了电子设备语音识别用户的误差,保证电子设备语音识别的准确性。

本发明实施例中,可以获取用户的声音变化曲线的当前声音因子,通过对比当前声音因子与当前语音的声音因子,识别出与声音变化曲线匹配的用户,提高了语音识别的准确性。

作为一种可选的实施方式,图5所示的电子设备还可以包括:

收集单元404,用于在确定单元402基于预设的语音发展规律模型以目标声音因子为依据,确定出用户的声音变化曲线之前,收集海量用户的语音信息,语音信息至少包含每个用户各个年龄段对应的声音因子;

生成单元405,用于依据大数据计算方法对收集单元404收集的性别相同的所有语音信息进行计算,以生成与性别对应的语音发展规律模型。

其中,实施这种实施方式,可以将海量的语音信息以性别为依据分为两组,再通过大数据计算得到与性别对应的两种语音发展规律模型,从而根据性别得到更加精准的语音发展规律模型。

作为一种可选的实施方式,收集单元404收集海量用户的语音信息的方式可以为:

获取每个电子设备的用户的每个年龄段对应的声音因子,其中,用户的年龄段根据预设的规则划分;

将所有声音因子与其对应的用户及用户的年龄段进行关联匹配,并将每个用户对应的所有的年龄段以及每个年龄段对应所有声音因子进行整合,以生成与用户对应的语音信息包;

向服务器发送该语音信息包。

其中,实施这种实施方式,可获取所有电子设备用户的详细的语音信息,并将每个用户的语音信息依据年龄段进行整合和存储,以使电子设备能够随时调用海量用户的语音信息,以及提高生成语音发展规律模型的准确性。

作为一种可选的实施方式,生成单元405还可以用于:

分析语音发展规律模型,以根据该语音发展规律模型的变化将语音发展规律模型划分为若干个声音变化阶段;

获取每个声音变化阶段对应的用户的平均年龄范围;

将每个声音变化阶段与其对应的用户的平均年龄范围进行关联,并保存至与电子设备预先建立连接的服务设备。

其中,实施这种实施方式,可以综合分析海量用户的声音变化模式,以得到依据声音变化模式划分的声音变化阶段,从而使得声音变化阶段的划分更加合理。

作为一种可选的实施方式,确定单元402执行基于预设的语音发展规律模型以提取单元401提取的目标声音因子为依据,确定出用户的声音变化曲线的方式具体可以为:

基于预设的与用户的性别对应的语音发展规律模型,以目标声音因子为依据,确定出与用户的声音变化曲线。

其中,实施这种实施方式,可以依据与用户性别对应的语音发展规律模型确定出用户的声音变化曲线,由于男性和女性的声音变化差异较大,因此对男性和女性的语音发展规律模型进行区分可以使确定的用户的声音变化曲线更加准确。

可见,实施图5所描述的电子设备,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以通过大数据技术分析海量的用户语音信息,可以快速的得到语音发展规律模型,保证了电子设备的运算效率。此外,电子设备可以根据用户独有的声音变化模型在嘈杂的环境中唯一地识别出电子设备的用户,以使用户在各种环境中都可以成功使用电子设备的语音识别功能。

实施例六

请参阅图6,图6是本发明实施例公开的另一种电子设备的结构示意图。其中,图6所示的电子设备是由图5所示的电子设备进行优化得到的。与图5所示的电子设备相比,图6所示的电子设备的提取单元401可以包括:

第二识别子单元4011,用于识别用户预先输入的目标语音的声纹。

提取子单元4012,用于提取第二识别子单元4011识别的声纹中的若干个声纹节点。

计算子单元4013,用于基于提取子单元4012提取的若干个声纹节点,计算生成目标语音包含的声音因子。

本发明实施例中,可以从用户声音的声纹获取到具有用户个人特征的声纹节点,以生成具有用户个人特征的声音因子,从而降低了语音识别的难度。

作为一种可选的实施方式,图6所示的电子设备还可以包括:

检测单元406,用于在识别单元403根据声音变化曲线识别用户的当前语音之后,通过语义分析识别当前语音包含的目标指令,并检测电子设备是否处于黑屏状态;

第一控制单元407,用于在检测单元406检测的结果为是时,控制电子设备执行唤醒操作以及执行与目标指令对应的操作;

第二控制单元408,用于在检测单元406检测的结果为否时,控制电子设备执行与目标指令对应的操作。

其中,实施这种实施方式,可以直接根据用户的当前语音开启电子设备,以及开启用户想要开启的应用程序,简化了用户使用电子设备的步骤,也提升了用户使用电子设备的效率。

可见,实施图6所描述的电子设备,能够根据预先获得的电子设备用户的语音,从而根据语音中的声音因子,结合语音发展规律模型生成用户的声音变化曲线,以使电子设备根据用户的声音变化曲线准确的识别该用户的当前声音,从而提高了电子设备语音识别的准确率。还可以通过提取用户声音的声纹节点,计算生成声音因子,以使电子设备计算得到的声音因子更加精确。

实施例七

请参阅图7,图7是本发明实施例公开的另一种电子设备的结构示意图。如图7所示,该电子设备可以包括:

存储有可执行程序代码的存储器701;

与存储器701耦合的处理器702;

其中,处理器702调用存储器701中存储的可执行程序代码,执行以上各方法实施例中的方法的部分或全部步骤。

本发明实施例还公开一种计算机可读存储介质,其中,计算机可读存储介质存储了程序代码,其中,程序代码包括用于执行以上各方法实施例中的方法的部分或全部步骤的指令。

本发明实施例还公开一种计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

本发明实施例还公开一种应用发布平台,其中,应用发布平台用于发布计算机程序产品,其中,当计算机程序产品在计算机上运行时,使得计算机执行如以上各方法实施例中的方法的部分或全部步骤。

应理解,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。本领域技术人员也应该知悉,上述各过程的序号的大小并不意味着执行顺序的必然先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

在本发明所提供的实施例中,应理解,“与a对应的b”表示b与a相关联,根据a可以确定b。但还应理解,根据a确定b并不意味着仅仅根据a确定b,还可以根据a和/或其他信息确定b。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(read-onlymemory,rom)、随机存储器(randomaccessmemory,ram)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammablereadonlymemory,eprom)、一次可编程只读存储器(one-timeprogrammableread-onlymemory,otprom)、电子抹除式可复写只读存储器(electrically-erasableprogrammableread-onlymemory,eeprom)、只读光盘(compactdiscread-onlymemory,cd-rom)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可位于一个地方,或者也可以分布到多个网络单元上。可根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本发明各实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

上述集成的单元若以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可获取的存储器中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或者部分,可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干请求用以使得一台计算机设备(可以为个人计算机、服务器或者网络设备等,具体可以是计算机设备中的处理器)执行本发明的各个实施例上述方法的部分或全部步骤。

以上对本发明实施例公开的一种语音识别方法及电子设备进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1