语音交互方法和系统的制作方法

文档序号:9525209阅读:310来源:国知局
语音交互方法和系统的制作方法
【技术领域】
[0001]本发明涉及语音处理技术领域,尤其涉及一种语音交互方法和系统。
【背景技术】
[0002]随着汽车工业的发展,车载逐渐成为人们生活中的一个重要场景。由于安全性的要求和移动互联的发展,人们已经逐渐习惯了通过语音输入对车载设备进行操控。
[0003]通过语音输入对车载设备进行操控时,如果同时有多人说话,语音交互系统就难以区分出目标指令,为此,通常会要求除了指令的发出者之外的其他人尽量不要说话,但是,这种方式由于增加了对用户的限制,会使得语音交互系统的适应范围受限,并且也会影响用户体验。

【发明内容】

[0004]本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本发明的一个目的在于提出一种语音交互方法,该方法可以在多人说话的场景下依然可以识别出目标声源,从而扩大语音交互系统的适用范围,提升用户体验。
[0006]本发明的另一个目的在于提出一种语音交互系统。
[0007]为达到上述目的,本发明第一方面实施例提出的语音交互方法,包括:确定目标用户,并获取目标用户的用户信息;在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源;对目标声源中的语音信息进行语音识别,得到语音识别结果,并将所述语音识别结果作为目标指令对交互设备进行操控。
[0008]本发明第一方面实施例提出的语音交互方法,通过根据目标用户的用户信息在混合声源中识别出目标声源,进而根据目标声源进行操作,可以在多人说话的场景下依然可以识别出目标声源,从而扩大语音系统的适用范围,提升用户体验。
[0009]为达到上述目的,本发明第二方面实施例提出的语音交互系统,包括:获取模块,用于确定目标用户,并获取目标用户的用户信息;识别模块,用于在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源;操控模块,用于对目标声源中的语音信息进行语音识别,得到语音识别结果,并将所述语音识别结果作为目标指令对交互设备进行操控。
[0010]本发明第二方面实施例提出的语音交互系统,通过根据目标用户的用户信息在混合声源中识别出目标声源,进而根据目标声源进行操作,可以在多人说话的场景下依然可以识别出目标声源,从而扩大语音系统的适用范围,提升用户体验。
[0011]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0013]图1是本发明一实施例提出的语音交互方法的流程示意图;
[0014]图2是本发明另一实施例提出的语音交互方法的流程示意图;
[0015]图3是本发明实施例中声纹注册的示意图;
[0016]图4是本发明实施例中声纹登录的示意图;
[0017]图5是本发明实施例中在混合声源中识别目标声源的示意图;
[0018]图6是本发明另一实施例提出的语音交互系统的结构示意图;
[0019]图7是本发明另一实施例提出的语音交互系统的结构示意图。
【具体实施方式】
[0020]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
[0021]图1是本发明一实施例提出的语音交互方法的流程示意图,该方法包括:
[0022]S11:确定目标用户,并获取目标用户的用户信息。
[0023]目标用户是指在需要语音交互时,发出目标指令的用户。例如,可以将当前登录语音交互系统的用户确定为目标用户,此时,如果需要更改目标用户,需要更换当前登录的用户。
[0024]用户信息例如包括:声纹信息,和/或,方位信息。
[0025]其中,在用户注册时,语音交互系统可以采集并保存用户的声纹信息。相应的,在用户登录时可以采集当前登录用户的声纹信息,如果当前的声纹信息属于已保存的声纹信息,则允许用户登录,并将当前登录的用户确定为目标用户,由于用户登录时采集了声纹信息,因此可以获取到目标用户的声纹信息。
[0026]另外,语音交互系统根据声源定位技术可以确定当前登录用户发出的语音信息的方位,从而获取目标用户的方位信息。
[0027]S12:在需要语音交互时,获取多人同时说话时的混合声源,以及,根据目标用户的用户信息,在所述混合声源中识别出目标声源。
[0028]例如,目标用户需要对车载设备进行操控时,可以发出目标指令,而同时还可能存在其他人在说话,从而语音交互系统获取的声源不仅包括目标用户发出的声源,还包括其他人发出的声源。
[0029]为了准确获取目标指令,需要先从混合声源中识别出目标声源。本实施例中,根据目标用户的用户信息进行识别。
[0030]其中,当根据目标用户的声纹信息进行识别时,例如,可以分别提取混合声源中的每个声源的声音信息,再与预先获取的目标用户的声纹信息进行比对,获取与目标用户的声纹信息匹配一致的声源,将该匹配一致的声源确定为目标声源。
[0031]当根据目标用户的方位信息进行识别时,例如,可以采用声源定位技术分别确定混合声源中的每个声源的方位信息,再与预先获取的目标用户的方位信息进行比对,获取与目标用户的方位信息匹配一致的声源,将该匹配一致的声源确定为目标声源。
[0032]当根据目标用户的方位信息和声纹信息进行识别时,例如,先根据方位信息排除到部分的声源,在剩下的声源中再逐一比对声纹信息,从而确定出目标声源。
[0033]其中,在将混合声源区分为单个声源时,可以采用听觉场景分析技术。听觉场景分析技术是借鉴视觉场景分析技术产生的,可以对多个同时的语音信号进行区分。
[0034]S13:对目标声源中的语音信息进行语音识别,得到语音识别结果,并将所述语音识别结果作为目标指令对交互设备进行操控。
[0035]在识别出目标声源后,可以对其采用语言识别技术,将目标声源中的声音数据转换为文字数据,将文字数据作为目标指令,之后可以根据目标指令进行操控,例如,目标指令是搜索某个目的地的路线,则可以给出到该目的地的路线图。
[0036]本实施例以车载控制为例,相应的,交互设备是车载设备。可以理解的是,本实施例也可以应用在其他场景,例如,应用在对智能家电的控制等场景。
[0037]本实施例中,通过根据目标用户的用户信息在混合声源中识别出目标声源,进而根据目标声源进行操作,可以在多人说话的场景下依然可以识别出目标声源,从而扩大语音系统的适用范围,提升用户体验。
[0038]图2是本发明另一实施例提出的语音交互方法的流程示意图,本实施例以对车载设备进行操控为例。该方法包括:
[0039]S21:用户进行声纹注册。
[0040]例如,参见图3,在用户注册时,获取用户输入的语音信息(S31),并根据语音信息获取并保存用户的声纹信息(S32)。
[0041]例如,用户在语音交互系统中注册时,语音交互系统可以向用户展示预设个数的提示文本,用户对提示文本进行朗读,从而获取用户输入的语音信息。预设个数例如为3个,提示文本例如为字符串。
[0042]语音交互系统获取到用户的语音信息后,可以采用已有的声纹识别技术对语音信息进行声纹识别,获取对应的声纹信息。
[0043]本实施例中的语音交互系统可以是本地语音交互系统(如设置在车载设备内),或者,也可以是在线语音交互系统。
[0044]可以理解的,S21可以在用户开车之前完成。
[0045]S22:在用户登录时,将当前登录的用户作为目标用户,采集目标用户在登录时产生的语音信息,以及,根据声源定位技术,确定目标用户的方位信息。
[0046]例如,参见图4,用户登录流程可以包括:
[0047]S41
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1