语音激活方法、装置及电子设备与流程

文档序号:24688469发布日期:2021-04-16 09:37阅读:331来源:国知局
语音激活方法、装置及电子设备与流程

1.本发明涉及语音控制技术领域,具体涉及一种语音激活方法、装置及电子设备。


背景技术:

2.随着智能设备的逐步普及,基于语音方式对设备进行激活已逐步为人们所接受。通常,在用户使用诸如智能音箱等设备时,需要由用户发出用于唤醒智能音箱的语音以激活智能音箱。其中,当用户进行语音激活时,一般需要按照预设的唤醒词进行设备的激活,即需要用户发出唤醒词或其他预先设置好的激活语句,并当智能设备接收到该唤醒词后,对其进行识别,当确定该唤醒词与预设的唤醒词之间的相匹配时,则对设备进行激活。
3.目前,当用户对智能设备进行语音激活时,一般需要用户发出的唤醒词要达到一定的准确度,即当设备接收到的唤醒词与预设唤醒词达到一定的相似度时,才执行激活操作。因此,为了确保语音激活的准确性,在语音激活过程中对用户所发出的唤醒词具有一定的准确性的要求。同时,在设置唤醒词时,也需要设置的唤醒词超过一定的音节长度,以确保语音激活过程中用户输入的唤醒词与预设唤醒词之间比较结果的准确度。然而,在实际应用中,当用户发音不准确时,例如当用户处于鼻塞、咽喉沙哑等特殊状态。会使设备接收到的唤醒词的准确性受到干扰,从而影响智能设备的语音激活效果,因此,现有的语音激活过程中,激活方式较为僵化,影响用户使用的便捷性。


技术实现要素:

4.有鉴于此,本发明提供了一种语音激活方法、装置及电子设备,以解决水印处理过程中效率较低的问题。
5.为实现上述发明目的,根据本发明的第一个方面,提供一种语音激活方法,包括:
6.当接收到语音激活指令时,获取所述语音激活指令的指令发出位置;
7.根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型;
8.根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,其中,常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度。
9.可选的,在所述接收到语音激活指令之前,所述方法还包括:
10.接收到语音激活指令样本,所述语音激活指令样本中包含有每次语音激活指令发出时的指令信息及位置信息;
11.基于所述语音激活指令样本,选取预设分类算法,训练所述预设语音激活模型。
12.可选的,所述获取所述语音激活指令的指令发出位置包括:
13.对语音激活指令进行声源测向,获取所述声源的移动位置及方向;
14.根据语音激活指令的声源的移动位置及方向,确定所述语音激活指令发出时的位
置信息。
15.可选的,所述对语音激活指令进行声源测向,获取所述声源的移动位置及方向包括:
16.通过预设图像采集设备和/或预设语音采集设备,在用户发出语音激活指令时,采集所述用户的移动位置及方向。
17.可选的,所述根据语音激活指令的声源的移动位置及方向,确定所述语音激活指令发出时的位置信息包括:
18.根据声源的移动位置及方向,确定所述声源的移动范围;
19.根据所述移动范围及所述预设图像采集设备和/或所述预设语音采集设备的位置确定相对位置区域。
20.可选的,所述语音激活策略包括对应所述常用激活区域的第一激活策略,以及对应所述非常用激活区域的第二激活策略,其中,所述第一激活策略的激活参数阈值低于所述第二激活策略的激活参数阈值;所述激活参数包括:音调、音色及指令内容。
21.可选的,所述根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,包括:
22.当所述指令发出位置所属的位置状态区域为常用激活区域时,通过第一激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第一激活策略的激活参数阈值;
23.若是,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
24.可选的,所述根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,包括:
25.当所述指令发出位置所述的位置状态区域为非常用激活区域时,通过第二激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第二激活策略的激活参数阈值;
26.若是,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
27.可选的,在确定语音激活指令与预设录入指令的匹配程度未超过所述第一激策略的激活参数阈值之后,所述方法还包括:
28.向用于输出提示信息,以提醒用户重新输入语音激活指令的操作。
29.根据本发明第二个方面,提供了一种语音激活装置,包括:
30.获取单元,用于当接收到语音激活指令时,获取所述语音激活指令的指令发出位置;
31.确定单元,用于根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型;
32.执行单元,用于根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,其中,常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度。
33.可选的,所述装置还包括:
34.样本获取单元,用于接收到语音激活指令样本,所述语音激活指令样本中包含有每次语音激活指令发出时的指令信息及位置信息;
35.训练单元,用于基于所述语音激活指令样本,选取预设分类算法,训练所述预设语音激活模型。
36.可选的,所述获取单元包括:
37.获取模块,用于对语音激活指令进行声源测向,获取所述声源的移动位置及方向;
38.确定模块,用于根据语音激活指令的声源的移动位置及方向,确定所述语音激活指令发出时的位置信息。
39.可选的,所述获取模块,具体用于通过预设图像采集设备和/或预设语音采集设备,在用户发出语音激活指令时,采集所述用户的移动位置及方向。
40.可选的,所述确定模块,包括:
41.第一确定子模块,用于根据声源的移动位置及方向,确定所述声源的移动范围;
42.第二确定子模块,用于根据所述移动范围及所述预设图像采集设备和/或所述预设语音采集设备的位置确定相对位置区域。
43.可选的,所述语音激活策略包括对应所述常用激活区域的第一激活策略,以及对应所述非常用激活区域的第二激活策略,其中,所述第一激活策略的激活参数阈值低于所述第二激活策略的激活参数阈值;所述激活参数包括:音调、音色及指令内容。
44.可选的,所述执行单元,包括:
45.第一确定模块,用于当所述指令发出位置所属的位置状态区域为常用激活区域时,通过第一激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第一激活策略的激活参数阈值;
46.第一执行模块,用于确定若是,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
47.可选的,所述执行单元包括:
48.第二确定模块,用于当所述指令发出位置所述的位置状态区域为非常用激活区域时,通过第二激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第二激活策略的激活参数阈值;
49.第二执行模块,用于确定若是,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
50.可选的,所述执行单元还包括:
51.输出模块,用于向用于输出提示信息,以提醒用户重新输入语音激活指令的操作。
52.根据本发明第三个方面,提供了一种电子设备,包括存储器、处理器和通讯总线;
53.所述存储器与所述处理器通过所述通讯总线通讯连接;
54.所述存储器中存储有计算机可执行指令,所述处理器用于执行所述计算机可执行指令,用于实现本发明第一个方面提供的语音激活方法。
55.根据本发明第四个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令在被执行时,用于实现本发明第一个方面提供的语音激活方法。
56.本发明提供的一种语音激活方法、装置及电子设备,与现有技术的语音激活过程中,激活方式较为僵化,影响用户使用的便捷性相比,本发明首先当接收到语音激活指令时,获取所述语音激活指令的指令发出位置,然后,根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,最后,根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,从而实现语音激活操作。其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型,且常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度,这样,确保了当用户位于常用激活区域时,能够以较低的指令匹配强度进行语音激活操作,减少了当用户处于诸如鼻塞、咽喉沙哑等状态时的语音激活效果的影响,同时,当用户处于非常用激活区域时,由于其指令匹配强度较高,能够减少因误触发所导致的语音激活的情况,从而使语音激活的过程能够适应用户的位置进行灵活的激活,使得用户操作更为便捷,解决了目前语音激活时,激活方式较为僵化,影响用户使用便捷性的问题。
57.上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
58.通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。
59.图1是根据本申请一实施例提供的一种语音激活方法的实现流程图;
60.图2是根据本申请一实施例提供的另一种语音激活方法的实现流程图;
61.图3是根据本申请一实施例提供的一种语音激活装置的结构示意图;
62.图4是根据本申请一实施例提供的另一种语音激活装置的结构示意图;
63.图5是根据本申请一实施例提供的电子设备的结构示意图。
具体实施方式
64.为使本发明实施例的目的、技术方案和优点更加清楚,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
65.本发明实施例提供了一种语音激活方法,所述方法用于语音激活过程中,以解决现有的语音激活时,激活方式僵化、影响用户操作的便捷性的问题,如图1所示,所述方法包括:
66.101、当接收到语音激活指令时,获取所述语音激活指令的指令发出位置。
67.在本步骤中,当用户发出语音激活指令之后,则由本发明实施例所述的方法的执行主体进行该语音激活指令的接收,并同时获取当前语音激活指令的孩子领发出位置。其中,本发明实施例中的执行主体可以是智能音箱、智能语音助手等任意一种能够用于进行
语音激活指令接收的装置或系统。同时,基于本发明实施例所述的方法在于解决现有的语音激活时激活方式较为僵化,对于用户存在鼻塞、咽喉干哑等情况时,对语音激活操作存在便捷性较低的问题,在本步骤中,当接收到所述语音激活指令后,还需要对当前该语音激活指令的发出位置进行获取,从而为后续基于所述发出位置进行后续的语音激活奠定基础。具体的,在实施过程中,其获取所述指令发出位置的方式可以通过预设的采集装置进行,例如,在实际操作过程中,该采集装置可以为预设于智能音箱中的麦克风阵列,基于声源定位技术对当前指令发出位置进行采集和识别。当然,对于设置有图像识别器件的系统,还可以通过图像识别器件,例如摄像头,对当前指激活指令的发出者在触发指令时的位置图像进行获取,从而基于图像识别技术确定当前指令发出位置。在此,对于获取指令发出位置的方式包括但不限于上述所述的方法,可以根据用户实际需要选取对应的方式。
68.102、根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域。
69.其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型。
70.当前述步骤101获取到指令发出位置后,基于在用户实际使用过程中,不同的位置使用语音激活的次数和情况是不同的,例如,很多用户通常会在书房、客厅等日常生活区域进行智能设备的语音激活操作,而当处于卧室时往往激活的几率较低(用户在睡觉、休息时是肯定不会进行语音激活操作的)。当然,对于不同的用户家庭,其语音激活的情况都是不同的,但能够确定的是对于每个用户进行语音激活的方式都是存在与其对应的操作习惯的。基于此,用户语音操作的过程中,往往是存在常进行语音激活的区域,以及不常进行语音激活的区域,因此,该位置状态区域可以包括常用激活区域及非常用激活区域。这样,在本步骤中则可以通过预先训练得到的语音激活模型,利用前述步骤获取到的指令发出位置来确定其该激活指令在发出时的位置所属的位置状态区域是常用激活区域还是非常用激活区域。另外,在本发明实施例中,所述语音激活模型可以理解为通过已获取的语音激活时的样本数据,选用预设的分类算法经过训练后预先得到的,这样,通过该模型能够基于指令发出位置,进行分类,从而确定当前的指令发出位置是属于位置状态区域中的常用激活区域或非常用激活区域。
71.103、根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作。
72.当确定了指令发出位置所属的区域后,基于不同的位置状态区域中的语音激活策略中的指令匹配强度是不同的,即常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度。因此,当用户位于常用激活区域进行语音激活时,则可以按照较低的指令匹配对进行对应的语音激活操作,这样,能够确保当用户处于鼻塞等状态下,即便语音激活指令的准确度较低,仍能够进行语音激活操作,使得用户在语音激活操作更为便捷。同时,当用户位置非常用激活区域时,则可以基于较高的指令匹配度确保避免用户出现误操作引起的语音激活的情况。与由此,确保了能够按照不同的位置状态区域选取对应的激活策略中的指令匹配强度来进行语音激活,使得语音激活的操作过程更为便捷。
73.本实施例提供的一种语音激活方法,与现有技术的语音激活过程中,激活方式较为僵化,影响用户使用的便捷性相比,本发明首先当接收到语音激活指令时,获取所述语音
激活指令的指令发出位置,然后,根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,最后,根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,从而实现语音激活操作。其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型,且常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度,这样,确保了当用户位于常用激活区域时,能够以较低的指令匹配强度进行语音激活操作,减少了当用户处于诸如鼻塞、咽喉沙哑等状态时的语音激活效果的影响,同时,当用户处于非常用激活区域时,由于其指令匹配强度较高,能够减少因误触发所导致的语音激活的情况,从而使语音激活的过程能够适应用户的位置进行灵活的激活,使得用户操作更为便捷,解决了目前语音激活时,激活方式较为僵化,影响用户使用便捷性的问题。
74.进一步的,依据图1所示的方法,本发明的另一个实施例还提供了一种语音激活方法,用以对前述示例的进一步细化和阐述,具体的,如图2所示,所述方法主要包括:
75.201、接收到语音激活指令样本。
76.基于本发明实施例所述的方法在于解决现有的语音激活方式较为僵化,影响用户操作的便捷性问题。基于此,在本发明实施例中,可以基于在接收语音激活指令之前,先进行语音激活模型的训练。从而为后续的基于模型进行语音激活指令的位置进行识别奠定基础。
77.其中,训练的过程可以按照本步骤先进行训练样本的获取,即对语音激活指令的样本进行接收。其中,该语音激活指令样本中包含有每次语音激活指令发出时的指令信息及位置信息。
78.其中,所述语音激活指令样本中的每一条样本数据的获取过程,可以是基于用户每次进行语音激活时,通过声源定位等方式获取对应的位置信息的,当然,也可以基于图像技术,从用户语音发出时进行位置信息的获取,在此,对于获取所述语音激活指令的位置信息的方式可以选取任一种方式进行,可根据需要自行选取。
79.需要说明的是,所述语音激活指令样本可以是从预设的通用用户数据中获取的,该通用用户数据可以理解为预先获取的大而全的用户行为数据的,可以理解为通常用户进行语音激活时的数据。当然,在实际的应用过程中,也可以在用户进行语音激活后每次记录后在基于用户的语音激活过程的操作习惯不断更新的数据。
80.202、基于所述语音激活指令样本,选取预设分类算法,训练所述预设语音激活模型。
81.在实际的操作过程中,可以选取的分类算法可以根据样本数量以及训练效率等需要选取任一种可以选取的现有算法,例如所选取的算法可以包括朴素贝叶斯算法、决策树算法、或者遗传算法等任何一种算法。具体的,其训练过程中,可以通过所述语音激活指令样本中进行训练集的获取,并基于训练集及预设分类算法进行训练,当然,为了确保模型的准确率还可以采用选取多个训练集的方式分别训练,并基于训练后的结果,通过从语音激活指令样本设定的评估集对多个模型进行评估,从中选取较为准确的模型作为所述预设语音激活模型。
82.203、当接收到语音激活指令时,获取所述语音激活指令的指令发出位置。
83.具体的,在本步骤中,获取语音激活指令的指令发出位置的过程可以按照下述方式进行:对语音激活时的语音激活指令进行声源测向,获取所述声源的移动位置及方向;然后,根据语音激活指令的声源的移动位置及方向,确定所述语音激活指令发出时的位置信息。
84.由于用户在进行语音激活的过程中,往往并不是固定不动的,可能存在移动的情况,对此,在实际的操作的过程,其获取到的位置信息可能并不是一个位置点,还可能是多个位置点形成的集合,即用户发出指令的范围,同时,用户的位置及位置范围实际上不仅可以是物理上的具体位置,还可以理解为用户与当前系统或设备的相对位置,因此,在本步骤中确定语音激活指令发出的位置信息可以具体按照下述方式进行:首先,根据声源的移动位置及方向,确定所述声源的移动范围;然后,根据所述移动范围及所述预设图像采集设备和/或所述预设语音采集设备的位置确定相对位置区域。
85.这样,根据用户的移动方位进行相对位置区域的确定,可以确保用户在进行移动过程中,确定用户发出指令时的位置与当前接收语音激活指令的系统或设备之间的相对位置区域。从而确保了对移动时语音指令位置的确定,并且确定了与设备之间的相对位置,能够确保当用户与设备更换了所处区域时,语音激活过程中的稳定性。
86.另外,在实际应用中,不仅可以如上述所述,利用语音进行位置确定,在所述对语音激活指令进行声源测向,获取所述声源的移动位置及方向的过程中还可以通过图像技术进行获取,具体为:通过预设图像采集设备和/或预设语音采集设备,在用户发出语音激活指令时,采集所述用户的移动位置及方向。
87.204、根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域。
88.其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型。
89.基于前述步骤201至202的训练,所述预设语音激活模型是基于语音指令样本所训练的,基于用户的操作习惯,该模型能够对语音激活指令的位置所述的位置状态区域进行判断。因此,当前述步骤203获取到指令发出位置后,则可以根据该预设语音激活模型对该语音激活位置所述的位置状态区域是常用激活状态还是非常用激活区域的确定。
90.205、根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作。
91.具体的,所述语音激活策略包括对应所述常用激活区域的第一激活策略,以及对应所述非常用激活区域的第二激活策略,其中,所述第一激活策略的激活参数阈值低于所述第二激活策略的激活参数阈值,另外,所述激活参数可以包括:音调、音色及指令内容。例如,所述第一激活策略的激活参数阈值可以为用户输入的语音激活指令与预设语音激活指令之间的内容相似度为70%,而第二激活策略中该激活参数阈值相似度可以为90%。
92.具体的,在用户进行语音激活时,基于指令发出位置所属的不同区域,当所述指令发出位置所属的位置状态区域为常用激活区域时,通过第一激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第一激活策略的激活参数阈值,若是,则说明当前用户的指令符合预设的激活策略,则允许用户的激活操作,并根据所述语音激活指令对目标设备进行唤醒激活,反之,则说明用户的指令错误或并未进行激活操作,则可以忽略所述语音激活指令。基于当用户处于常用激活区域时,往往是用户需要使用语音激活功
能的,因此,在这个区域中的第一激活策略的激活参数阈值可以设置的较低,从而能够使得用户可以在发音不够标准,或者语音激活指令不用说完全就可以实现语音激活功能,从而确保了用户进行语音激活操作的便捷性。例如,可以将所述第一激活策略的激活参数为指令内容(激活指令的语音),同时该激活参数阈值设定为50%,当语音激活指令的语音内容为“小利你好”时,则当用户进行语音激活时,其发出的语音指令可以仅为“小利”或“小利好”等指令便可达到该激活参数阈值50%的要求,从而能够使用户不用说全部的语音激活指令进行激活。
93.此外,在确定语音激活指令与预设录入指令的匹配程度未超过所述第一激策略的激活参数阈值之后,还可能存在用户想要进行语音激活,但激活指令并不准确,这时还可以向用于输出提示信息,以提醒用户重新输入语音激活指令的操作,从而确保能够使用户进行语音激活更为便捷。
94.当所述指令发出位置所述的位置状态区域为非常用激活区域时,通过第二激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第二激活策略的激活参数阈值。由于第二激活策略的激活参数阈值较高,而用户又能发出准确的激活指令,说明用户时在不常进行语音激活的区域进行激活,因此需要按照用户根据所述语音激活指令对目标设备进行唤醒激活,反之,则说明当前用户并未进行语音激活,可以忽略所述语音激活指令。从而确保了当用户位于非常用激活区域时,以较高的激活参数阈值进行控制,避免了当用户处于休息、睡眠区域时的误唤醒情况。
95.本发明提供的另一种语音激活方法与现有技术的语音激活过程中,激活方式较为僵化,影响用户使用的便捷性相比,本发明首先当接收到语音激活指令时,获取所述语音激活指令的指令发出位置,然后,根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,最后,根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,从而实现语音激活操作。其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型,且常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度,这样,确保了当用户位于常用激活区域时,能够以较低的指令匹配强度进行语音激活操作,减少了当用户处于诸如鼻塞、咽喉沙哑等状态时的语音激活效果的影响,同时,当用户处于非常用激活区域时,由于其指令匹配强度较高,能够减少因误触发所导致的语音激活的情况,从而使语音激活的过程能够适应用户的位置进行灵活的激活,使得用户操作更为便捷,解决了目前语音激活时,激活方式较为僵化,影响用户使用便捷性的问题。
96.进一步的,依据上述方法实施例,本发明的另一个实施例还提供了一种语音激活装置,如图3所示,所述装置包括:
97.获取单元31,可以用于当接收到语音激活指令时,获取所述语音激活指令的指令发出位置;
98.确定单元32,可以用于根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型;
99.执行单元33,可以用于根据所述指令发出位置所属的位置状态区域,按照对应所
述位置状态区域的语音激活策略对智能设备进行语音激活操作,其中,常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度。
100.可选的,如图4所示,所述装置还包括:
101.样本获取单元34,可以用于接收到语音激活指令样本,所述语音激活指令样本中包含有每次语音激活指令发出时的指令信息及位置信息;
102.训练单元35,可以用于基于所述样本获取单元34获取的语音激活指令样本,选取预设分类算法,训练所述预设语音激活模型,以便所述确定单元32基于所述预设语音激活模型确定语音激活指令的指令发出位置所属的位置状态区域。
103.可选的,如图4所示,所述获取单元31包括:
104.获取模块311,可以用于对语音激活指令进行声源测向,获取所述声源的移动位置及方向;
105.确定模块312,可以用于根据获取模块311获取的语音激活指令的声源的移动位置及方向,确定所述语音激活指令发出时的位置信息。
106.可选的,如图4所示所述获取模块311,可以具体用于通过预设图像采集设备和/或预设语音采集设备,在用户发出语音激活指令时,采集所述用户的移动位置及方向。
107.可选的,如图4所示,所述确定模块312,包括:
108.第一确定子模块3121,可以用于根据声源的移动位置及方向,确定所述声源的移动范围;
109.第二确定子模块3122,可以用于根据所述第一确定子模块3121确定的移动范围及所述预设图像采集设备和/或所述预设语音采集设备的位置确定相对位置区域。
110.可选的,如图4所示,所述语音激活策略包括对应所述常用激活区域的第一激活策略,以及对应所述非常用激活区域的第二激活策略,其中,所述第一激活策略的激活参数阈值低于所述第二激活策略的激活参数阈值;所述激活参数包括:音调、音色及指令内容。
111.可选的,如图4所示,所述执行单元33,包括:
112.第一确定模块331,可以用于当所述指令发出位置所属的位置状态区域为常用激活区域时,通过第一激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第一激活策略的激活参数阈值;
113.第一执行模块332,可以用于若第一确定模块331确定确定所述语音激活指令与预设录入指令的匹配程度超过所述第一激活策略的激活参数阈值,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
114.可选的,如图4所示,所述执行单元33包括:
115.第二确定模块333,可以用于当所述指令发出位置所述的位置状态区域为非常用激活区域时,通过第二激活策略,确定所述语音激活指令与预设录入指令的匹配程度是否超过所述第二激活策略的激活参数阈值;
116.第二执行模块334,可以用于第二确定模块333确定若所述语音激活指令与预设录入指令的匹配程度超过所述第二激活策略的激活参数阈值,则根据所述语音激活指令对目标设备进行唤醒激活,反之,则忽略所述语音激活指令。
117.可选的,如图4所示,所述执行单元33还包括:
118.输出模块335,可以用于向用于输出提示信息,以提醒用户重新输入语音激活指令
的操作。
119.本发明实施例提供的一种语音激活的装置,与现有技术的语音激活过程中,激活方式较为僵化,影响用户使用的便捷性相比,本发明首先当接收到语音激活指令时,获取所述语音激活指令的指令发出位置,然后,根据预设语音激活模型,确定所述指令发出位置所属的位置状态区域,最后,根据所述指令发出位置所属的位置状态区域,按照对应所述位置状态区域的语音激活策略对智能设备进行语音激活操作,从而实现语音激活操作。其中,所述位置状态区域包括常用激活区域及非常用激活区域,所述预设语音激活模型是通过语音激活时的样本数据训练后得到的分类模型,且常用激活区域的激活策略中的指令匹配度强度低于非常用激活区域激活策略中的指令匹配度,这样,确保了当用户位于常用激活区域时,能够以较低的指令匹配强度进行语音激活操作,减少了当用户处于诸如鼻塞、咽喉沙哑等状态时的语音激活效果的影响,同时,当用户处于非常用激活区域时,由于其指令匹配强度较高,能够减少因误触发所导致的语音激活的情况,从而使语音激活的过程能够适应用户的位置进行灵活的激活,使得用户操作更为便捷,解决了目前语音激活时,激活方式较为僵化,影响用户使用便捷性的问题。
120.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如上所述的语音激活的方法。
121.进一步的,依据上述实施例,本发明的另一个实施例还提供了一种电子设备50,如图5所示,其中包括:存储器51、处理器52和通讯总线53;
122.处理器52可以包括中央处理单元(central processing unit,cpu)、数字信号处理器(digital signal processor,dsp)、微控制器(microcontrollerunit,mcu)、专用集成电路(application specific integrated circuit,asic)或现场可编程逻辑门阵列(field-programmable gate array,fpga)中的至少一个。
123.存储器51与处理器52通过通讯总线53通讯连接;
124.存储器51中存储有计算机可执行指令,处理器52用于执行计算机可执行指令,以实现本申请实施例任一可选实施方式提供的语音激活方法。
125.计算机可执行指令可以以软件功能单元的形式实现并能够作为独立的产品销售或使用,存储器51可以是任意形式的计算机可读取存储介质。基于这样的理解,本申请的技术方案的全部或部分可以以软件产品的形式体现出来,包括若干指令用以使得一台计算机设备,具体可以是处理器,来执行本申请各个实施例中终端的全部或部分步骤。而前述的计算机可读存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
126.需要说明的是,本申请提供的移动终端实施例与本申请提供的语音激活方法实施例具有相同或类似的效果,本实施例不再赘述。
127.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
128.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,设备和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
129.在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。
各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
130.在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
131.类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
132.本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
133.此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
134.本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的一种语音激活方法、装置及电子设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者设备程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
135.应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实
现。在列举了若干设备的单元权利要求中,这些设备中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1