一种语音唤醒方法、装置、存储介质及计算机设备与流程

文档序号：37920131发布日期：2024-05-10 23:59阅读：9来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本申请涉及信息处理，具体涉及一种语音唤醒方法、装置、计算机可读存储介质及计算机设备。

背景技术：

1、随着电子技术的迅猛发展，智能电视、电脑主机等电子设备已被广泛地用于教学、会议、游戏等各个领域，极大地方便了人们的工作和学习。已经成为人们日常生活、工作和学习当中不可或缺的产品。

2、现有技术中，手势识别已经是智能电视上不可或缺的一个功能，传统的搜索方式都是使用遥控器，或者语音，后来又出现了全局手势(类似鼠标移动效果)，用户可以使用全局手势操作电视上的功能，但经常会出现搜索的结果不符合预期，操作效率较差。

技术实现思路

1、本申请实施例提供一种语音唤醒方法、装置及计算机可读存储介质，可以提高操作效率。

2、为解决上述技术问题，本申请实施例提供以下技术方案：

3、一种语音唤醒方法，应用于配置有摄像头模组的计算机设备，包括：

4、通过所述摄像头模组采集当前用户图像，对所述当前用户图像进行图像分割，分割出所述当前用户图像中的用户手部图像；

5、采用手部特征提取模型对所述用户手部图像进行特征提取，提取出手部特征；

6、匹配所述手部特征与预设手部特征，得到匹配结果；

7、基于所述匹配结果，唤醒语音功能。

8、一种语音唤醒装置，应用于配置有摄像头模组的计算机设备，包括：

9、图像分割模块，用于通过所述摄像头模组采集当前用户图像，对所述当前用户图像进行图像分割，分割出所述当前用户图像中的用户手部图像；

10、特征提取模块，用于采用手部特征提取模型对所述用户手部图像进行特征提取，提取出手部特征；

11、匹配模块，用于匹配所述手部特征与预设手部特征，得到匹配结果；

12、唤醒模块，用于基于所述匹配结果，唤醒语音功能。

13、在一些实施例中，特征提取模块，包括：

14、特征提取子模块，用于采用手部特征提取模型对所述用户手部图像进行手部形状特征提取、手指位置特征提取以及手部方向特征提取，分别提取出用户手部形状特征、用户手指位置特征以及用户手部方向特征；

15、匹配模块，包括：

16、第一匹配子模块，用于匹配所述用户手部形状特征与预设手部形状特征，得到第一匹配子结果；

17、第二匹配子模块，用于匹配所述用户手指位置特征与预设手指位置特征，得到第二匹配子结果；

18、第三匹配子模块，用于匹配所述用户手部方向特征与预设手部方向特征，得到第三匹配子结果。

19、在一些实施例中，唤醒模块，包括：

20、唤醒子模块，用于若所述第一匹配子结果表征所述用户手部形状特征与预设手部形状特征匹配，且所述第二匹配子结果表征所述用户手指位置特征与预设手指位置特征匹配，且所述第三匹配子结果表征所述用户手部方向特征与预设手部方向特征匹配，则唤醒语音功能。

21、在一些实施例中，唤醒模块，还包括：

22、禁止子模块，用于若所述第一匹配子结果表征所述用户手部形状特征与预设手部形状特征不匹配、或所述第二匹配子结果表征所述用户手指位置特征与预设手指位置特征不匹配，或所述第三匹配子结果表征所述用户手部方向特征与预设手部方向特征不匹配，则禁止唤醒语音功能。

23、在一些实施例中，唤醒模块，还包括：

24、获取子模块，用于获取所述当前用户图像中用户嘴部与用户手部的图像距离值；

25、第一确定子模块，用于确定与所述用户的目标距离值；

26、筛选子模块，用于从多个距离值区间中筛选出所述目标距离值所处的目标距离值区间；

27、第二确定子模块，用于基于所述图像距离值，以及所述目标距离值区间，确定用户嘴部与用户手部的实际距离值；

28、比较子模块，用于比较所述实际距离值与预设距离值，确定是否唤醒语音功能。

29、在一些实施例中，第二确定子模块，用于：

30、基于距离值区间与缩放比例的对应关系，确定所述目标距离值区间对应的目标缩放比例；

31、计算所述图像距离值与所述目标缩放比例的乘积，得到用户嘴部与用户手部的实际距离值。

32、在一些实施例中，比较子模块，用于：

33、若所述实际距离值小于或等于预设距离值，则确定唤醒语音功能；

34、若所述实际距离值大于预设距离值，则确定不唤醒语音功能。

35、一种计算机可读存储介质，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行上述语音唤醒方法中的步骤。

36、一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述提供的语音唤醒方法中的步骤。

37、一种计算机程序产品或计算机程序，所述计算机程序产品或计算机程序包括计算机指令，所述计算机指令存储在存储介质中，计算机设备的处理器从存储介质读取所述计算机指令，处理器执行所述计算机指令，使得所述计算机设备执行上述提供的语音唤醒方法中的步骤。

38、本申请实施例通过所述摄像头模组采集当前用户图像，对所述当前用户图像进行图像分割，分割出所述当前用户图像中的用户手部图像；采用手部特征提取模型对所述用户手部图像进行特征提取，提取出手部特征；匹配所述手部特征与预设手部特征，得到匹配结果；基于所述匹配结果，唤醒语音功能。以此，通过事先对用户手部图像进行手部特征提取，从而确定是否唤醒语音功能，若唤醒，则再采用语音识别的方式来控制计算机设备，可以提高操作效率。

技术特征：

1.一种语音唤醒方法，其特征在于，应用于配置有摄像头模组的计算机设备，包括：

2.根据权利要求1所述的语音唤醒方法，其特征在于，所述采用手部特征提取模型对所述用户手部图像进行特征提取，提取出手部特征的步骤，包括：

3.根据权利要求2所述的语音唤醒方法，其特征在于，所述基于所述匹配结果，唤醒语音功能的步骤，包括：

4.根据权利要求3所述的语音唤醒方法，其特征在于，所述方法，还包括：

5.根据权利要求3所述的语音唤醒方法，其特征在于，在所述唤醒语音功能的步骤之前，还包括：

6.根据权利要求5所述的语音唤醒方法，其特征在于，所述基于所述图像距离值，以及所述目标距离值区间，确定用户嘴部与用户手部的实际距离值的步骤，包括：

7.根据权利要求5所述的语音唤醒方法，其特征在于，所述比较所述实际距离值与预设距离值，确定是否唤醒语音功能的步骤，包括：

8.一种语音唤醒装置，其特征在于，应用于配置有摄像头模组的计算机设备，包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至7任一项所述的语音唤醒方法中的步骤。

10.一种计算机设备，其特征在于，包括存储器、处理器以及存储在所述存储器中并可以在所述处理器上运行的计算机程序，所述处理器执行权利要求1至7任一项所述的语音唤醒方法中的步骤。

技术总结
本申请实施例公开了一种语音唤醒方法、装置、存储介质及计算机设备，方法包括：通过所述摄像头模组采集当前用户图像，对所述当前用户图像进行图像分割，分割出所述当前用户图像中的用户手部图像；采用手部特征提取模型对所述用户手部图像进行特征提取，提取出手部特征；匹配所述手部特征与预设手部特征，得到匹配结果；基于所述匹配结果，唤醒语音功能。以此，通过事先对用户手部图像进行手部特征提取，从而确定是否唤醒语音功能，若唤醒，则再采用语音识别的方式来控制计算机设备，可以提高操作效率。

技术研发人员：李笃发,邝图强
受保护的技术使用者：深圳市雷鸟网络传媒有限公司
技术研发日：
技术公布日：2024/5/9

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李笃发,邝图强
技术所有人：深圳市雷鸟网络传媒有限公司
我是此专利的发明人

上一篇：一种纺织布湿润装置的制作方法
上一篇：一种便于安装的电动开窗器的制作方法