本申请涉及音视频处理技术领域,具体涉及一种语音识别方法、智能投影仪及相关产品。
背景技术:
投影技术在人们日常生活中得到普遍的应用。无论在会议、教学或是娱乐场所都随处可见投影系统的使用。
生活中,家庭、教育用的中小型投影仪,目前来看,对投影仪的操控往往需要针对投影仪上面的按键进行操作,因此,如何提升投影仪的智能性的问题亟待解决。
技术实现要素:
本申请实施例提供了一种语音识别方法、智能投影仪及相关产品,能够通过接收语音,实现语音控制,提升智能投影仪的智能性。
第一方面,本申请实施例提供一种语音识别方法,应用于智能投影仪,所述方法包括:
接收控制设备发送的目标语音信息;
对所述目标语音信息进行解析,得到目标关键字;
确定所述目标关键字对应的目标控制指令;
响应所述目标控制指令,执行与所述目标控制指令相应的操作。
第二方面,本申请实施例提供一种语音识别装置,应用于智能投影仪,所述装置包括:
接收单元,用于接收控制设备发送的目标语音信息;
解析单元,用于对所述目标语音信息进行解析,得到目标关键字;
第一确定单元,用于确定所述目标关键字对应的目标控制指令;
执行单元,用于响应所述目标控制指令,执行与所述目标控制指令相应的操作。
第三方面,本申请实施例提供了一种智能投影仪,包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行本申请实施例第一方面中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,具备如下有益效果:
可以看出,本申请实施例中所描述的语音识别方法、智能投影仪及相关产品,应用于智能投影仪,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1a是本申请实施例提供的一种智能投影仪的结构示意图;
图1b是本申请实施例提供的一种语音识别方法的流程示意图;
图2是本申请实施例提供的另一种语音识别方法的流程示意图;
图3是本申请实施例提供的另一种智能投影仪的结构示意图;
图4a是本申请实施例提供的一种语音识别装置的功能单元组成框图;
图4b是本申请实施例提供的一种语音识别装置的功能单元组成框图。
具体实施方式
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
如图1a所示,图1a是本申请实施例提供的一种智能投影仪的结构示意图。该智能投影仪可以包括处理器、存储器、信号处理器、收发器、扬声器、麦克风、随机存取存储器(randomaccessmemory,ram)、摄像头、传感器和网络模块等等。其中,存储器、dsp、投影装置、扬声器、麦克风、ram、摄像头、传感器、网络模块与处理器连接,收发器与信号处理器连接。
其中,处理器是智能投影仪的控制中心,利用各种接口和线路连接整个智能投影仪的各个部分,通过运行或执行存储在存储器内的软体程序和/或模块,以及调用存储在存储器内的数据,执行智能投影仪的各种功能和处理数据,从而对智能投影仪进行整体监控,处理器可以为中央处理器(centralprocessingunit/processor,cpu)、图形处理器(graphicsprocessingunit,gpu)或者网络处理器(neural-networkprocessingunit,npu)。
进一步地,处理器可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器中。
其中,存储器用于存储软体程序和/或模块,处理器通过运行存储在存储器的软件程序和/或模块,从而执行智能投影仪的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的软体程序等;存储数据区可存储根据智能投影仪的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,传感器包括以下至少一种:光感传感器、陀螺仪、红外接近传感器、振动检测传感器,压力传感器等等。其中,光感传感器,也称为环境光传感器,用于检测环境光亮度。光线传感器可以包括光敏元件和模数转换器。其中,光敏元件用于将采集的光信号转换为电信号,模数转换器用于将上述电信号转换为数字信号。可选的,光线传感器还可以包括信号放大器,信号放大器可以将光敏元件转换的电信号进行放大后输出至模数转换器。上述光敏元件可以包括光电二极管、光电三极管、光敏电阻、硅光电池中的至少一种。
其中,该摄像头可以是可见光摄像头(一般视角摄像头、广角摄像头)、也可以是红外摄像头,还可以为双摄像头(具备测距功能),在此不作限定。
网络模块可以为以下至少一种:蓝牙模块、无线保真(wirelessfidelity,wi-fi)等等,在此不做限定,上述投影装置能够实现投影功能。
基于上述图1a所描述的智能投影仪,能够执行如下功能:
接收控制设备发送的目标语音信息;
对所述目标语音信息进行解析,得到目标关键字;
确定所述目标关键字对应的目标控制指令;
响应所述目标控制指令,执行与所述目标控制指令相应的操作。
可以看出,本申请实施例中所描述的智能投影仪,应用于智能投影仪,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
下面对本申请实施例进行详细介绍。
请参阅图1b,图1b是本申请实施例提供的一种语音识别方法的流程示意图,如图所示,应用于如图1a所示的智能投影仪,本语音识别方法包括:
101、接收控制设备发送的目标语音信息。
本申请实施例中,智能投影仪可以接收控制设备发送的目标语音信号,该控制设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备(智能手表、智能手环、无线耳机、遥控器、增强现实/虚拟现实设备、智能眼镜)、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(userequipment,ue),移动台(mobilestation,ms),终端设备(terminaldevice)等等。
具体实现中,智能投影仪与控制设备之间可以建立通信连接,进而,可以接收控制设备发送的目标语音信号。由于智能投影仪可能没安装麦克风,如果想要对该智能投影仪实现语音控制,则需要借助外连设备的麦克风实现对智能投影仪进行语音控制。
102、对所述目标语音信息进行解析,得到目标关键字。
其中,智能投影仪可以对目标语音信息进行语义解析,得到目标关键字,目标关键字可以为以下至少一种:字符串、文字、图案等等,在此不做限定。
在一个可能的示例中,上述步骤102,对所述目标语音信息进行解析,得到目标关键字,可以包括如下步骤:
a21、向与所述智能投影仪连接的云端服务器发送语音解析请求,所述语音解析请求携带所述目标语音信息,所述语音解析请求用于请求所述云端服务器对所述目标语音信息进行解析;
a22、接收由所述云端服务器发送的针对所述目标语音信息解析得到的所述目标关键字。
具体实现中,智能投影仪在接收到目标语音信息之后,可以请求与智能投影仪连接的云端服务器对该目标语音信息进行解析。具体地,智能投影仪可以向与该智能投影仪连接的云端服务器发送语音解析请求,该语音解析请求可以携带目标语音信息,该语音解析请求可以用于请求云端服务器对目标语音信息进行解析,云端服务器在接收到目标语音信息之后,可以对该目标语音信息进行解析,得到目标关键字。
在一个可能的示例中,上述步骤102,对所述目标语音信息进行解析,得到目标关键字,可以包括如下步骤:
b21、获取所述目标语音信息对应的目标发音频率;
b22、按照预设的发音频率与身份信息之间的映射关系,确定所述目标发音频率对应的目标身份信息;
b23、在所述目标身份信息满足预设要求时,将所述目标语音信息进行模数转换,得到目标数字信号;
b24、确定所述目标数字信号对应的目标平均能量值;
b25、确定所述目标数字信号的峰值和谷值,得到多个峰值和多个谷值;
b26、依据所述多个峰值和所述多个谷值进行均方差运算,得到目标均方差;
b27、按照预设的平均能量值与第一情绪评估值之间的映射关系,确定所述目标平均能量值对应的目标第一情绪评估值;
b28、按照预设的均方差与第二情绪评估值之间的映射关系,确定所述目标均方差对应的目标第二情绪评估值;
b29、获取所述第一情绪评估值对应的第一权重值、所述第二情绪评估值对应的第二权重值;
b210、依据所述第一权重值、所述第二权重值、所述目标第一情绪评估值和所述目标第二情绪评估值进行加权运算,得到目标情绪评估值;
b211、按照预设的情绪评估值与情绪类型之间的映射关系,确定所述目标情绪评估值对应的目标情绪类型;
b212、按照预设的情绪类型与语义解析算法之间的映射关系,确定所述目标情绪类型对应的目标语义解析算法;
b213、依据所述目标语义解析算法将所述目标语音信号进行语义解析,得到语音内容;
b214、对所述语音内容进行关键字提取,得到所述目标关键字。
其中,具体实现中,智能投影仪中可以预先存储预设的发音频率与身份信息之间的映射关系,身份信息可以为以下至少一种:姓名、性别、年龄、工作单位、家庭住址、联系方式、权限等级等等,在此不做限定。上述预设要求可以由用户自行设置或者系统默认,例如,目标身份信息对应的权限等级大于预设权限等级,或者,目标身份信息对应的姓名与预设白名单中的姓名一致等等。另外,智能投影仪中还可以预先存储预设的平均能量值与第一情绪评估值之间的映射关系以及预设的均方差与第二情绪评估值之间的映射关系。本申请实施例中,情绪类型可以为以下至少一种:非常高兴、高兴、一般、焦虑(急躁)、郁闷、悲哀、极度悲哀等等,在此不做限定。
具体实现中,不同的人,其发音频率不一样,因此,智能投影仪可以获取目标语音信息对应的目标发音频率,进而,可以按照预设的发音频率与身份信息之间的映射关系,确定目标发音频率对应的目标身份信息,在目标身份信息满足预设要求时,则可以将目标语音信息进行模数转换,得到目标数字信号。
进一步地,智能投影仪可以确定目标数字信号对应的目标平均能量值,进而,可以确定目标数字信号的峰值和谷值,得到多个峰值和多个谷值,依据多个峰值和多个谷值进行均方差运算,得到目标均方差,平均能量值和均方差在一定程度上,反映了用户的情绪变化,可以按照预设的平均能量值与第一情绪评估值之间的映射关系,确定目标平均能量值对应的目标第一情绪评估值,以及按照预设的均方差与第二情绪评估值之间的映射关系,确定目标均方差对应的目标第二情绪评估值,获取所述第一情绪评估值对应的第一权重值、所述第二情绪评估值对应的第二权重值,该第一权重值与第二权重值之和为1,第一权重值和第二权重值可以为经验值。
进一步地,依据第一权重值、第二权重值、目标第一情绪评估值和目标第二情绪评估值进行加权运算,得到目标情绪评估值,即:
目标情绪评估值=目标第一情绪评估值*第一权重值+目标第二情绪评估值*第二权重值;
另外,智能投影仪中还可以预先存储预设的情绪评估值与情绪类型之间的映射关系,进而,可以按照预设的情绪评估值与情绪类型之间的映射关系,确定目标情绪评估值对应的目标情绪类型,不同的情绪则可以采用不同的语义解析算法,这样有助于提升解析精准度,智能投影仪中可以预先存储预设的情绪类型与语义解析算法之间的映射关系,进而,可以按照预设的情绪类型与语义解析算法之间的映射关系,确定目标情绪类型对应的目标语义解析算法,依据目标语义解析算法将目标语音信号进行语义解析,得到语音内容,对语音内容进行关键字提取,得到目标关键字,如此,一方面可以精准识别用户身份,另一方面,可以识别用户情绪,达到精准实现语义解析。
103、确定所述目标关键字对应的目标控制指令。
其中,不同的关键字可以对应不同的控制指令,目标控制指令可以为以下至少一种:启动指令、关闭指令、传输指令、编辑指令、播放指令、删除指令、拖动指令、下载指令、查阅指令、暂停指令、后退指令、前进指令、拍照指令、录音指令、放大指令、缩小指令、幕布操控指令(用于操控与智能投影仪连接的幕布)等等,在此不做限定。
在一个可能的示例中,上述步骤103,确定所述目标关键字对应的目标控制指令,可以包括如下步骤:
按照预设的关键字与控制指令之间的映射关系,确定所述目标关键字对应的目标控制指令。
具体实现中,智能投影仪中可以预先存储预设的关键字与控制指令之间的映射关系,进而,可以依据该预设的关键字与控制指令之间的映射关系确定目标关键字对应的目标控制指令。
104、响应所述目标控制指令,执行与所述目标控制指令相应的操作。
其中,智能投影仪可以响应目标控制指令,并执行与该目标控制指令相应的操作,例如,目标控制指令为启动指令,则可以启动智能投影仪,又例如,目标控制指令为关闭指令,则可以关闭智能投影仪。
在一个可能的示例中,上述步骤101之前,还可以包括如下步骤:
c1、建立所述智能投影仪与所述控制设备之间的通信连接;
c2、确定所述智能投影仪与所述控制设备之间的目标距离;
c3、在所述目标距离处于预设范围时,获取所述控制设备的唯一标识信息;
c4、在所述唯一标识信息属于预设标识信息集时,执行所述接收控制设备发送的目标语音信息的步骤。
本申请实施例中,唯一标识信息可以为以下至少一种:ip地址、mac地址、国际移动设备识别码(internationalmobileequipmentidentity,imei),集成电路卡识别码(integratecircuitcardidentity,iccid)、电话号码等等,在此不做限定。上述预设标识信息集可以包括至少一个标识信息,其可以由用户预先设置或者系统默认。上述预设范围可以由用户自行设置或者系统默认。
具体实现中,智能投影仪可以建立智能投影仪控制设备之间的通信连接,并确定智能投影仪与控制设备之间的目标距离,例如,可以检测两者之间的连接信号强度,按照预设的信号强度与距离之间的映射关系,确定该连接信号强度对应的目标距离,在目标距离处于预设范围时,获取控制设备的唯一标识信息,在唯一标识信息属于预设标识信息集时,执行接收控制设备发送的目标语音信息的步骤。
在一个可能的示例中,在步骤103-步骤104之间,还可以包括如下步骤:
d1、在所述目标控制指令为预设指令时,向所述控制设备发送身份验证请求;
d2、接收由所述控制设备发送的目标人脸图像;
d3、对所述目标人脸图像进行验证;
d4、在所述目标人脸图像被验证通过时,执行步骤104。
其中,预设指令可以为用户自行设置或者系统默认。具体实现中,智能投影仪可以在目标控制指令为预设指令时,向控制设备发送身份验证请求,进而,可以接收由控制设备发送的目标人脸图像,并对该人脸图像进行验证,在其被验证通过时,执行步骤104,否则,不响应该目标控制指令。
进一步地,在一个可能的示例中,上述步骤d3,对所述目标人脸图像进行验证,可以包括如下步骤:
d31、对所述目标人脸图像进行区域分割,得到目标人脸区域;
d32、对所述目标人脸区域进行二值化处理,得到二值化人脸图像;
d33、对所述二值化人脸图像划分为多个区域;
d34、将所述二值化人脸图像进行特征点提取,得到多个特征点;
d35、依据所述多个特征点确定所述多个区域中每一区域对应的特征点分布密度,得到多个特征点分布密度;
d36、依据所述多个特征点分布密度确定目标均方差;
d37、按照预设的均方差与图像质量评价值之间的映射关系,确定所述目标均方差对应的目标图像质量评价值;
d38、在所述目标图像质量评价值小于所述预设图像质量评价值时,对所述目标人脸图像进行图像增强处理,将图像增强处理后的所述目标人脸图像与预设人脸模板进行匹配,得到匹配值;
d39、在所述匹配值大于预设阈值时,确定所述目标人脸图像被验证通过。
具体实现中,上述预设阈值可以由用户自行设置或者系统默认,预设人脸模板可以预先保存在智能投影仪中。智能投影仪可以获取对目标人脸图像进行区域分割,得到目标人脸区域,目标人脸区域为不包括背景但仅包含人脸的区域,对目标人脸区域进行二值化处理,得到二值化人脸图像,对二值化人脸图像划分为多个区域,将二值化人脸图像进行特征点提取,得到多个特征点,特征提取的算法可以为以下至少一种:harris角点检测、尺度不变特征变换算法(scaleinvariantfeaturetransform,sift)、surf算法、金字塔算法、小波变换等等,在此不做限定。
进一步地,可以依据多个特征点确定多个区域中每一区域对应的特征点分布密度,得到多个特征点分布密度,依据该多个特征点分布密度确定目标均方差,智能投影仪中可以预先存储预设的均方差与图像质量评价值之间的映射关系,按照预设的均方差与图像质量评价值之间的映射关系,确定目标均方差对应的目标图像质量评价值,当然均方差越小,则图像质量评价值越大,在目标图像质量评价值大于预设图像质量评价值时,直接将该目标人脸图像与预设人脸模板进行匹配,在其之间的匹配值大于预设阈值,确认目标人脸图像被验证通过,否则,则确认目标人脸图像被验证失败,反之,在目标图像质量评价值小于预设图像质量评价值时,对目标人脸图像进行图像增强处理,将图像增强处理后的目标人脸图像与预设人脸模板进行匹配,在其之间的匹配值大于预设阈值,确认目标人脸图像被验证通过,否则,则确认目标人脸图像被验证失败,图像增强处理相应的算法可以为以下至少一种:灰度拉伸、直方图均衡化、小波变换等等,在此不做限定。
可以看出,本申请实施例中所描述的语音识别方法,应用于智能投影仪,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
与上述图1b所示的实施例一致地,请参阅图2,图2是本申请实施例提供的一种语音识别方法的流程示意图,如图所示,应用于如图1a所示的智能投影仪,本语音识别方法包括:
201、建立所述智能投影仪与控制设备之间的通信连接。
202、确定所述智能投影仪与所述控制设备之间的目标距离。
203、在所述目标距离处于预设范围时,获取所述控制设备的唯一标识信息。
204、在所述唯一标识信息属于预设标识信息集时,接收所述控制设备发送的目标语音信息。
205、对所述目标语音信息进行解析,得到目标关键字。
206、确定所述目标关键字对应的目标控制指令。
207、响应所述目标控制指令,执行与所述目标控制指令相应的操作。
其中,上述步骤201-步骤207的具体描述可以参照上述图1b所描述的语音识别方法的相应步骤,在此不再赘述。
可以看出,本申请实施例中所描述的语音识别方法,应用于智能投影仪,建立智能投影仪与控制设备之间的通信连接,确定智能投影仪与控制设备之间的目标距离,在目标距离处于预设范围时,获取控制设备的唯一标识信息,在唯一标识信息属于预设标识信息集时,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
与上述实施例一致地,请参阅图3,图3是本申请实施例提供的一种智能投影仪的结构示意图,如图所示,该智能投影仪包括处理器、存储器、通信接口以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,本申请实施例中,上述程序包括用于执行以下步骤的指令:
接收控制设备发送的目标语音信息;
对所述目标语音信息进行解析,得到目标关键字;
确定所述目标关键字对应的目标控制指令;
响应所述目标控制指令,执行与所述目标控制指令相应的操作。
可以看出,本申请实施例中所描述的智能投影仪,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
在一个可能的示例中,在所述对所述目标语音信息进行解析,得到目标关键字方面,上述程序包括用于执行以下步骤的指令:
向与所述智能投影仪连接的云端服务器发送语音解析请求,所述语音解析请求携带所述目标语音信息,所述语音解析请求用于请求所述云端服务器对所述目标语音信息进行解析;
接收由所述云端服务器发送的针对所述目标语音信息解析得到的所述目标关键字。
在一个可能的示例中,在所述对所述目标语音信息进行解析,得到目标关键字方面,上述程序包括用于执行以下步骤的指令:
获取所述目标语音信息对应的目标发音频率;
按照预设的发音频率与身份信息之间的映射关系,确定所述目标发音频率对应的目标身份信息;
在所述目标身份信息满足预设要求时,将所述目标语音信息进行模数转换,得到目标数字信号;
确定所述目标数字信号对应的目标平均能量值;
确定所述目标数字信号的峰值和谷值,得到多个峰值和多个谷值;
依据所述多个峰值和所述多个谷值进行均方差运算,得到目标均方差;
按照预设的平均能量值与第一情绪评估值之间的映射关系,确定所述目标平均能量值对应的目标第一情绪评估值;
按照预设的均方差与第二情绪评估值之间的映射关系,确定所述目标均方差对应的目标第二情绪评估值;
获取所述第一情绪评估值对应的第一权重值、所述第二情绪评估值对应的第二权重值;
依据所述第一权重值、所述第二权重值、所述目标第一情绪评估值和所述目标第二情绪评估值进行加权运算,得到目标情绪评估值;
按照预设的情绪评估值与情绪类型之间的映射关系,确定所述目标情绪评估值对应的目标情绪类型;
按照预设的情绪类型与语义解析算法之间的映射关系,确定所述目标情绪类型对应的目标语义解析算法;
依据所述目标语义解析算法将所述目标语音信号进行语义解析,得到语音内容;
对所述语音内容进行关键字提取,得到所述目标关键字。
在一个可能的示例中,在所述确定所述目标关键字对应的目标控制指令方面,上述程序包括用于执行以下步骤的指令:
按照预设的关键字与控制指令之间的映射关系,确定所述目标关键字对应的目标控制指令。
在一个可能的示例中,上述程序还包括用于执行以下步骤的指令:
建立所述智能投影仪与所述控制设备之间的通信连接;
确定所述智能投影仪与所述控制设备之间的目标距离;
在所述目标距离处于预设范围时,获取所述控制设备的唯一标识信息;
在所述唯一标识信息属于预设标识信息集时,执行所述接收控制设备发送的目标语音信息的步骤。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,智能投影仪为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对智能投影仪进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
图4a是本申请实施例中所涉及的语音识别装置400的功能单元组成框图。该语音识别装置400,应用于智能投影仪,所述装置400包括:接收单元401、解析单元402、第一确定单元403和执行单元404,其中,
接收单元401,用于接收控制设备发送的目标语音信息;
解析单元402,用于对所述目标语音信息进行解析,得到目标关键字;
第一确定单元403,用于确定所述目标关键字对应的目标控制指令;
执行单元404,用于响应所述目标控制指令,执行与所述目标控制指令相应的操作。
可以看出,本申请实施例中所描述的语音识别装置,应用于智能投影仪,接收控制设备发送的目标语音信息,对目标语音信息进行解析,得到目标关键字,确定目标关键字对应的目标控制指令,响应目标控制指令,执行与目标控制指令相应的操作,能够对外来设备发送的语音信息进行解析,得到关键字,并确定该关键字对应的控制指令,如此,能够实现语音控制功能,提升智能投影仪的智能性。
在一个可能的示例中,在所述对所述目标语音信息进行解析,得到目标关键字方面,所述解析单元402具体用于:
向与所述智能投影仪连接的云端服务器发送语音解析请求,所述语音解析请求携带所述目标语音信息,所述语音解析请求用于请求所述云端服务器对所述目标语音信息进行解析;
接收由所述云端服务器发送的针对所述目标语音信息解析得到的所述目标关键字。
在一个可能的示例中,在所述对所述目标语音信息进行解析,得到目标关键字方面,所述解析单元402具体用于:
获取所述目标语音信息对应的目标发音频率;
按照预设的发音频率与身份信息之间的映射关系,确定所述目标发音频率对应的目标身份信息;
在所述目标身份信息满足预设要求时,将所述目标语音信息进行模数转换,得到目标数字信号;
确定所述目标数字信号对应的目标平均能量值;
确定所述目标数字信号的峰值和谷值,得到多个峰值和多个谷值;
依据所述多个峰值和所述多个谷值进行均方差运算,得到目标均方差;
按照预设的平均能量值与第一情绪评估值之间的映射关系,确定所述目标平均能量值对应的目标第一情绪评估值;
按照预设的均方差与第二情绪评估值之间的映射关系,确定所述目标均方差对应的目标第二情绪评估值;
获取所述第一情绪评估值对应的第一权重值、所述第二情绪评估值对应的第二权重值;
依据所述第一权重值、所述第二权重值、所述目标第一情绪评估值和所述目标第二情绪评估值进行加权运算,得到目标情绪评估值;
按照预设的情绪评估值与情绪类型之间的映射关系,确定所述目标情绪评估值对应的目标情绪类型;
按照预设的情绪类型与语义解析算法之间的映射关系,确定所述目标情绪类型对应的目标语义解析算法;
依据所述目标语义解析算法将所述目标语音信号进行语义解析,得到语音内容;
对所述语音内容进行关键字提取,得到所述目标关键字。
在一个可能的示例中,在所述确定所述目标关键字对应的目标控制指令方面,所述第一确定单元403具体用于:
按照预设的关键字与控制指令之间的映射关系,确定所述目标关键字对应的目标控制指令。
在一个可能的示例中,所述智能投影仪还包括摄像头,如图4b所示,图4b为图4a所示的语音识别装置的又一变型结构,其与图4a相比较,还可以包括:建立单元405、第二确定单元406和获取单元407,具体如下:
建立单元405,用于建立所述智能投影仪与所述控制设备之间的通信连接;
第二确定单元406,用于确定所述智能投影仪与所述控制设备之间的目标距离;
获取单元407,用于在所述目标距离处于预设范围时,获取所述控制设备的唯一标识信息;
由所述接收单元401在所述唯一标识信息属于预设标识信息集时,执行所述接收控制设备发送的目标语音信息的步骤。
可以理解的是,本实施例的语音识别装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括智能投影仪。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括智能投影仪。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:read-onlymemory,简称:rom)、随机存取器(英文:randomaccessmemory,简称:ram)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。