头戴智能设备的语音识别系统及头戴智能设备的制造方法

文档序号:10770047阅读:683来源:国知局
头戴智能设备的语音识别系统及头戴智能设备的制造方法
【专利摘要】本实用新型公开了一种头戴智能设备的语音识别系统及头戴智能设备,该语音识别系统包括:采集语音信号的语音输入设备;存储有多个关键词的数据库;以及语音识别芯片,与语音输入设备和数据库相连接,其中,语音识别芯片包括:对语音输入设备采集到的语音流进行频谱分析的频谱分析电路,与语音输入设备相连接;对频谱分析电路输出的结果提取语音特征参数的特征提取电路,与频谱分析电路相连接;及将提取到的语音特征参数与数据库中关键词的语音特征参数进行匹配的匹配电路,与数据库和特征提取电路相连接。采用上述技术方案,避免了采用手触操控方式给用户带来的不便,从而有效提高了用户体验。
【专利说明】
头戴智能设备的语音识别系统及头戴智能设备
技术领域
[0001]本实用新型涉及通信领域,尤其涉及头戴智能设备的语音识别系统及头戴智能设备。
【背景技术】
[0002]随着电子设备的微型化,头戴式智能设备,例如智能眼镜,已经逐步投入市场。对于头戴式智能设备而言,手触操控的方式会给用户带来一些不便,例如,当用户操作比较频繁而需要把手持续上抬动作,这样会给用户一些不好的体验效果。
[0003]因此,提供一种非手触操控方式,能够方便地对设备发出指令,实现所需的各个功能,是目前亟待解决的问题。
【实用新型内容】
[0004]本实用新型的目的是提供一种头戴智能设备的语音识别系统及头戴智能设备,用于解决现有技术中手触操控的方式会给用户带来一些不便的问题。
[0005]根据本实用新型的一个方面,提供一种头戴智能设备的语音识别系统,该语音识别系统包括:采集语音信号的语音输入设备;存储有多个关键词的数据库;以及语音识别芯片,与上述语音输入设备和上述数据库相连接,其中,上述语音识别芯片包括:对上述语音输入设备采集到的语音流进行频谱分析的频谱分析电路,与上述语音输入设备相连接;对上述频谱分析电路输出的结果提取语音特征参数的特征提取电路,与上述频谱分析电路相连接;及将提取到的语音特征参数与上述数据库中关键词的语音特征参数进行匹配的匹配电路,与上述数据库和上述特征提取电路相连接。
[0006]进一步地,上述语音识别系统还包括:连接于上述语音输入设备和上述语音识别芯片之间的语音活动检测器。
[0007]进一步地,语音识别系统还包括:连接于上述语音输入设备和上述语音识别芯片之间的定时开关。
[0008]进一步地,上述语音识别系统还包括:从上述语音识别芯片的输出结果中提取拼音串的微控制单元(MCU),其中,上述MCU与上述语音识别芯片的输出端及上述数据库的输入端相连接。
[0009]进一步地,上述语音输入设备为麦克风输入设备。
[0010]进一步地,上述语音识别芯片为LD3320芯片。
[0011]根据本实用新型的另一个方面,提供一种头戴智能设备,并采用如下技术方案:该头戴智能设备包括上述的头戴智能设备。
[0012]进一步地,上述头戴智能设备可以为智能眼镜。
[0013]采用本实用新型的技术方案,只需要用户通过语音对头戴智能设备发出指令,便可以实现所需的功能,避免了采用手触操控方式给用户带来的不便,从而有效提高了用户体验。
【附图说明】
[0014]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0015]图1为本实用新型实施例的头戴智能设备的语音识别系统的结构框图;
[0016]图2为本实用新型优选实施例一的头戴智能设备的语音识别系统的结构框图;
[0017]图3为本实用新型优选实施例二的头戴智能设备的语音识别系统的结构框图。
【具体实施方式】
[0018]本实用新型的核心是提供一种头戴智能设备的语音识别系统及头戴智能设备,用于解决现有技术中手触操控的方式会给用户带来一些不便等问题。
[0019]为了使本领域的技术人员更好地理解本实用新型的技术方案,下面将结合附图对本实用新型作进一步的详细介绍。
[0020]根据本发明实施例,提供了一种头戴智能设备的语音识别系统。
[0021]图1为本实用新型实施例的头戴智能设备的语音识别系统的结构框图。如图1所示,该语音识别系统包括:采集语音信号的语音输入设备10;存储有多个关键词的数据库12;以及语音识别芯片14,与上述语音输入设备10和上述数据库12相连接,其中,上述语音识别芯片14包括:对上述语音输入设备采集到的语音流进行频谱分析的频谱分析电路140,与上述语音输入设备10相连接;对上述频谱分析电路输出的结果提取语音特征参数的特征提取电路142,与上述频谱分析电路140相连接;及将提取到的语音特征参数与上述数据库中关键词的语音特征参数进行匹配的匹配电路144,与上述数据库12和上述特征提取电路142相连接。
[0022]采用图1所示的头戴智能设备的语音识别系统,只需要用户通过语音对头戴智能设备发出指令,便可以实现所需的功能,避免了采用手触操控方式给用户带来的不便,从而有效提高了用户体验。
[0023]其中,上述语音输入设备可以为麦克风(MIC)输入设备。头戴智能设备的语音识别系统的工作原理是:将通过MIC输入的声音进行频谱分析;提取语音特征;和关键词语列表中的关键词语进行对比匹配;找出得分最高(即匹配度最高)的关键词语作为识别结果输出。
[0024]优选地,如图2所示,上述语音识别系统还可以包括:连接于上述语音输入设备10和上述语音识别芯片14之间的语音活动检测器16。
[0025]优选地,如图3所示,语音识别系统还可以包括:连接于上述语音输入设备10和上述语音识别芯片14之间的定时开关18。
[0026]需要说明的是,语音识别芯片能在两种情况下给出识别结果:
[0027]第一种:外部送入预定时间的语音数据后(比如5秒钟的语音数据),芯片对这些语音数据运算分析后,给出识别结果。即可以在上述语音输入设备10和上述语音识别芯片14之间设置定时开关18。
[0028]对于第一种情况,可以理解为预先设定一个时间(比如5秒钟),定时开关18在5秒钟后关断,停止把声音送入语音识别芯片,并且根据已送入语音识别芯片的语音数据计算出一个识别结果。
[0029]第二种:外部送入语音数据流,语音识别芯片通过语音活动检测器VADUoiceactivity detect1n)进行端点检测,检测出用户停止说话,把用户开始说话到停止说话之间的语音数据进行运算分析后,给出识别结果。即可以在上述语音输入设备10和上述语音识别芯片14之间设置语音活动检测器16。
[0030]对于第二种情况,需要了解VAD的工作原理:VAD技术是在一段语音数据流中,判断出哪个时间点是人声的开始,哪个时间点是人声的结束。判断的依据是,在背景声音的基础上有了语音发音,则视为声音的开始。而后,检测到一段持续时间的背景音(比如600毫秒),则视为人声说话结束。
[0031]通过VAD判断出人声说话的区域后,语音识别芯片会把这期间的声音数据进行识别处理后,计算出识别结果。
[0032]需要说明的是,除了以上两种情况外,语音识别算法无法〃主动〃地判断出是否识别出了一个结果。这是因为,在计算的过程中的任何时刻,语音识别器都会对已送入识别芯片的声音数据进行分析,并根据匹配程度为识别列表中的关键词语进行打分,最匹配的打分最高。
[0033]但是,由于识别算法不知道用户后面是否还继续说语音,所以无法〃主动〃地判断已经识别出一个结果。比如,识别列表中有两个关键词语分别是"李晓"和"李晓明〃,当用户说到〃晓〃这个音节时,在识别芯片内部是〃李晓〃的得分最高,但此时识别芯片是无法给出识别结果。随着用户说出〃明〃音节后,〃李晓明〃则成为得分最高。此时,用户停止说话,或者是定时录音已到,使得识别芯片可以判断出用户已经停止说话了,才能给出识别结果是〃李晓明"。
[0034]优选地,如图2和图3所示,上述语音识别系统还可以包括:从上述语音识别芯片的输出结果中提取拼音串的微控制单元(MCU)20,其中,上述MCU 20与上述语音识别芯片的输出端及上述数据库的输入端相连接。
[0035]语音识别系统中的MCU还可以对数据库中的关键词语音特征进行维护,每次识别后,MCU根据语音识别芯片的输出结果中提取拼音串,并动态更新关键词列表中的语音特征
?目息O
[0036]优选地,上述语音识别芯片可以采用LD3320芯片。
[0037]根据本发明实施例,还提供了一种头戴智能设备。该头戴智能设备包括上述的语首识别系统。
[0038]优选地,上述头戴智能设备可以为智能眼镜。
[0039]综上所述,借助本发明提供的上述实施例,只需要用户通过语音对头戴智能设备发出指令,便可以实现所需的功能,避免了采用手触操控方式给用户带来的不便,从而有效提高了用户体验。
[0040]以上只通过说明的方式描述了本实用新型的某些示范性实施例,毋庸置疑,对于本领域的普通技术人员,在不偏离本实用新型的精神和范围的情况下,可以用各种不同的方式对所描述的实施例进行修正。因此,上述附图和描述在本质上是说明性的,不应理解为对本实用新型权利要求保护范围的限制。
【主权项】
1.一种头戴智能设备的语音识别系统,其特征在于,包括: 采集语音信号的语音输入设备; 存储有多个关键词的数据库;及 语音识别芯片,与所述语音输入设备和所述数据库相连接,其中,所述语音识别芯片包括: 对所述语音输入设备采集到的语音流进行频谱分析的频谱分析电路,与所述语音输入设备相连接; 对所述频谱分析电路输出的结果提取语音特征参数的特征提取电路,与所述频谱分析电路相连接;及 将提取到的语音特征参数与所述数据库中关键词的语音特征参数进行匹配的匹配电路,与所述数据库和所述特征提取电路相连接。2.如权利要求1所述的语音识别系统,其特征在于,所述语音识别系统还包括:连接于所述语音输入设备和所述语音识别芯片之间的语音活动检测器。3.如权利要求1所述的语音识别系统,其特征在于,语音识别系统还包括:连接于所述语音输入设备和所述语音识别芯片之间的定时开关。4.如权利要求1所述的语音识别系统,其特征在于,所述语音识别系统还包括:从所述语音识别芯片的输出结果中提取拼音串的微控制单元MCU,其中,所述MCU与所述语音识别芯片的输出端及所述数据库的输入端相连接。5.如权利要求1所述的语音识别系统,其特征在于,所述语音输入设备为麦克风输入设备。6.如权利要求1至5中任一项所述的语音识别系统,其特征在于,所述语音识别芯片为LD3320芯片。7.—种头戴智能设备,其特征在于,包括权利要求1至6中任一项所述的语音识别系统。8.如权利要求7所述的头戴智能设备,其特征在于,所述头戴智能设备为智能眼镜。
【文档编号】G10L15/22GK205451769SQ201521101160
【公开日】2016年8月10日
【申请日】2015年12月25日
【发明人】叶晨光
【申请人】北京帕罗奥图科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1