一种在移动设备中实现本地语音识别的方法

文档序号:9633893阅读:436来源:国知局
一种在移动设备中实现本地语音识别的方法
【技术领域】
[0001]本发明涉及语音识别领域,尤其涉及一种在移动设备中实现本地语音识别的方法。
【背景技术】
[0002]随着对人工类神经网络(ANN)研究的不断深入,现代科技技术在人工智能领域中取得了很大进展。比如,模式识别、智能机器人、自动控制以及语音识别技术等领域,都表现出了良好的智能特性。其中,语音识别技术将替代按键输入,成为移动手持设备的下一个发展方向。
[0003]由于语音识别技术需要能存储超大容量数据的语音数据库,而且人工类神经网络学习也需要大容量存储器的支持,且对数据处理能力要求也非常高,因此智能语音识别技术的实现一般是在云端数据中心中实现的。当前移动手持设备(例如手机、平板电脑)存储能力和数据处理能力都是相当有限的,因此很难实现智能语音识别。
[0004]云端数据中心的语音数据库是针对广泛的大众人群,并不能特定于某个人的口音、语调、用语习惯和语速等来制定个人语音数据库,因此云端设备中心的语音数据库的准确性对不同个人来说是不相同的。
[0005]移动手持设备对语音处理的基本流程,如图1所示。移动手持设备接收到用户的语音数据,会通过网络将接收到的语音数据发送给云端数据中心,由云端数据中心对语音数据经过处理后,把解析后的命令操作再通过网络发送回移动手持设备,移动手持设备根据该命令操作做出响应。由此可以看出,实时的网络传输速度是影响移动手持设备能否快速响应的潜在因素。常见的移动手持设备对语音识别和处理通常是由移动手持设备内部应用处理器(Applicat1n processor)在内存中执行和处理。因此应用处理器和内存必须始终保持开启状态才能够及时响应语音命令,显然功耗会大大增加,为了保证较长的续航能力,移动手持设备需要高容量的电池作为支撑,这无疑将增加移动手持设备的成本。
[0006]因此,本领域的技术人员致力于开发一种在移动手持设备中实现本地语音智能识别的方法,提高了语音识别的准确性,加快了语音响应速度,降低了功耗。

【发明内容】

[0007]有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是如何在移动设备的本地实现语音识别,提高识别的准确度和加快响应速度。
[0008]为实现上述目的,本发明提供了一种在移动设备中实现本地语音识别的方法,基于3D非易失性存储器,在所述移动设备本地存储中建立语音数据库和人工类神经网络学习数据库。
[0009]进一步地,所述语音数据库是针对每个设备用户的口音、语调、用语习惯和语速进行学习从而分析和存储的。
[0010]进一步地,所述移动设备是手机或平板电脑。
[0011]进一步地,基带处理器模块被配置为进行用户语音智能识别,包括响应用户语音命令。
[0012]进一步地,基带处理器模块与3D非易失性存储器集成在一起,且所述基带处理器模块被制作在3D非易失性存储器硅衬底上。
[0013]进一步地,所述移动设备被配置为点亮或不点亮屏幕都能进行本地语音智能识别。
[0014]进一步地,所述3D非易失性存储器是指存储单元阵列采用3D工艺。
[0015]进一步地,所述3D非易失性存储器的硅衬底为体硅或绝缘体上硅。
[0016]本发明提出一种在移动手持设备中实现本地语音智能识别的方法,利用3D非易失性存储器在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库。所述移动手持设备可以是手机、平板电脑等。本发明所述3D非易失性存储器技术的特点并非是通过芯片的堆叠或3D封装来实现,而是存储单元采用的是3D工艺,因而可以达到超高的存储密度。
[0017]如图2所示的是本发明3D非易失性存储器的结构示意图。其中,1为3D非易失性存储器的存储阵列,用以在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库;2为硅衬底,可以使体硅或者绝缘体上硅,用以实现3D非易失性存储器的夕卜围逻辑电路(比如,译码电路、读写电路、控制电路、输出输入电路等)。此外,本发明这种超高存储密度的3D非易失性存储器(NVM)还可以替代传统的移动手持设备中的存储芯片(一般为NAND闪存芯片)。本发明通过在3D非易失性存储器中本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库,避免了移动手持设备通过网络与云端数据中心传输数据的步骤,从而大大提高了语音识别的响应速度,更确保了使用的安全性。由于这些数据是针对特定使用者的,可以针对每个不同用户的口音、语调、用语习惯和语速等进行学习从而分析和存储,因此可以更加精准的对用户个人进行语音识别。为了进一步降低功耗,可以让基带处理器响应用户语音命令,而让漏电厉害的应用处理器和内存处于休眠状态,从而更加降低功耗。为了进一步降低功耗和提高响应速度,本发明还可以将3D非易失性存储器与基带处理器集成在一起,如图3所示。其中,(1)为本发明3D非易失性存储器和基带处理器实现的三维立体图,(2)为截面图。其中,硅片之上是3D非易失性存储器的存储阵列;衬底硅上除了实现3D非易失性存储器的外围逻辑电路(比如,译码电路、读写电路、控制电路、输出输入电路等)之外,还将实现基带处理器逻辑电路。本发明在一颗芯片上同时集成了 3D非易失性存储器和基带处理器,大大提高了硅片利用率,并且降低了制造成本;同时,能够进一步提高了语音识别的响应速度,也能够进一步节省功耗。
[0018]由上可见,本发明这种在移动手持设备中实现本地语音智能识别的方法,将针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库存储至本地的大容量的3D非易失性存储器中,提高了语音识别的准确性,加快了语音响应速度,降低了功耗。进一步的,在一颗芯片上同时集成了 3D非易失性存储器和基带处理器,能够大大提高了硅片利用率,并且降低了制造成本。
[0019]以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
【附图说明】
[0020]图1是现有技术中移动设备依靠云端实现语音识别的功能示意图;
[0021]图2是本发明的一个较佳实施例的3D非易失性存储器的结构示意图;
[0022]图3是本发明的一个较佳实施例的3D非易失性存储器和基带处理器实现的三维立体图和截面图;
[0023]图4是本发明的一个较佳实施例的移动设备响应用户的语音操作示意图。
【具体实施方式】
[0024]下面举一具体实例下作进一步阐述:
[0025]目前传统的手机只支持按键操作,如果用户正在开车,用户突然想查看一个邮件,他就必须拿起手机通过按键点亮屏幕,然后找到邮箱所在位置,然后通过按键打开想要查看的邮件,而在开车过程中做这样的事情是很危险的。如果采用本发明这种能在移动手持设备中实现本地语音智能识别的方法,就可以简单的多。用户可以不用拿起手机,只需要对手机进行语音操作就可以了。如图4所示,手机响应用户的语音操作,由基带处理器在本地的3D非易失性存储器内部的语音数据库和人工类神经网络学习数据库查找并分析和匹配,手机屏幕都可以不用亮起,然后快速的响应相应的语音操作,将用户想查找的邮件信息通过语音形式反馈给用户。可见,本发明这种在本地实现语音识别的方法,无需按键操作,更快,更安全,更省功耗。本发明这种智能语音操作除了用于查看邮件,还可以用来打电话,查看或回复短信,语音密码输入,播放音乐,阅读文章等等,广泛的适用于人们生活之中。
[0026]以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
【主权项】
1.一种在移动设备中实现本地语音识别的方法,其特征在于,基于3D非易失性存储器,在所述移动设备本地存储中建立语音数据库和人工类神经网络学习数据库。2.如权利要求1所述的在移动设备中实现本地语音识别的方法,其特征在于,所述语音数据库是针对每个设备用户的口音、语调、用语习惯和语速进行学习从而分析和存储的。3.如权利要求1所述的在移动设备中实现本地语音识别的方法,其特征在于,所述移动设备是手机或平板电脑。4.如权利要求3所述的在移动设备中实现本地语音识别的方法,其特征在于,基带处理器模块被配置为进行用户语音智能识别,包括响应用户语音命令。5.如权利要求3所述的在移动设备中实现本地语音识别的方法,其特征在于,基带处理器模块与3D非易失性存储器集成在一起,且所述基带处理器模块被制作在3D非易失性存储器硅衬底上。6.如权利要求3?5中任一一种所述的在移动设备中实现本地语音识别的方法,其特征在于,所述移动设备被配置为点亮或不点亮屏幕都能进行本地语音智能识别。7.如权利要求1?5中任一一种所述的在移动设备中实现本地语音识别的方法,其特征在于,所述3D非易失性存储器是指存储单元阵列采用3D工艺。8.如权利要求1?5中任一一种所述的在移动设备中实现本地语音识别的方法,其特征在于,所述3D非易失性存储器的硅衬底为体硅或绝缘体上硅。
【专利摘要】本发明公开了一种在移动手持设备中实现本地语音智能识别的方法,利用3D非易失性存储器在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库。所述3D非易失性存储器技术的特点并非是通过芯片的堆叠或3D封装来实现,而是存储单元采用的是3D工艺,因而可达到高存储密度。本发明通过在3D非易失性存储器中本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库,避免了移动手持设备通过网络与云端数据中心传输数据的步骤,从而大大提高了语音识别的响应速度,更确保了使用的安全性。为了进一步降低功耗,可以让基带处理器响应用户语音命令,而让漏电厉害的应用处理器和内存处于休眠状态,从而更加降低功耗。
【IPC分类】H04M1/73, G10L15/07, G10L15/22
【公开号】CN105391873
【申请号】CN201510834406
【发明人】景蔚亮, 陈邦明
【申请人】上海新储集成电路有限公司
【公开日】2016年3月9日
【申请日】2015年11月25日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1