可识别语音的智能手机的制作方法

文档序号:2833670阅读:690来源:国知局
专利名称:可识别语音的智能手机的制作方法
技术领域
本发明涉及手机领域,具体而言是关于一种可识别语音的智能手机。
背景技术
智能手机(Smartphone)是一种安装了相应开放式操作系统的手机。通常使用不同的操作系统,他们之间的应用软件互不兼容。因为可以安装第三方软件,所以智能手机有丰富的功能。智能手机的诞生,是掌上电脑(PocketPC)演变而来的。最早的掌上电脑是不具备手机的通话功能,但是随着用户对于掌上电脑的个人信息处理方面功能的依赖的提升,由不习惯于随时都携带手机和PPC两个设备,所以厂商将掌上电脑的系统移植到了手机中,于是才出现了智能手机这个概念。智能手机比传统的手机具有更多的综合性处理能力 功能,比如Symbian操作系统的S60系列、Windows Mobile操作系统的Windows MobileSmartphone系列;也可以是传统PDA加上手机通信功能,比如Windows Mobile操作系统的WindowsMobile Pocket PC Phone系列、Palm操作系统的Treo系列;也可是其它独立类型,比如Symbian操作系统的S60、Symbian3,以及一些Linux操作系统的智能手机。然而,就新近的发展来看,这些智能手机的类型有相融合的趋势;智能手机具有五大特点I.具备无线接入互联网的能力,即需要支持GSM网络下的GPRS或者CDMA网络的CDMA IX 或 3G (wcdma、cdma-evdo、TD-scdma)网络,甚至 4G (HSPA+、FDD-LTE, TDD-LTE)。2.具有PDA的功能,包括PM(个人信息管理),日程记事,任务安排,多媒体应用,浏览网页。3.具有开放性的操作系统,拥有独立的核心处理器(CPU)和内存,可以安装更多的应用程序,使智能手机的功能可以得到无限扩展。4.可以根据个人需要扩展机器功能。根据个人需要,实时扩展机器内置功能,以及软件升级,智能识别软件兼容性,实现了软件市场同步的人性化功能。5.扩展性能强,第三方软件支持多。从广义上说,智能手机除了具备手机的通话功能外,还具备了 PDA的大部分功能,特别是个人信息管理以及基于无线数据通信的浏览器,GPS和电子邮件功能。智能手机为用户提供了足够的屏幕尺寸和带宽,既方便随身携带,又为软件运行和内容服务提供了广阔的舞台,很多增值业务可以就此展开,如股票、新闻、天气、交通、商品、应用程序下载、音乐图片下载等等。结合3G通信网络的的支持,智能手机的发展趋势,势必将成为一个功能强大,集通话、短信、网络接入、影视娱乐为一体的综合性个人手持终端设备,一般来说,智能手机具有以下系统、装置和功能I.作业系统一般来说,智能手机将基于一个操作系统,可以运行程序。软件几乎所有的手机包括某种形式的软件(最基本的模型是包括包括一个地址簿或某种形式的联系助理,例如),智能手机将有能力做更多的工作。它可让您创建和编辑微软Office文档-或至少查看档案。它可能允许您下载的应用,如个人和企业财务助理。或者,它可让您编辑照片,通过全球定位系统规划行车路线,并创建一个播放数字音乐。2. Web访问更多智能手机可以用更快的速度进入该网站,该手机能连接3G数据网络,并增加了 Wi-Fi的支持。不过,并不是所有的智能手机提供高速上网,但是他们都提供某种形式的访问。您可以使用手机浏览您最喜爱的网站。3. QWERTY键盘根据我们的定义,智能手机包括一个QWERTY键盘。他们将在您的电脑键盘-而不是按字母顺序排列顶部的数字键盘,在那里你必须利用I号进入一个有A,B,或C该键盘可硬件(物理键盘)或软件(和触摸屏一样,如iPhone)。4.消息所有的手机可以发送和接收文字信息,而一个智能手机除了是处理电子邮件,智能手机可以同步您的个人_,有时你的专业-电子邮件帐户。一些手机可以支持多个电子邮件帐户。其他包括访问流行的即时通讯服务,如QQ、MSN、以及AOL的AM和Yahoo。
5.另外,智能手机功能还包括邮件通常智能手机是为商务人士而设计,而目前全球商务最主要的联络方式不是电话、短信而是邮件,尤其是在贸易公司或全球性公司中邮件是一个商务人士一天主要处理的工作内容,而智能手机第一需要支持的就是邮件。6.联系人除了邮件,在通话的过程中都需要调用联系人电话簿,一般人都是将电话簿只保存在手机上手机丢失或更换手机,庞大的地址簿相当的不方便,聪明一点的人是使用数据线与电脑同步,但真正正确的使用方法是通过无线同步,无论在电脑上或手机上进行了联系人的更改都可以得到有效的同步。7.日历商务手机日程安排是一个很好的功能.但受限于手机的操作性问题很少有人会在手机上安排所有的事情,此时又需要与电脑同步。支持文档查看和编写除了以上,商务手机还能够处理日常工作中的文档,以保证手机成为一个移动的工作平台。由于智能手机设计的小型化、便携性的特点,使得手机可方便地在任一地点使用,就智能手机具备的具体一项功能而言,目前市场上销售的智能手机,尚不具备完善语音识别的功能,大部分的操作通过键盘或手写完成,操作繁杂,效率低下;如何通过语音实现人机对话是手机领域内要解决的重要技术问题之一。

发明内容
本发明的目的是,针对现有技术中,智能手机操作方面的不足,提出一种具有语音识别功能的智能手机,在其内设置语音识别装置,可以识别其合法使用者的或其他使用者的语音指令,完成该智能手机的各项功能。本发明提供一种可识别语音的智能手机,包括以下单元和装置语音采集单元,用于将一外部的语音指令转换为模拟电信号;语音处理单元,用于处理所接收到的模拟电信号;语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系;语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该手机的具体运行。进一步的,所述语音采集单元为一麦克风。
进一步的,所述语音处理单元包括一 AD转换单元和降噪单元。进一步的,所述语音指令存储器为一非易失性随机访问存储器。本发明的有益效果在于因为该手机具有了语音识别装置,无需再通过繁杂的键盘输入和书写过程,即可完成大部分的手机功能,大幅简化手机的操作程序;同时,该智能手机仅识别其合法使用者的语音,也增加了其安全性能,仅允许其合法使用者正常使用;即使手机丢失,其他持有者无法使用,保证了该智能手机内的信息安全。


图I为本发明实施例的原理示意图。
具体实施例方式为了解本发明的技术内容,特举例并配合

如下如图I所示,可识别语音的智能手机包括语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105、通讯模块单元110和网络连接单元120。语音采集单元101,用于将一外部的语音指令转换为模拟电信号,本实施例中,该语音采集单元101为一麦克风,可以让用户在一定距离范围内发出声音指令,通过麦克风采集用户的声音指令,并转换成模拟电信号,该模拟电信号传输至语音处理单元102。语音处理单元102,用于处理所接收到的模拟电信号。该语音处理单元102包括一AD转换单元和降噪单元,用于对所接收到的模拟电信号进行模数转换,然后进行降噪处理,例如利用基于谱相减算法的降噪单元进行降噪处理,该处理后的数字信号发送至语音识别单元104。语音指令存储器103,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该手机的控制指令之间的映射关系。本实施例中,该语音指令存储器103优选为一个非易失性随机访问存储器(NVRAM),例如SD卡以及CF卡、SONY记忆棒等其他类型的闪存扩展存储卡。语音识别可基于讲话者相关识别模式或讲话者无关系识别模式。讲话者相关识别模式是指在执行识别之前预先存储和登记一个或多个用户的语音,并且将外界输入语音的模型与所存储的语音的模型进行比较,以执行语音识别。讲话者无关系识别模式是指在识别操作之前无需预先登记和存储用户的语音,而是收集未指定讲话者的语音以便研究统计模型,并且利用所研究的统计模型来执行识别,这样,消除了每一个讲话者的个人特征,采用每个讲话者之间的共同特征进行有利地识别。本实施例中,基于讲话者相关识别模式,语音指令存储器103内预先录制存储了至少一个用户的多个语音控制指令,并存储该多个语音指令所转换的数字信号与该手机的控制指令之间的映射关系(一一对应映射关系)。语音识别单元104分别与语音处理单元102和语音指令存储器103连接,用于识别语音指令,并将识别结果发送至处理器105,处理器105根据该识别结果对应的数字信号控制该扫描仪的具体运行。
用户可通过手机上的按键来启动其语音控制模式,该按键可以是手机上的一个已有功能按键。在另外的实施例中,基于讲话者无关系识别模式,语音指令存储器103内预先存储了经过研究的多个语音控制指令的统计模型特征,该统计模型特征对应于多个语音指令所转换的数字信号与该手机的控制指令之间的映射关系。因此,在用户发出语音指令后,经过语音处理单元102的数据处理,语音识别单元104提取语音数据中的模型特征,并与语音指令存储器103中的多个语音控制指令的统计模型特征进行比较,执行语音识别,并基于识别结果手机执行对应的操作。本实施例中,用户可在一定的距离范围内对手机发出语音指令,语音采集单元101接收到用户发出的语音指令后,经过语音处理单元102的模数转换、降噪处理后,发送至语音识别单元104进行识别处理,并识别结果发送至处理器105,处理器105基于识别结果对应的数字信号控制该手机执行所对应的控制指令。 前述的语音采集单元101、语音处理单元102、语音识别单元103、语音指令存储器104、和处理器105可以是分立的元件,或者是集成在一起的。处理器105,控制手机的整体操作。特别地,通过语音采集单元、语音处理单元、语音识别单元和语音指令存储器,执行语音识别,并基于识别的结果,控制该手机执行所对应的控制指令。综上所述,本实施例的智能手机,其设置了语音采集、处理和识别单元,使得手机具备了语音控制功能,用户可以通过语言直接控制手机执行多种操作,提供良好的人机互动,给用户的日常使用带来便利,满足用户全方位的使用的需求。
权利要求
1.一种可识别语音的智能手机,包括通讯模块单元和处理器,其特征在于,还包括 语音采集单元,用于将一外部的语音指令转换为模拟电信号; 语音处理单元,用于处理所接收到的模拟电信号; 语音指令存储器,用于预先存储多个语音指令,并预先存储该多个语音指令所转换的数字信号与该扫描仪的控制指令之间的映射关系; 语音识别单元,分别与所述语音处理单元和语音指令存储器连接,用于识别语音指令并将识别结果发送至所述处理器,所述处理器根据该识别结果对应的数字信号控制该手机的具体运行。
2.如权利要求I所述的智能手机,其特征在于,所述语音采集单元为一麦克风。
3.如权利要求I所述的智能手机,其特征在于,所述语音处理单元包括一AD转换单元和降噪单元。
4.如权利要求I所述的智能手机,其特征在于,所述语音指令存储器为一非易失性随机访问存储器。
全文摘要
本发明提供一种可识别语音的智能手机,包括通讯模块单元和处理器、语音采集单元、语音处理单元、语音指令存储器、语音识别单元和处理器。智能手机具备了语音控制功能,用户可通过语言直接控制手机执行多种操作,提供良好的人机互动,给用户的日常的使用带来便利,并增加了其使用的安全性。
文档编号G10L15/26GK102932556SQ20121051254
公开日2013年2月13日 申请日期2012年11月30日 优先权日2012年11月30日
发明者魏红霞 申请人:魏红霞
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1