分组寻址语音识别式信息处理装置的制作方法

文档序号:2834394阅读:229来源:国知局
专利名称:分组寻址语音识别式信息处理装置的制作方法
技术领域
本实用新型涉及信息处理技术,特别涉及大量常用信息的语音识别存取技术。
现有技术中,中国专利CN 2517073公开了一种语音识别后显示一组或多组类似号码供选择拨号的技术。但使用这种技术的通信用信息处理装置将所有数据置于一个语音数据库中,使开机后接收语音命令进行的查询工作量增大;在较多数据量情况下,这种查询在出结果之前的等待会长到令人不可容忍。其它使用语音识别技术的信息处理装置如电子名片薄、分类翻译机、通用学习机等信息处理装置,其中的姓名、地址或知识点的语音信息往往按一种方式顺序存储,在数据量大的情况下,用语音检索其中单个信息的时间会变得很长。

发明内容
本实用新型为克服上述现有技术的不足而提出一种新的语音识别式信息处理装置,采用分组概念,对需要识别的数据内容进行预分类,既可大大增加数据库内可识别的数据目标,又可保证迅速提取所需拨号内容,保证极高的识别率;同时并未增加太多的语音识别技术成本。这就最大限度地解决反应速度和识别准确度的矛盾,对语音识别技术在信息处理领域的实际推广起到巨大的作用。
本实用新型的目的可以这样来达到设计、制造一种分组寻址语音识别式信息处理装置,包括机体和电路;尤其是所述信息处理装置按软件程序P运行;所述电路又包括语音识别处理器、语音信息存储器、麦克风输入、语音输出和分组寻址地址分配器。
附图简要说明


图1是本实用新型分组寻址语音识别式信息处理装置的总体结构框图;图2是所述信息处理装置电原理图;图3是所述信息处理装置电话号簿实施例一键式专用分组指定按键分组键设置示意图;图4是所述信息处理装置分类翻译机实施例分步选择式双按键分组键设置示意图;图5是所述信息处理装置电话号簿实施例单键轮选式分组键设置示意图;
图6是所述信息处理装置电话号簿实施例多键直选分组键设置示意图;图7是所述信息处理装置电话号簿实施例位选开关式分组键设置示意图;图8是所述信息处理装置语音识别软件程序P流程框图;其中图8-1是分组判断流程;图8-2是语音识别软件的学习流程;图8-3是语音识别软件的命令识别流程。
一种分组寻址语音识别式信息处理装置,包括机体8和电路;尤其是所述电话装置按软件程序P运行;所述电路又包括语音识别处理器1、语音信息存储器2、麦克风输入3、语音输出4和分组寻址地址分配器6。
所述电路还包括键盘输入5。
所述机体8上装有分组寻址按键9,可设置在机体8面板上或侧面。
一些实施例中,所述分组寻址按键9为直接分组按键,有三至八个。将使用者的电话号码分为工作、朋友、亲戚等等分组并可直接印在键粒上。要拨出电话时,先按下所在组别的键,再呼叫存在其中的电话主人的名称,即可迅速快捷地拨出所要的电话号码。按照使用习惯或具体安排,所述分组寻址按键9可设置在机体8面板上或左、右侧,例如图6所示的面板右边。在通常状态下,按“亲戚”键,由喇叭或LCD提示“亲戚”;按“朋友”键,提示“朋友”;……。依此类推,直接选定你需要查找的姓名所在类组。然后发出语音查找命令,迅速完成查找任务。
在其他的实施例中,还有如下不同的预分组实现方式所述分组寻址按键9设置成一键式轮选选择分组的专用按键。该实施方式下,设置一专用按键,按一下,轮选一组语音数据库,等候输入语音命令进行检索;再按一下,轮选下一组语音数据库。轮选语音数据库组数的多少,按需要设置。如图5所示即为在电话簿侧面板上设置的一键式轮选选择分组的专用按键。在通常状态下,按“分组”键,由喇叭或LCD提示“亲戚”;再按“分组”键,提示“朋友”;……。依此类推,选定你需要查找的姓名所在类组。
所述分组寻址按键9还可以设置成一键式分组专用指定按键;其指定对象为现有键盘键值。该实施方式下,设置的指定按键本身并不打开确定的语音数据库,而只是指定了现有键盘某些键的键值,随后按下这些键,才能打开具体的语音数据库。例如,指定“1”,“2”,“3”……或“9”数字键打开按重要性排列的不同的语音数据库;或指定字头缩写“Q”,“P”……字母键打开亲戚,朋友等不同的语音数据库。如图3所示为电话机面板上设置的专用指定按键“分组”键。在通常状态下,按“分组”键,由喇叭或LCD提示“请按数字键”;按数字“1”,提示“亲戚”;按数字“2”,提示“朋友”;……。
所述分组寻址按键9也可以采用组合型分步选择式双按键。该实施方式下,设置二个专用键,对应两级设置的数据库结构。其中一个键轮选一级数据库,另一个键轮选二级数据库。这种两键方式可快速选定一百个左右子数据库。所述分组寻址按键9采用组合型分步选择式双按键。如图4为在翻译机面板上设置的两个专用“分组”键,“分组一”和“分组二”。在通常状态下,按“分组一”键,由喇叭或LCD提示“当前的分组大类为购物类”;再按“分组一”,提示“当前的分组大类为食品类”……;“分组一”为食品类时,按“分组二”会提示“中餐类”;再按“分组二”会提示“西餐类”……。以此类推,直至选择到你所需翻译的类别。
所述分组寻址按键9还可以采用位选开关组式按键,每位开关可满足两组分组选择。如图7所示为无绳电话侧面板上设置的一组专用分组位选开关。其中一位开关可满足两组分组选择;如“亲戚”、“朋友”;两位开关可满足四两组分组选择;如“亲戚”、“朋友”、“同事”、“供货商”。三位可满足八组,依此类推。在通常状态下,通过设定开关,来选定分组;以3位开关为例

其中“0”代表该位开关为“On”的位置;“1”代表该位开关为“Off”的位置;同时在LCD上可以显示当前的分组情况。
所述分组寻址按键9按照不同的需求可设置成单键、双键或多个按键或位选开关。其目的就是将使用者的语音命令,即电话号码或翻译单词进行预分组。在进行语音识别前,先按下所在组别的键,再呼叫存在其中的语音信息,即可迅速快捷地执行下一步的动作,如拨出所要的电话号码或播放相应的翻译语言等。
实用中,利用本‘语音识别分组寻址方式’技术,可极大程度地解决响应速度和识别准确度这个矛盾。对语音识别技术的实际推广应用起到重要作用。
本实用新型的主要改进是采用分组概念,对需识别的语音命令进行预分类。既可大大增加可识别语音命令的组数,又可保证较高的反应速度和极高的识别率。各部分工作状况如下麦克风输入电路3将语音音频信号输入放大,用作提高麦克风输入灵敏度及提供足够强度电信号给后级语音识别处理器。
语音识别处理器1将语音信号数字化,跟原存入储存器数据信息相比较,把一致或相似的内容检索出来之后,语音处理结果存放于相似列表区,且把当前最相似信息输出。
语音信息存储器组2用于存储预制的、已存的和暂存的语音命令等信息,该装置可以根据实际应用来增加或减少存储器的数量,各存储器均为相同的存储电路。
键盘输入5用于用户选择操作模式、选择分组,完成各项操作。
喇叭输出4与麦克风输入装置一起,形成互动式的结构,给使用者提供一个友好的界面。
分组寻址地址分配器6由MCU/DSP或开关/跳线来控制选择正确的语音信息存储器,进行分组的语音识别的准备工作。
通常,根据用户选择设定模块语音信息存储器2的分组模式;语音从麦克风输入装置3输入,放大后送到语音识别处理器1;在语音识别微处理器内,进行模数转换及检索语音信息存储器2内含信息,进行比对;语音信息存储器2内的信息既可预制,也可后学、补充;根据比对的结果,可以得到同语音命令一致的信息,并由语音识别处理器1执行相应的动作;键盘模块5为辅助输入,选择分组;在不用语音识别时仍可完成一般控制器的功能;喇叭输出装置4可为使用者提供友好的听觉操作界面。
工作状态及信号流程如下在正常等待状态下,语音识别处理器即CPU根据用户的按键输入选择正确的语音信息存储器FlashROM。如果采取机械开关/跳线方式,则无须前述步骤,而由该机械开关/跳线组直接选择正确的FlashROM。
选择的办法通常可以采用控制FlashROM的片选脚来决定各FlashROM的工作状态;存储语音命令时,语音信息送入麦克风输入装置MIC,再送入CPU,在CPU中进行完语音处理后产生的数据,直接存入选中的FlashROM。
识别语音命令时,语音信息送入麦克风输入装置MIC,再送入CPU,CPU读出FlashROM中的各条语音信息,进行逐一地比对,产生结果,然后根据这一结果执行相对应的动作。
语音识别查询前,正确的FlashROM的设定十分重要,只有在选择正确的前提下,才能保证识别的正确性。
列举实例如下参见
图1、2的框图和原理图,本实用新型的一种实施例可以是“语音识别电话机或电话簿”。
所述语音识别电话机或电话簿的分组方法是该产品采用二个FlashROM作为语音信息存储器,最大可控制八个Flash Rom,每个FlashROM可存储60个语音信息命令人名;在产品说明书上告知使用者,如何进行分组。例如第一组为“亲戚”;第二组为“朋友”;第三组为“同事”;第四组为“业务”等等;用户可通过按键设定当前的工作组,CPU根据用户的输入,通过控制地址分配器6来选择正确的FlashROM,例如用户选择“亲戚”组,则CPU选通U5;用户选择“朋友”组,则CPU选通U6。其他选择,大体相同。
存储方法用户首先要明确你需保存的人名应放在哪个组,在正确选择好后;按“存储键”,有相应的声音提示用户输入语音命令例如人名,训练成功后,信息会存入相应的语音信息存储器。
识别方法用户首先要明确所需识别的人名在哪个组,在正确选择好后,按“识别键”,有相应的声音提示用户输入语音命令例如人名,CPU会从选定的存储器中挑出你所选的人名,并进行随后的一系列工作。
本实用新型另一应用还可以是一款“语音识别的翻译机”。
所述语音识别的翻译机分组方法为该产品采用八个FlashROM作为语音信息存储器,最大可控制八*N个Flash Rom,每个FlashROM可存储60个需翻译的单词;在产品说明书上告知使用者,如何进行分组。例如第一组单词为“食品类”;第二组单词为“问候类”;第三组单词为“交通类”;第四组单词为“购物类”等等;用户可通过按键设定当前的工作组,CPU根据用户的输入,通过控制地址分配器6来选择正确的FlashROM,例如用户选择“食品类”组,则CPU选通U5;用户选择“问候类”组,则CPU选通U6。其他选择,大体相同。
存储方法用户首先要明确你需翻译的单词应放在哪个组,在正确选择好后;按“存储键”,有相应的声音提示用户输入需翻译的单词,训练成功后,信息会存入相应的语音信息存储器。
识别方法用户首先要明确所需翻译的单词在哪个组,在正确选择好后,按“识别键”,有相应的声音提示用户输入需翻译的单词,CPU会从选定的存储器中挑出你所选的需翻译的单词,并将该单词对应的正确翻译播放出来,以及进行相应的一系列工作。
权利要求1.一种分组寻址语音识别式信息处理装置,包括机体(8)和电路;其特征在于所述电话装置按软件程序P运行;所述电路又包括语音识别处理器(1)、语音信息存储器(2)、麦克风输入(3)、语音输出(4)和分组寻址地址分配器(6)。
2.根据权利要求1所述的信息处理装置,其特征在于所述电路还包括键盘输入(5)。
3.根据权利要求2所述的信息处理装置,其特征在于所述机体(8)装有分组寻址按键(9),设置在机体(8)面板上或侧面。
4.根据权利要求3所述的信息处理装置,其特征在于所述分组寻址按键(9)为直接分组按键,有三至八个。
5.根据权利要求3所述的信息处理装置,其特征在于所述分组寻址按键(9)设置成一键式轮选选择分组的专用按键。
6.根据权利要求3所述的信息处理装置,其特征在于所述分组寻址按键(9)设置成一键式分组专用指定按键;其指定对象为现有键盘键值。
7.根据权利要求3所述的信息处理装置,其特征在于所述分组寻址按键(9)采用组合型分步选择式双按键。
8.根据权利要求3所述的信息处理装置,其特征在于所述分组寻址按键(9)采用位选开关组式按键,每位开关可满足两组分组选择。
专利摘要一种分组寻址语音识别式信息处理装置,包括机体(8)和电路;其特征在于所述电话装置按软件程序P运行;所述电路又包括语音识别处理器(1)、语音信息存储器(2)、麦克风输入(3)、语音输出(4)和分组寻址地址分配器(6)。该信息处理装置采用分组概念,对需要识别的数据内容进行预分类,既可大大增加数据库内可识别的数据目标,又可保证迅速提取所需拨号内容,保证极高的识别率;同时并未增加太多的语音识别技术成本。这就最大限度地解决反应速度和识别准确度的矛盾,对语音识别技术在信息处理领域的实际推广起到巨大的作用。
文档编号G10L21/00GK2585357SQ0229127
公开日2003年11月5日 申请日期2002年12月18日 优先权日2002年12月18日
发明者陈修志 申请人:陈修志
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1