一种语音录入电话号码条目的方法及其装置的制作方法

文档序号：7883727阅读：221来源：国知局

专利名称：一种语音录入电话号码条目的方法及其装置的制作方法
技术领域：
本发明涉及一种电话系统中呼叫用户的方法及其装置，特别是涉及一种采用语音方式录入电话号码簿条目(人名/地名及电话号码)的方法及其装置。
背景技术：
固定电话通常不带有专门的电话号码簿，所带有的简单电话号码存储功能，只是将若干个电话号码与某几个固定的数字健对应起来。当所需存储的电话号码数量很多时，使用者很难记住电话号码和数字健的对应关系，因此现有固定电话的号码储存方式不符合人们的使用习惯。
极少数带有电话号码簿的固定电话，其电话簿的输入通常通过按键或手写拼音的方式输入相关人名，地名等信息。对于大多数没有显示屏的固定电话，采用按键输入相当繁琐，而采用手写输入方式则需要额外添加价值不菲的手写板，增加了固定电话的成本。即使有的固定电话带有液晶显示器，在光线不好的情况或对于视力不好的人，如盲人、老年人，使用按键或手写拼音的方式输入人名/地名等信息也是困难的。
采用语音方式录入电话号码条目的装置如中国实用新型专利，申请号00206200.3，公开号2415556，名称为“语音识别查寻拨号电话簿”，通过一个外带装置来实现语音识别查寻拨号固定电话的电话号码，较好的解决了固定电话储存电话条目难的问题。该实用新型由中央处理器、动态存储器、静态存储器、AD转换、键盘、麦克风、微型扬声器，拨号电路组成语音识别拨号电路，语音识别拨号电路、显示驱动集成电路相连，能对输入的语音姓名及其电话号码进行储存、识别，并控制模块显示和自动拨号。但是，该实用新型所述的电话簿装置语音识别精度不高、也没有涉及语音识别中需要考虑的容错性，如果使用者发音不清、粘连、含糊或所述的电话簿保存有多个发音相近似的标签、条目时，该电话簿对人名或地名的语音识别就会出现很大的错误。此外，该电话簿与电话之间需要特定的接信盒连接才能工作，也给使用者带来了不便。

发明内容
本发明的目的是为了克服现有固定电话语音电话簿装置对语音录入的电话号码条目识别精度不高、容错性不强等缺点，提供一种改进的语音录入电话号码条目的方法及其装置。
为了实现上述目的，本发明采取的技术方案一种语音录入电话号码条目的方法，在接收用户语音输入后执行语音输入的结果，所述方法包括下列步骤(a)提示用户将待输入的人名或地名词组分解为孤立字读入一个语音电话号码簿装置；(b)提示用户在读入所述孤立字的语音后为该字加注音调；(c)监控语音识别器按照一定规则给出的多个语音识别候选项目并反馈给用户，提示用户在上述多个语音识别候选项目中选择其一作为结果；(d)一个电话号码条目完整录入后，控制所述语音电话号码簿装置将组成该条目的人名/地名通过语音合成输出再次反馈给用户，用户确认无误后输入电话号码。
一种实现上述方法的语音电话号码簿装置，其特征在于所述装置中设有对语音数据进行处理的中央处理器，所述中央处理器通过多功能接口卡连接语音录入/输出装置，通过接口卡连接电话机数字键盘和电话机，所述中央处理器的中间运算过程在内部存储器中进行，需调用的语音识别处理程序和地址簿数据保存在快速闪存中。
本发明的有益效果是，所述的一种用于提高语音电话号码簿识别精度的方法通过合理断字、在语音输入后加注音调，以及系统模糊识别人工筛选最终结果等步骤，大大提高了语音识别电话条目的精度和容错性。实现本发明所述方法的语音电话号码簿装置为一种嵌入式系统，可直接放入电话机中不改变电话原有外形和大小。所述方法及其装置改变了用户拨打电话的传统方式，使用户免去了打电话查找电话簿的繁琐过程，用户只需对电话说出需拨的人名或地名即可将对应号码拨出，使用户拨打电话非常方便。本发明利用电话本身就有的语音录入装置通过一个多功能接口卡连接一个中央处理器，该中央处理器能够根据内置程序识别语音录入的人名或地名数据，并通过按键或语音识别的方式将对应号码输入到装置的快速闪存中去，从而产生电话号码簿条目。本发明所述方法及其装置均采用SI(Speech Independent)语音识别技术，基于与说话人语音无关模式，可实现一人录入，多人使用。多数固定电话工作环境通常噪音较移动电话小，语音识别技术可以得到很高的识别精度，另外家庭或社团组织使用的固定电话的多个使用者通常有相同的通话对象，因此，本发明特别适用于固定电话中的语音电话号码簿应用。

图1是语音识别电话号码簿装置结构示意图；图2是语音识别电话号码簿装置语音录入子系统流程图；图3是语音识别电话号码簿装置语音拨号子系统流程图；图4是语音识别电话号码簿装置修改子系统流程图。
具体实施例方式
下面结合附图对本发明具体描述一种语音录入电话号码条目的方法，在接收用户语音输入后执行语音输入的结果，所述方法包括下列步骤(a)提示用户将待输入的人名或地名词组分解为孤立字读入一个语音电话号码簿装置；(b)提示用户在读入所述孤立字的语音后为该字加注音调；(c)监控语音识别器按照一定规则给出的多个语音识别候选项目并反馈给用户，提示用户在上述多个语音识别候选项目中选择其一作为结果；(d)一个电话号码条目完整录入后，控制所述语音电话号码簿装置将组成该条目的人名/地名通过语音合成输出再次反馈给用户，用户确认无误后输入电话号码。步骤(b)中，用户通过若干个定义的电话机按键输入音调。步骤(c)中所述反馈包括电话机显示屏的文字显示或语音合成器的语音播放。步骤(c)中所述一定规则指多个语音识别候选项目按照语音识别器给出的识别置信度得分从高到低降序排列。步骤(c)中用户可以自定义由语音识别器给出的语音识别候选项目的数量。步骤(c)中用户可以通过数字按键或语音录入二种方式输入电话号码。所述语音录入电话号码条目的方法进一步包括用户对结果项目的修改和删除。所述语音录入电话号码条目的方法进一步包括电话机来电号码为某条结果项目对应的电话号码时语音合成器将语音播放该结果项目。
一种用于实现所述方法的语音识别电话号码簿装置，其特征在于装置中设有对语音数据进行处理的中央处理器6，所述中央处理器6通过多功能接口卡5连接语音录入/输出装置1，通过接口卡4连接电话机数字键盘2和电话机3，所述中央处理器6的中间运算过程在内部存储器7中进行，需调用的语音识别处理程序和地址簿数据保存在快速闪存8中，如图1所示。
所述语音电话号码簿装置可以分为三个子系统，分别命名为录入子系统，拨出子系统和语音号码簿的修改子系统。其中录入子系统，有“语音识别+按键方式”和“全语音识别”两种工作方式。这两种方式都将通过语音识别技术录入地址簿中的人名/地名。由于所输入的人名/地名可能是任意文字的组合，为避免连续读入人名/地名造成的字间语音变化以及识别系统做语音分割造成的识别率下降，录入时将人名/地名条目分解成孤立字，而后语音输入的方法提高识别率；录入子系统中，人名/地名的录入是一次性的工作，正确录入后反复使用，长时间不需变化，因此不影响系统的易用性。为缩小语音识别系统的搜索范围，通过对所录入语音加音调的方法，提高录入识别率；加音调指在用语音输入每个字后通过按键方式输入4种不同的键的方式实现。录入子系统中，语音识别器给出多个语音识别候选项目而不仅仅是一个最可能的语音识别候选项目，多个语音识别候选项目的次序是按照识别置信度得分最高的字到识别得分最低的字降序方式排列，这里指的多个语音识别候选字中的多个通常不多于6个。录入子系统中开始是逐字录入，并及时由语音反馈当前录入所对应的可能的多个字由用户选择；当人名或地名的全部字录入完成后，再通过语音合成反馈读出这个词组。在拨出子系统中，当用户说某个人名/地名时，根据识别结果，系统有可能给出数个候选条目(这种可能出现在当语音电话号码簿装置中储存有多个发音相似读音的条目时)，此时的条目是由多个字组成的词。所有的语音识别候选字通过语音合成后，按照识别置信度得分从高到低依次播出。如电话机带有显示屏也可通过显示屏给出文字信息，最终由用户通过按键或语音指令从多个语音识别候选项中选择语音识别的结果项目。这种由系统模糊识别最后由用户人工筛选的方法提高了语音录入的准确度和整个系统的容错性。
所谓“语音识别+按键方式”强调通过语音录入电话号码条目中的人名/地名信息，通过电话机数字键盘按键录入电话号码对应的数字。其工作流程为用户通过语音录入/输出装置1逐个输入人名/地名的孤立字的语音，并通过电话机数字键盘输入该字的声调，中央处理器6对输入的声音数据进行特征提取，通过内置程序进行语音识别，给出识别序列，由用户通过按键选择确定最终识别结果。当整个人名/地名录入完成后，用户按下电话机规定的确认键并输入该语音对应的电话号码，中央处理器6将上述语音和电话号码作为一个电话号码条目存入地址簿对应的快速闪存8中，然后播放整条电话号码条目的语音供用户再次判断该语音对应的电话号码是否正确，如正确则完成该项电话号码的语音输入，如不正确则进入语音号码簿修改子程序，如图2所示。
相应的用户操作流程如下1.按下语音电话号码簿装置中的“条目语音录入”功能键，，逐个读入需录入的人名、地名的孤立字。
2.松开“条目语音录入”功能键，通过数字键盘键入录入字的声调。键入声调完成后，语音识别引擎开始识别人名、地名。
3识别完成后，识别系统给出识别结果序列，通过语音反馈依次播出(先播出最可能的识别结果)，由用户选出最终识别结果。选择的方法可以是在某个字播出后立即按预先定义的确认键(如某数字键‘1’，后功能键‘#’等)，也可在全部候选序列播出结束后选序号得到。
4每个字输入完成后，系统提示是否继续语音录入字，用户通过语音回答‘是’，则继续录入，回答‘否’或‘不是’则系统完成该条人名/地名的录入。
5.通过按电话原有的数字键输入人名、地名所对应的电话号码。
6.输入结束后，语音电话号码簿装置可通过功能键，或预先定义的时间延迟判断是否输入结束语音电话号码簿装置，语音反馈确认子系统再次请用户确认所输入人名/地名的全部孤立字是否识别正确。并用第二步相同方法得到用户反馈。如用户确认整个电话条目正确，该条目录入成功，否则，提示用户重新录入，或放弃录入该条目。重新录入和放弃选择都可通过按数字键或语音识别方法得到。
所谓“全语音识别方式”是指通过语音录入电话号码条目中的人名/地名信息，并再次通过语音读入的方式录入电话号码对应的数字。其工作流程大体与上述“语音识别+按键方式”的工作流程相同，但第3步中的电话号码录入也通过语音识别方法完成。两种方法相比较，“语音识别+按键方式”准确性更高，工作更可靠，且这种方式不需要对电话机增加额外设备，容易被用户接受。
拨出子系统的工作流程为用户通过语音录入/输出装置1输入声音，中央处理器6对输入的声音数据进行特征提取，根据内置程序进行语音识别，并根据识别置信度得分给出置信度最高的前几个候选识别条目。识别系统根据给出前几个置信度最高的候选项的识别置信度，判断地址簿中是否有相似读音的条目。如果前几个候选项的置信度差别不大则表明地址簿中有相似读音的条目；如第一候选的置信度明显高于其他候选，则地址簿中不存在相似读音条目。如有相似读音条目存在，则系统通过语音合成技术将给定数目的候选识别条目反馈给用户(语音合成通过所述语音录入/输出装置1实现)，由用户选择最终结果。如识别系统得到的首候选识别结果得分明显高于其他候选结果，则系统直接将首候选作为最终识别结果。当用户在候选序列中得不到所需人名/地名时，给系统反馈要求重输入或放弃语音拨号。当识别系统给出用户所需的条目后，用户按下电话机规定的确认健，中央处理器6将从快速闪存8中调取地址簿地址条目数据，通过接口卡4和相应的数模转换将对应该语音的电话号码通过电话机拨出，如图3所示。相应的用户操作流程如下1.用户按下语音电话号码簿装置“语音拨号”功能键，对电话语音输入传感器说出需拨的人名、地名。
2.再按语音电话号码簿装置“语音拨号”功能键，语音识别系统开始识别，得到结果。
3.通过语音反馈确认子系统反馈识别结果，由用户确认最终识别结果。可用与录入子系统相同的确认方法由用户确认识别结果。
4.用户确认正确，拨出系统将号码簿中与该人名、地名对应的电话号码拨出。否则，提示用户重新读人名、地名，或放弃拨号。重新录入和放弃选择都可通过按数字键或语音识别方法得到，如图3所示。本专利的拨出系统并不影响传统的电话拨出方法。
当号码簿中存在多个相似读音的条目时，拨出子系统可采用语音识别器给出由用户自定义的语音识别候选项目数量，如2条或3条若干人名/地址条目，用户在其中选择其一。
其中语音电话号码簿修改子系统可以采用两种工作方式，如图4所示1.浏览方式，从某一位置开始读出电话簿条目，当遇到需要修改的条目时，按电话的功能键进行删除，修改电话号码等工作。
2.查询方式，和拨出方法相同，语音输入号码簿中的人名或地名，用户可以确认是拨出号码还是修改该条目。
当电话机来电号码为某条结果项目对应的电话号码时语音合成器将播放该结果项目的合成语音，从而实现电话振铃为带有人名的铃声，这是另外一种方式的来电显示，增加了电话的附加值。
权利要求
1.一种语音录入电话号码条目的方法，在接收用户语音输入后执行语音输入的结果，其特征在于，所述方法包括下列步骤(a)提示用户将待输入的人名或地名词组分解为孤立字读入一个语音电话号码簿装置；(b)提示用户在读入所述孤立字的语音后为该字加注音调；(c)监控语音识别器按照一定规则给出的多个语音识别候选项目并反馈给用户，提示用户在上述多个语音识别候选项目中选择其一作为结果；(d)一个电话号码条目完整录入后，控制所述语音电话号码簿装置将组成该条目的人名/地名通过语音合成输出再次反馈给用户，用户确认无误后输入电话号码。
2.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(b)中，用户通过若干个定义的电话机按键输入音调。
3.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(c)中所述反馈包括电话机显示屏的文字显示或语音合成器的语音播放。
4.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(c)中所述一定规则指多个语音识别候选项目按照语音识别器给出的识别置信度得分从高到低降序排列。
5.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(c)中用户可以自定义由语音识别器给出的语音识别候选项目的数量。
6.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(c)中输入电话号码的方式为数字按键录入。
7.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于步骤(c)中输入电话号码的方式为语音录入。
8.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于所述方法进一步包括用户对结果项目的修改和删除。
9.根据权利要求1所述的一种语音录入电话号码条目的方法，其特征在于所述方法进一步包括电话机来电号码为某条结果项目对应的电话号码时语音合成器将语音播放该结果项目。
10.一种语音电话号码簿装置，其特征在于装置中设有对语音数据进行处理的中央处理器(6)，所述中央处理器(6)通过多功能接口卡(5)连接语音录入/输出装置(1)，通过接口卡(4)连接电话机数字键盘(2)和电话机(3)，所述中央处理器(6)的中间运算过程在内部存储器(7)中进行，需调用的语音识别处理程序和地址簿数据保存在快速闪存(8)中。
全文摘要
本发明公开了一种语音录入电话号码条目的方法及其装置，所述方法包括将需要录入的词组分解为孤立字、在录入孤立字后为该字加注音调、提示用户在多个语音识别候选项目中选择，最后通过数字按键或语音方式输入电话号码。用于实现所述方法的语音电话号码簿装置，装置中设有中央处理器、多功能接口卡、以及语音录入/输出装置，所述装置与电话机集成并连接电话机的数字键盘，所述装置的中间运算过程保存在内部存储器中，需调用的语音识别处理程序和地址簿数据保存在快速闪存中。本发明提高了语音电话号码簿识别的精度和容错性，使用户免除了拨打电话时查找电话簿的繁琐过程，给用户带来了方便。
文档编号H04M1/26GK1612209SQ200310108238
公开日2005年5月4日申请日期2003年10月29日优先权日2003年10月29日
发明者何佩娟, 王飞申请人:何佩娟, 王飞

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何佩娟、王飞
技术所有人：何佩娟、王飞
我是此专利的发明人

上一篇：门铃手机通讯装置的制作方法
上一篇：Gsm/gprs无线模块内嵌tcp/ip协议栈的实现方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。