具有话音识别功能和话音识别系统的数据终端的制作方法

文档序号：7583701阅读：145来源：国知局

专利名称：具有话音识别功能和话音识别系统的数据终端的制作方法
技术领域：
本发明涉及具有话音识别功能和话音识别系统的数据终端，更具体地说，涉及一种具有话音识别功能的手提数据终端和话音识别系统。
近来，手提电话机中采用了话音识别功能，无需操作10个按键。话音识别是通过话筒叫出对方目的地的地名进行的。
在这种手提电话机中，待识别的话音预先通过话筒存入。产生经识别与所寄存的相同的话音时，就根据这个话音进行通话或类似的操作。
这类手提电话机可在任何作为其服务区的地方使用，因而可用于嘈杂的地方或噪声电平高的地方。在这种情况下，进行通话或其它同类的操作时，环境噪声或噪声可能加入从话筒输入的话音中，这可能会导致检测不出所输入的话音是否与预先存入的话音一致或错误判断所输入的话音与不同的话音一致。
解决这个问题可能的作法是在噪声电平高的地方存入有待话音识别的字，也可以在判断出有噪声输入时终止话音识别操作。
用上述其中一个方法，即使在环境噪声电平高的情况下也能避免错误识别话音。但起动话音识别操作之后在嘈杂的情况下要避免错误识别话音是不可能的，这是要把手提电话机的话筒再移近嘴巴些或将扬声器触及耳朵以聆听扬声器发出的话音造成的后果。在后一种情况下，需要进行话音识别启动操作，再次启动话音识别操作。
本发明的目的是解决上述问题，提供一种话音识别功能提高的手提数据终端和话音识别系统。
本发明的另一个目的是提供一种能改善话音错误识别可能性的手提数据终端和话音识别系统。
本发明还有另外一个目的，即提供一种能避免因突然出现噪声或因重新抓住终端而产生的噪声而引起的错误识别话音的手提数据终端和话音识别系统。
按照本发明的一个实施例，本发明提供的手提数据端包括一个话筒，供输入话音；一个存储器，供事先存储话音识别字；和话音识别装置，供对话筒输入的话音进行话音识别并读出所输入话音相应的话音识别字；话音识别过程中检测出不是话音的噪声时，话音识别操作就受阻。
手提数据终端还包括寄存装置，供预先寄存准备在噪声中提取的模式。
手提数据终端还包括通知装置，供检测出非话音的噪声时通知禁止话音识别操作。
在本发明的手提数据终端中，非话音噪声的检测是从话音识别开始的时刻起在预定时间内进行的。
按照本发明的另一个实施例，本发明提供的识别所输入的话音的话音识别系统，其中待识别的字和预定的噪声是作为识别主题和噪声预先寄存的，当识别出所输入的话音为所述噪声时，就不进行话音识别，或忽略不计识别结果。
按照本发明的另一个实施例，本发明提供的识别所输入的话音的话音识别系统，其中待识别的字和预定的噪声是作为识别主题和噪声预先寄存的，识别操作是在经过预定时间之后进行的，当识别出所输入的话音为所述噪声时，就不进行话音识别或者忽略不计识别结果。
在这种话音识别系统中，当识别出所输入的话音为所述噪声时，再次进行识别操作，而当识别出所输入的话音为所述噪声时，识别结果就显示出来，或以话音的形式发出。
在这种话音识别系统中，话音识别是在预定时间内进行的。
下面参看

，从这个说明可以清楚地看到本发明的其它目的和特点。
图1是作为本发明典型手提数据终端的手提电话机的结构图。
图2是本发明一个实施例的操作流程图。
图3是本发明另一个实施例的操作流程图。
现在参看

本发明的一些最佳实施例。
图1是作为本发明典型手提数据终端的手提电话机的结构图。本发明并不局限于手提电话机，它适用于任何可在流动状态下使用、具话音识别功能的终端，例如，适用于PHS、传呼机和电子笔记本。
参看图1。从图中看到，本发明由以下各部分组成无线电部分11，给基地台(图中未示出)发送无线电信号，和从基地台接收无线电信号；操作部分12，促使手提电话机工作，并启动话音识别操作；显示部分13，供显示数字、字符等；主CPU14，控制整个手提电话机并控制话音识别LSI；话音识别部分15；模/数转换器16，就话音识别部分15的话音数据进行模/数变换；话筒17；和场声器18，在话音识别开始时产生开始信号，并以话音形式产生识别结果。
话音识别是通过按压操作部分12中的一个话音识别启动按键启动的。按压操作部分12中的话音识别启动按键时，主CPU14就检测此话音识别启动按键受按压的情况，并给话音识别部分15发送话音识别启动指令。话音识别部分15收到主CPU14来的启动指令时，对话筒17来的话音进行话音识别操作。话筒17来的话音信号在模/数转换器16中转换成数字，然后输入话音识别部分15中进行话音识别。作为话音识别用的识别字，用户借助按键操作部分往操作部分12中输入想使用的字，不然也可从话筒以话音的形式输入。
除用户寄存的想使用的识别字外，检测噪声引起的误操作用的识别字则由主CPU14寄存入话音识别部分15中。这个寄存操作最好在手提电话机装运之前进行。可能引起错误识别的噪声有突然产生的诸如碰撞声(例如“乒乓”声)之类的碰撞声，和为在紧接话音识别开始之后从话筒输入话音而移动或重新抓住手提电话机时而产生的噪声或搬动声。在这类噪声中提取的字模式事先作为识别字寄存。识别话音时识别出这些噪声时，错误识别用户产生的话音的可能性极大。因此，在此情况下，发出通知，表明不能进行话音识别。
具体地说，在识别话音时突然有噪声从话筒输入时，防止(检测)噪声引起的误操作的识别字经过识别，通过识别出噪声的信息就从显示部分13输出。前面说过，在紧接话音识别开始之后为从话筒输入话音而移动或重新抓住手提电话机而产生的搬动声或噪声可能会引起误操作。因此，从话音识别开始的时刻起的几秒钟内识别出防止噪声引起的误操作的识别字时，就没有识别结果输出给显示部分13。取而代之的是CPU14再次给话音识别部分15发送出话音识别启动指令启动话音识别操作的程序。这样，就再次启动对话筒17输入来的话音进行话音识别的操作，这为的避免紧接话音识别开始之后产生的噪声引起的误操作。
现在参看图1和图2说明本发明适当实施例的操作过程。按压操作部分12中的话音输入按键时，主CPU14检测出话音输入按键受按压就给话音识别部分15发出话音识别开始指令。这里，话音识别部分15中识别的识别字是那些由用户从操作部分12输入的字、那些由用户按需要设定和从话筒17输入的字和那些由CPU14存入的防止噪声引起的误操作的字。话音识别开始时(步骤21)，计时器就开始计时(步骤22)。
计时器测定出T秒的时间过去时(步骤23)，就进行话音识别的正常操作(步骤28)，即对从话筒17输入的话音进行识别。话音识别结果经检定合格时就输出给显示部分13和扬声器18，从而以话音形式宣布话音识别结果。
当识别出防止噪声引起的误操作的识别字时，显示部分13上就显示出识别出非那些寄存在识别词典中的识别字的信息。当在计时器测定出的时间T秒过去之前话音识别结果经检定合格时(步骤24)，CPU14就进行检测，看话音识别结果是用户按要求寄存的字或防止噪声引起的误操作的字(步骤25)。
当话音识别字为用户按要求寄存的字时，就将话音识别结果发布出去，即将其输出给显示部分13显示出来，并输出给扬声器18以话音形式宣布结果(步骤27)。当话音识别结果为防止噪声引起的误操作的字时，主CPU14就再次给话音识别部分15发出话音识别开始指令，从而再次启动话音识别操作(步骤26)。
当计时器在话音识别开始之后开始计时在计出的时间T过去之前识别出防止噪声引起的误操作的字时，话音识别就继续再开始下去直到用户按要求设定的话音识别字经检定为话音识别结果为止。这样就能避免重新抓住手提电话机或紧接着话音识别开始之后移动手提电话机产生的搬动噪声或噪声引起的误操作。
现在参看图3说明本发明的第二实施例。按压操作部分12中的话音输入按键时，主CPU14检测出话音输入按键受按压就给话音识别部分15发出话音识别开始指令。话音识别开始时(步骤31)，计时器开始计时(步骤32)。计时器计出的T秒时间过去时(步骤33)，就进行话音识别的正常操作(步骤38)，即对从话筒17输入的话音进行识别。
识别结果经检定合格时输出给显示部分13和扬声器18显示出来并以话音的形式宣布识别结果。当识别出防止噪声引起的误操作的识别字时，显示部分13上就显示出识别出非那些寄存在识别词典中的识别字的信息。计时器计出的T秒时间过去之前话音识别结果就检定合格时(步骤34)，CPU14就进行检验，看话音识别结果为用户按需要寄存的字或防止噪声引起的误操作的字(步骤35)。当话音识别结果为用户按需要寄存的字时，就确认话音识别结果，即给显示部分13和扬声器18输出识别结果，将结果发布出去(步骤38)。
当话音识别结果为防止噪声引起的误操作的字时，就通知用户再启动话音识别操作(步骤36)。为此，显示部分13上就显示出通知重新启动话音识别操作的信息，并使扬声器18发出重新启动话音识别操作的话音。主CPU还再次给话音识别部分15发出话音识别开始指令，从而重新启动话音识别操作(步骤37)。
计时器在紧接着话音识别开始之后开始计时计出的T秒时间过去之前识别出防止噪声引起的误操作的字时，就通知用户再次启动话音识别操作，于是话音识别操作重新启动，进行话音识别操作直到检验出用户按需要设定的话音识别字为话音识别结果为止。这样就能避免因重新抓住手提电话机或紧接着话音识别开始之后移动手提电话机产生的搬动声或噪声引起的误操作。
在上述实施例中，可以显示出通知识别出那些非寄存在话音识别词典中的字的信息。
前面说过，按照本发明，防止噪声引起的误操作的字和那些由用户按需要寄存的字一样，都寄存起来。当紧接着话音识别开始之后识别出防止噪声引起的误操作的字时，话音识别操作就自动再次启动起来，这为的是防止紧接着话音识别启动之后的错误识别。这样就能避免紧接着话音识别开始之后错误识别话音，从而可以提高识别效能并进一步方便了话音识别操作。
此外，按照本发明，由于识别出防止噪声引起的误操作的话音识别字而在话音识别开始之后重新启动话音识别操作时，就通知用户再次启动话音识别操作，因而重新启动话音识别操作时，可将此举通知用户，从而可在话音识别操作重新开始时检测出字的最前部，从而提高重新启动时的识别效能。
在不脱离本发明范围的前提下，本技术领域的一般技术人员是可以在结构上进行修改并提出各种不同的修改方案和实施方案。上述说明和附图中提到的内容仅仅是举例说明而已，因此上述说明应视为举例说明而不是对本发明的限制。
权利要求
1.一种手提数据终端，包括一个话筒，供输入话音；一个存储器，供事先寄存话音识别字；和一个话音识别装置，供对从话筒输入的话音进行话音识别，并读出所输入话音相应的话音识别字；在进行话音识别时检测出不是话音的噪声时，话音识别操作受阻。
2.如权利要求1所述的手提数据终端，其特征在于，还包括一个寄存装置，供预先寄存在噪声中提取的模式。
3.如权利要求1或2中的一项所述的手提数据终端，其特征在于，还包括一个通知装置，供检测不是话音的噪声时通知话音识别受阻。
4.如权利要求1至3中任一项权利要求所述的手提数据终端，其特征在于，不是话音的噪声的检测是在话音识别开始的时刻起的预定时间内进行的。
5.一种话音识别系统，供识别输入的话音，其中待识别的字和预定的噪声作为识别主题和噪声预先寄存起来，当识别出所输入的话音为噪声时，就不进行识别或忽略不计识别结果。
6.一种话音识别系统，供识别输入的话音，其中待识别的字和预定的噪声作为识别主题和噪声预先寄存起来，识别操作是在过了预定时间之后进行的，当识别出所输入的话音为噪声时，就不进行识别或忽略不计识别结果。
7.如权利要求5或6中的一项所述的话音识别系统，其特征在于，识别出输入的话音为噪声时，再次进行识别操作。
8.如权利要求5或6中的一项所述的话音识别系统，其特征在于，识别出输入的话音为噪声时，显示出识别结果或以话音形式宣布识别结果。
9.如权利要求5或6中的一项所述的话音识别系统，其特征在于，噪声识别在预定时间内进行。
全文摘要
通过在操作部分12操作开始话音识别,即识别从话筒17输入的话音。该操作由话音识别部分15进行。识别结果经检验合格就在显示部分13显示出来,且使扬声器18以话音的形式输出识别结果。为避免移动手提电话机产生噪声时误操作,在通过在操作部分中操作启动话音识别操作之后从话筒17输入通过重新抓住手提电话机产生的搬动声,寄存为避免噪声引起的误操作的识别字,而在识别开始之后识别出防止噪声引起的识别字时,再次自动启动话音识别。
文档编号H04B15/00GK1256571SQ9912481
公开日2000年6月14日申请日期1999年11月12日优先权日1998年11月12日
发明者盐野胜美申请人:日本电气株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：盐野胜美
技术所有人：日本电气株式会社
我是此专利的发明人

上一篇：具有部分字符集发生器的交互式电视系统的制作方法
上一篇：综合业务数字网交换器用户的信息处理方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。