数字秘书的制作方法

文档序号：7568640阅读：252来源：国知局

专利名称：数字秘书的制作方法
电话应答机一般允许从被叫方重放录下的消息，并录下主叫的消息，可以按键序列的形式提供许多选项，允许主叫连到一系列可能的被叫方中特定的一个，另外，也可提供许多话音菜单以帮助主叫选择可能的选项。例如，AT&T公司的AUDIX系统就允许这种选项，可以根据主叫选择的被叫方或选项来定制录下的响应消息。但是，如果被叫方希望应答前屏蔽掉呼入的呼叫，目前这种可能性是有限的，例如，我们知道可以使用一个专用号码，在允许访问被叫方之前让主叫方从按键盘输入这个号码，但这需要事先在主叫方与被叫方间做好安排，而这在许多情况下是不方便的，而且易引起丢失或误键入号码等许多问题。我们已知道可使用呼入的电话号码或语音识别来验证主叫的身份。这些技术一般可由软硬件的多种组合在数字系统中实现。但是，语音识别要求对语音识别系统进行非常多次的训练以达到足够的精度。
语音识别已使用在移动电话中，其中当说出一个特定词组时就拔打对应的电话号码以提供免提拔号的功能，语音识别和语音合成也应用于个人计算机(PC)中，例如，可训练的语音识别已经用来实现各种计算机操作的控制，如拷贝一个文件或启动一个应用执行等。文本到语音的合成也应用于许多应用中，在这些应用中PC的操作员敲入或输入文本。典型的应用包括读入较长的文挡或说出简单请求以输入要求的数据等。但是，目前的语音识别技术还只局限于不依赖于讲话者发音的相对较少数目的单词，这些单词可以被较精确地识别出，特别是在较低成本系统中实现这种技术更是如此。而且系统识别一个给定单词的时间对于在许多交谈场合中要求很快的反应而言是过分地长了，特别是在识别技术是在低成本系统中实现的情况更为突出。
我已经发明了一种电话应答机和方法，它们使用语音识别以确定主叫是否为所能接受的预定义主叫列表中的一员。主叫列表可用多种输入技术生成，包括在被叫方语音输入，或用键盘或图形界面输入。如果主叫确定为列表中的一员，机器允许呼叫沿第一顺序进行，它一般包括了向被叫话机振铃，如果被叫话机不应答，第一顺序就经主叫方提供一个用以响应的定制消息。如果主叫确认为不是列表中的一员，机器允许呼叫沿第二顺序进行，它一般包括响应以一个标准的录音消息。在这两种情况下，主叫一般都可以给被叫方留下一段消息。也可提供其它的列表，比如用来确定呼叫的内容。

图1显示了发明的技术的一个典型系统实现图。
图2显示了实现发明的典型序列。
以下的详细描述涉及电话应答机和其使用方法。本发明的技术允许数字应答机根据主叫身份来屏蔽呼叫，也允许被叫根据主叫的身份留下相应的可播放的定制消息，一个典型的操作顺序如下所示，其中如果要求的话，步骤1和2可以在激活系统在线前脱机执行。
1.控制应答机的人员(被叫方)生成一个“允许接收呼叫”的列表，它包括了特定的单个人或多个人，并指明仅当特定的一个人发出呼叫时，被叫方才被提供给一个呼入呼叫的指示，允许接收呼叫的列表也可由被叫方通过应答机的麦克风说话或键入或图形界面选择的方法来生成。
2.被叫方可以进一步地指明当允许呼叫列表中的人呼叫时播放一段特定的(定制的)消息。
3.接收呼入的呼叫。应答机应答，要求主叫方标明身份。
4.主叫方说明自己的姓名。
5.应答机分析主叫方所说的姓名并确定所说的名字是否在允许接收呼叫列表中。
6.如果主叫方不在允许接收呼叫列表中，则应答机要求主叫方留言。
7.如果主叫方在允许接收呼叫列表中，应答机给被叫方提供呼入呼叫的指示(如振铃该话机)。
8.如果在步骤7被叫方没有应答，应答机播放一段录好的消息，它可以包括在步骤2给这个主叫提供的定制消息，应答机进一步要求主叫方留言。
虽然以上给出了代表性的操作序列，仍然可以包括另外的选项或忽略一些选项，这将在以下讨论。注意到步骤5对主叫方身份的分析并不要求象在目前许多语音识别应用中非常高速的软硬件，因为只需要在相对包含较少单词的列表(允许接收列表)中比较出一些所说的单词(一般为一个或二个单词的名字)。在大多数情况下，允许接收列表只有100个名字或更少，经常只有12个名字或更少。这样只要低价的软硬件就可以应付了。另外，在步骤5允许用于分析和制定的时间可以达到数秒钟，这可以通过当进行分析时，对应答机编程让其播放“请等待”或其它一些短消息的简单方法来实现。这类似于当话务员应答电话时所期待的回答，就允许实现分析功能的软硬件的组合成本较低。
本发明的一个典型系统实现在图1中所示，其中电话线100连至一部具有麦克风102和扬声器103的话机101。该话机实现基本的电话功能，包括拔号和向/从电话线发送/接收音频和振铃信号，及任何必需的2-4线混合转换。话机101也可包括一个用于把模拟语音转换为数字脉冲编码调制(PCM)格式和相反转换的CDDEC15。话机101连至一个包括了语音分析器105和语音合成器106的应答机104，在这里使用的术语“语音分析器”和“语音生成器”指的是实现给定功能所必需的硬件和软件。在多数情况下，语音识别和语音生成功能共享硬件，而仅需对软件稍做修改来用于实现特定功能。语音分析器和语音合成器最好使用数字信号处理器(DSP)技术来实现。本领域中已知有许多软硬件组合以实现这些功能，任何以所要求价格和复杂性达到合适性能的技术都可用于实现本发明。
应答机也包括程序内存109和消息内存110，它们可以是物理上分离的或共享一块内存空间。程序内存一般为只读内存(ROM)107，但也可以是电可擦除可编程的只读内存(EEPROM)以用来进行版本更新。程序内存也可包括随机存取内存(RAM)109以加快运行速度。消息内存110可以包括用于存储去话消息的ROM、EEPROM或RAM，及用于存储来话消息的RAM或EEPROM。它也可包括这里所指的一些或所有的“录音通知”，虽然如果需要的话它们中的一些可以永久地存贮在ROM中。在应答机领域使用“音频RAM”(ARAM)也是熟知的技术，ARAM是指允许有很少缺陷比特的RAM，这样就可使用低价的集成电路内存芯片。去话消息和通知可以任何合适的数字化语音格式，一般是一种压缩格式存贮以减少内存空间。去话消息和通知也可以例如ASCII格式存贮，这就允许从键盘和其它输入装置输入要求的信息。
“允许接收呼叫列表”保存在内存111中，而主叫的身份，以语音分析器确定的主叫名字的数字表示形式存贮在内存112中。使用一个数字比较器108来比较存贮在内存112中的主叫身份和内存111中的允许接收呼叫列表。在以下描述的许多其它功能可以使用另外硬件(没有画出)或在许多情况下另外的软件来实现，软件一般都存贮在以上提到的程序内存和消息内存中。DSP、程序ROM和比较器(105，106，107，108)可以集成在第一块集成电路上，其它内存(109，110，111，112，113，114)如果需要的话可以集成在第二块集成电路上，当然其它划分方案也是可能的。
注意到如果需要的话，方框101和方框104的所有功能可以包括在单一的组合话机/应答机中，并且麦克风102和/或扬声器103也可包含在其中。或者，电话机功能可在与应答机分离的单元中实现。如果需要，电话的功能可以包括在个人计算机中，例如麦克风和扬声器可以包括在视频监视器中。应答机的功能可以很方便地使用在PC主板或作为外插部件的内存和逻辑电路来实现。虽然可以使用以上指明的标准的模拟电话，但也可使用包含模数和数模转换器的数字话机，例如，可以使用ISDN(综合业务数字网)话机，或是一部连到宽带网或Internet网上的话机。如果需要的话，可以修改传统模拟话机提供的振铃和呼入呼叫接收功能。例如，可以提供一种可视的“振铃”显示，并且对特定的实现，呼入呼叫可由特定数字比特序列而不是模拟振铃电压来识别。
在图2显示了典型的操作顺序的流程图。接收到一个呼入呼叫(200)并向主叫方发送问候(201)，通过在应答机中提供一个时钟，使问候可以是时间相关的(“早上好”或“下午好”)，然后一般说出被叫方的名字(“Smith先生的电话”)。问候之后，发送一个查询主叫方姓名的消息(“谁在呼叫？”)。一旦接收了主叫的姓名语音识别硬/软件就分析这个名字(202)。分析的结果与在允许接收呼叫列表中的名字比较，如果匹配的话就设置一个标志。如果需要求，PCM格式的主叫名也可转换为另一种格式(ASCII等)以用于字母数字显示。注意到如果分析软/硬件足够快，就可在说出名字的同时实时地进行音频分析。但是，现在所使用的典型分析技术，一般要求暂时存贮数字格式的名字的音频波形以便于稍后可执行分析。分析的结果接着数字地与一般也是以PCM格式表示的允许接收呼叫列表中的名字相比较，如果匹配，提供一个呼入呼叫的指示，一般是给话机振铃(204)。此后，如果在预定的时间或振铃次数后应答了呼叫(205)，就可以进行通话了，通话的最后，被叫方挂机(206)，应答机被重置以等待另一次呼入呼叫(200)。
在上述的步骤203，如果主叫的名字不在允许接收呼叫列表中，将提供一个预先录制的通知(“Smith先生无法应答”)(207)，然后可提供一个选项让主叫留言。这个选项可以用多种方式实现，如在嘟嘟声后开始留言。另外，可以按键以指明对这个要求回答是“Yes”或“No”。如果留了言，需要的话，可以向主叫提供一个选项以修改录下的消息(209)，在录音之后，或如果没有留言，需要的话，被叫方可以提供一个预先录制的通知(“谢谢，再见”)，就可挂上电话(210)。
在以上的步骤205中，如果被叫没有摘机，就可决定是否应向主叫提供一个特殊消息(211)。该判定是根据在以上步骤202确定的主叫身份而做出的，如果不提供特殊消息，则提供一个标准的留言请求(207，208)，上述流程继续进行。如果提供了特殊消息，就给主叫播放(212)。特殊消息可以是留给允许接收呼叫列表中的所有主叫的单个消息，但它也可为给单个主叫的定制消息，因为上述的步骤202已经确定了主叫的身份，如果需要的话，消息可以是为一组主叫定制的，比如用于通知会议的参加者会议的时间和地点的变化。如果向特定的用户播放特殊消息，这个事实可以存贮在与消息相关的标志中，这允许被叫方确定是否可以检索消息。接着要求主叫留言(213)，如果要录下消息，流程继续沿步骤209执行；如果不留言，流程沿步骤210继续执行。如果需要的话，从允许接收呼叫列表中的主叫来的消息可以做上标志以便于与其它消息分开地检索，例如，在方框209可以在主叫姓名和内容上加上标志。
话机挂机后，应答机回到呼叫等待状态(200)。注意到当应答机没有正在处理呼叫时，可以对上述功能或通知编程。这可由脱机编程提供(214)，脱机编程可由多种方法实现。例如，当向允许接收呼叫列表中输入信息时，被叫方可以简单地说出名字输入到列表中，前面提到的语音识另软/硬件可以用来把名字转换成合适数字格式。注意到由于在本发明的技术中语音识别软/硬件一般是与说话者发音无关的，所以这是可能的。另一种输入名字的技术是从键盘敲入名字，也可使用图形界面，从存贮的目录中指定所需要的名字。另一种技术中，包含各名字的文件可以输出到列表中。也应注意到可以用同样的方式从列表中删除名字。另外，上面提到的任何通知和特殊消息在应答机不处理呼叫时是可以修改的，选项也可以修改。虽然术语“脱机”用来指明在简单系统中用于执行编程步骤214的合适的时间，但在合适的系统中当正在处理呼叫时(应答在线)时仍可以完成编程工作。
对于以上描述的本发明的各种功能而言，很明显还有许多功能没有包括。例如，在播放特殊消息前，可以进行附加的对主叫话音的分析以鉴别主叫的真伪。这种鉴别在本发明技术中较容易实现，因为对电话振铃(步骤204)所需要的时间可用于对以前存贮在数字内存的主叫的话音波形进行进一步分析。另一种选项利用了在识别步骤后识别为允许接收呼叫列表中一员的主叫方的名子可被保存在内存中。然后被叫就可以通过话音或其他方法询问应答机是否特定的一方发出了呼叫(“John Smith发出呼叫了吗？”)。这个信息可以很容易地用合成话音或可视指示给出，如果需要的话，可以提供更多的信息，如呼叫的时间和日期(存贮在内存114中)和主叫是否留言。如果留了言，被叫方可以播放消息。这时，主叫方的留言可以任何要求的顺序检索出来，不一定以消息接收的时间顺序检索。被叫方也可要求应答机读出自从该机激活后允许接收呼叫列表中所有发出呼叫的主叫的名字。
除了以上描述的根据主叫名字识别主叫外，也可进行语音识别以确定给定呼叫的主题和内容，即应答机可以查询呼叫的特性，如果呼叫者说出了特定的单词，应答机就采取特定的行动。例如，如果查询呼叫的特性并呼叫者说出了单词“紧急情况”，呼叫就转发到一部便携式电话而不是被录下来。另一个例子是，如果响应呼叫者说出的单词“水管2”或“电工”的查询，就可向被叫方的住处或办公地点的话机发出特殊的消息。另外，应答机可以包括合适的软硬件以允许被叫可选择地播放包含一个或多个给定内容单词的消息。例如，被叫方可以播放包含单词“职工会议”的所有呼叫，当以上述类似的方式对应答机编程时，被叫方可以输入可被识别的查询和单词，存贮在内存113中的相应数据如图1所示。因此，“呼叫内容”列表可以包括识别呼叫主题的单词。如果需要的话，呼叫内容和允许接收呼叫列表都可存贮在单一内存中，也可使用本发明的技术进行一些改进。
权利要求
1.电话应答机其特征在于一个呼叫识别器(101)用于确定存在一个呼入呼叫，和一个语音发生器(105)用于提示主叫姓名；一个语音识别器(106)用于把主叫姓名转换为可和存贮的名字列表比较的数字表示形式；一个可以接受的存贮姓名列表(111)；一个比较器(108)用于比较主叫名字的数字表示和存贮的名字列表；一个指示器以向被叫方指明给定的主叫名字在存贮的名字列表中；和一个录音机用于录下主叫方的消息。
2.权利要求1的电话应答机，其中所述的应答机包括一个语音发生器用于当所述指示器指明主叫在存贮名字列表中时，向所述呼叫者播放特殊消息，并当所述指示器指明主叫不在存贮名字列表中时播放标准消息。
3.权利要求1的电话应答机，其中所述应答机包括装置用于播放从给定主叫来的消息。
4.权利要求2的电话应答机，其中所述应答机进一步包括用于给在所述存贮名字列表中的一个特定主叫定制特殊消息的装置。
5.权利要求1的电话应答机，其中所述应答机包括内容单词的存贮列表，从而确定呼叫的内容。
6.权利要求1的电话应答机，其中所述应答机包括用于提供所有留言的主叫者的名字的装置。
7.权利要求6的电话应答机，其中所述应答机进一步包括用于播放选定的主叫的消息的装置。
8.权利要求1的电话应答机，其中所述应答机包括用于确定一个给定主叫是否已经检索了一个消息的装置。
9.权利要求1的电话应答机，其中所述应答机包括一个呼叫内容单词的存贮列表。
10.权利要求9的电话应答机，其中所述应答机包括用于播放具有一个给定内容单词的消息的装置。
11.权利要求1的电话应答机，其中所述应答机包括一个提供了麦克风和扬声器的电话机。
12.权利要求1的电话应答机，其中所述电话机是一个包括了2-4线混合变换器的模拟电话。
13.如权利要求1的电话应答机，其中所述电话机是一个包括模/数转换器和数/模转换器的数字电话。
全文摘要
电话应答机和所使用的方法利用了语音识别以从可能的主叫的预定义的列表中识别出一个主叫方。该列表可由各种输入技术产生，包括在主叫位置的话音，键盘或图形输入技术。如果识别出主叫在列表中，应答机就允许呼叫沿第一顺序进行，包括振铃被叫电话。如果识别出主叫不在列表中，应答机使呼叫沿第二顺序进行，包括用标准录音消息响应。无论哪种情况，通常允许主叫给被叫留言，也可提供附加的预定列表，以确定呼叫的内容。
文档编号H04M1/64GK1140371SQ96102329
公开日1997年1月15日申请日期1996年6月19日优先权日1995年6月29日
发明者普拉默德·瓦桑特·阿格达申请人:美国电报电话Ipm公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：普拉默德.瓦桑特.阿格达
技术所有人：美国电报电话公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。