用于在语音通信链路上提供标识信息的方法和系统的制作方法

文档序号：7598920阅读：157来源：国知局

专利名称：用于在语音通信链路上提供标识信息的方法和系统的制作方法
技术领域：
本发明涉及通信信道上的讲话者识别，特别涉及一种用于在通信链路上提供标识信息的方法和系统。
背景技术：
传统主叫线路标识(CLID)和关联显示终端在市场上已变得普及。已知的CLID业务传递与主叫电话线路相关联的电话薄号码、订户名称或企业名称而非主叫方的真实身份。如果被叫方认识主叫方，则主叫方的人识别必须依赖于验证主叫方的身份。然而，人识别的值受限于被叫方可能不认识主叫方这一事实。因此，已知的CLID业务不能可靠地提供可能假装的主叫方的确实身份。
因此，CLID肯定不能被假装，因为不管是谁实际上发出呼叫都传递相同CLID。例如，当家庭所有成员共享与订户号码相关联的相同CLID时，所显示的名称和号码不标识若干家庭成员中的哪一个正在进行呼叫。如果个人在远离其惯常电话的情况下如出差者在投币式公用电话、旅馆房间或者同事办公桌所发生的那样发出呼叫，则不传递主叫方的个人身份。
CLID信息使用频移键控(FSK)调制解调器音调(tone)在订户环路上传输。这些FSK调制解调器音调用来以美国信息交换标准代码(ASCII)的字符代码形式传输显示消息。显示消息的传输发生于第一和第二响铃之间。因此，一旦建立了呼叫，则不发送CLID数据。
同样地，CLID的前述问题在会议呼叫的上下文内被进一步加剧。对于会议呼叫，一旦每个参与者被连接，则可能难以让听者辨别讲话方的身份。这可能由于听者对讲话者不熟悉或者若干会议呼叫参与者的声音相像。由于在电话呼叫之前传输CLID，因此CLID极不适于解决该问题。

发明内容
本发明提供了一种用于向订户提供标识信息以及认证信息的方法、系统和设备。具体而言，不管是在建立电话呼叫之前还是在电话呼叫期间，呼叫参与者可提供某种标识符或代码。该代码可用来验证呼叫参与者的身份或者认证呼叫参与者。可以向订户提供指定该人是否被认证的信息。
本发明的一方面可包括一种用于在语音通信链路上提供标识信息的方法。该方法可包括在语音通信链路上从呼叫参与者接收个人标识代码，使用个人标识代码来确定呼叫参与者的标识信息，并且在由语音通信链路运载的语音流内对呼叫参与者的标识信息进行编码。因此，可以将语音流和标识信息发送给订户。
在本发明的一个实施例中，语音通信链路可以是电话通信链路。标识信息可表示呼叫参与者是否已被认证。标识信息和语音流可以是数字信息，使得标识信息嵌入在语音流内。例如，编码步骤可包括消除语音信号的不可听部分，并且在语音流内嵌入标识信息来代替语音信号的不可听部分。
该方法还可包括接收语音流和标识信息并且对标识信息进行解码。例如可向订户表现标识信息的表示。还可播放语音流的可听表示。在一个实施例中，可与表现标识信息基本上同时播放接收语音流的可听表示。
本发明的其他实施例可包括具有用于执行在此公开的各步骤的装置的系统以及用于使机器执行在此所述的步骤的可机读存储装置。

在附图中示出了本发明的优选实施例，然而，应当理解本发明不限于所示的特定方案和手段。
图1是示出根据在此公开的创新性方案的用于在嵌入数字信息内提供讲话者标识信息的系统的示意图。
图2是示出根据在此公开的创新性方案的在嵌入数字信息内提供讲话者标识信息的方法的流程图。
具体实施例方式
图1是示出根据在此公开的创新性方案的用于在嵌入数字信息内提供讲话者标识信息的系统100的示意图。如图所示，系统100可包括识别和认证业务(IAS，Identification and Authentication Service)105以及订户115和呼叫参与者120可在其上通信的通信网络110。通信网络可包括但不限于因特网、广域网、局域网、内部网和/或公共交换电话网络。
IAS 105可被实现为在信息处理系统内执行的计算机程序。例如，在一个实施例中，IAS 105可在通过适当网关接口在通信上链接到电话交换系统的计算机系统如服务器内执行。在这种情况下，IAS 105可位于具有电话交换系统的建筑物内，或者远离于该交换系统。在另一个实施例中，IAS 105可在电话交换机本身内执行。
IAS 105可被配置成在建立电话呼叫之前或者在呼叫期间加入电话呼叫，以认证呼叫参与者120。IAS 105的订户115可以有选择地让IAS 105认证主叫方如呼叫参与者120。例如，IAS 105可针对向订户115的特定呼叫来调用。确定何时要调用IAS 105可基于指定日期和时间的由订户115规定的规则，例如国庆节下午9:00之后，基于主叫号码是否被识别，或者基于其组合。另外，IAS 105可针对向订户115的所有呼叫来调用，或者可根据需要由订户115调用以验证任何呼叫参与者而不管是哪一个呼叫参与者发起了呼叫。
IAS 105可从呼叫参与者120接收标识信息，并且将该信息与所存储的认证数据进行比较。认证数据可存储在IAS 105内，或者可存储在与IAS 105在通信上链接的远程数据存储装置中。在任何情况下，基于由呼叫参与者120提供的标识信息与所存储的认证信息的比较，IAS105可认证呼叫参与者120以确定呼叫参与者120是否是所预期的那个人。
IAS 105可使用多种不同机制中的任一种对标识信息进行编码。例如，在一方面，IAS 105可被实现为类似于感觉编解码器的感觉音频处理器，以分析所接收的语音信号。感觉编解码器是人类听觉系统因此是人类听觉的限制的数学描述。感觉编解码器的例子可包括但不限于MPEG层3编解码器和MPEG层4编解码器。除了IAS 105可以但无需实现对于感觉编解码器而言是典型的第二压缩级这一显著区别之外，IAS 105基本上类似于感觉编解码器。
类似于感觉编解码器，IAS 105可包括源素材在本例中为来自呼叫参与者或讲话者的语音信号可与之比较的心理声学模型。通过比较语音信号与所存储的心理声学模型，感觉编解码器识别不太可能或者较不可能被听者感觉到的语音信号部分。这些部分被称作是不可听的。典型地，感觉编解码器在编码之前消除源素材的这些部分，同样IAS 105也是如此。然而，IAS 105可添加标识信息来代替被消除的源素材即语音的不可听部分。
另外，本领域的技术人员应当认识到本发明可利用任何适合的装置或技术来对标识信息进行编码并且将该数字信息嵌入在数字语音流内。同样地，本发明不限于使用一种特定编码方案。
图2是示出根据在此公开的创新性方案的在嵌入数字信息内提供讲话者标识信息的方法200的流程图。方法200可开始于呼叫参与者试图向订户发出电话呼叫的状态或者在呼叫参与者与订户之间建立了电话呼叫的状态。电话呼叫可以是传统地面通信线电话呼叫、无线或移动电话呼叫，或者基于网际协议的语音(VOIP)电话呼叫。
在步骤205，IAS可提示呼叫参与者输入个人标识代码。呼叫参与者可在步骤210提供个人标识代码。个人标识代码可作为一个或多个双音多频(DTMF)音调系列或者作为语音来提供。因此，不管是通过识别在DTMF输入的情况下所激活的键还是通过识别用户语音来确定与所接收的输入等同的文本，IAS都可解释所接收的个人标识代码。
在步骤215，IAS比较所接收的个人标识代码与所存储的认证信息。在一个实施例中，IAS可通过确定与呼叫参与者在其上提供了个人标识代码的通信链路相对应的电话号码来确定所接收的个人标识代码要与之比较的一组认证信息。例如，每个电话号码可与一个或多个用户简档相关联。每个用户简档可与电话线路或号码的若干家庭成员或者其他可能用户之一相关联，并且各自指定唯一个人标识代码。在另一个实施例中，IAS可首先向呼叫参与者询问标识符。该标识符可用来定位所存储的认证信息。在任何情况下，在定位了呼叫参与者的认证信息之后，IAS可比较所接收的个人标识代码与存储在认证信息内的个人标识代码。
在步骤220，IAS根据比较来确定呼叫参与者是否被认证。更具体地说，如果所接收的个人标识代码匹配存储在认证数据内的代码，则呼叫参与者被成功地认证。换句话说，呼叫参与者的身份被确定和认证。显然地，呼叫参与者的身份可以不是与呼叫参与者正在其上通信的线路或电话号码相关联的名称。
在步骤225，IAS可将呼叫参与者的标识信息编码到语音流内。也就是，标识信息可采用数字形式嵌入在电话呼叫的数字语音流内，从而产生嵌入了讲话者的数字标识信息的语音信号。在一个实施例中，标识信息可指定讲话者的身份。例如，标识信息可指定讲话者或呼叫参与者的姓名、地址、联系电话号码或者任何其他标识信息，其可以或可以不对应于呼叫参与者正在从其呼叫的线路。在另一个实施例中，标识信息可表示呼叫参与者是否被成功地认证或验证。
更具体地说，可以将标识信息作为嵌入在数字语音流内的数字信息的编码流发送给订户。IAS可以例如使用心理声学模型识别接收音频信号的哪些部分是不可听的。例如，人类往往在大约2kHz到4kHz之间具有灵敏的听觉。人类语音所占频率范围约为500Hz到2kHz。同样地，IAS可以消除语音信号的部分，例如，低于大约500Hz和高于大约2kHz的那些部分，而不使结果语音信号不可理解。这在电话信号内保留足够的带宽，在其内可将标识信息编码到数字语音流内并且进行发送。
IAS还可检测被其他声音有效地掩蔽或者使得不可听的声音。例如，IAS可识别语音信号部分由于感觉到的喧闹而被其他语音信号部分掩蔽的听觉掩蔽和/或语音信号部分由于语音信号内的声音定时而被掩蔽的临时掩蔽的情况。
应当理解，由于有关语音信号的哪些部分是不可听的确定基于心理声学模型，因此如果从语音信号中消除那些部分，一些用户将能够检测出差别。在任何情况下，信号的不可听部分可包括从IAS确定的、如果被消除不会使语音信号不可理解或者妨碍听者理解语音信号内容的那些语音信号部分。因此，在此公开的各种频率范围仅作为例子来提供，而不旨在限制本发明。
IAS可从语音信号中消除被识别的部分，即被识别为不可听的部分，并且添加标识信息来代替被消除的语音信号部分。也就是，IAS将语音信号的不可听部分替换为数字标识信息。如上所述，标识信息可包括但不限于可从讲话者语音确定的语音级别、压力级别、语音声调和/或感情状态。
在步骤230，IAS将具有编码和嵌入的标识信息的语音流发送到订户的接收设备。在步骤235，订户设备接收带有编码标识信息的语音流，并且在步骤240对标识信息进行解码。在步骤245，接收设备可以表现标识信息。例如，标识信息可以被可视地表现或者可以例如通过文本到语音转换系统被可听地播放。在步骤250，可以可听地播放语音流。在本发明的一个实施例中，标识信息的表现和语音流的播放可基本上同时发生。
在此公开的创新性方案仅是为了示例的目的而提供的。同样地，所提供的例子和在此公开的步骤次序都不应被解释为限制本发明。例如，如上所述，本发明可在电话呼叫之前或者在电话呼叫期间被调用。根据需要可以向呼叫参与者提示输入附加信息以定位所存储的认证数据并且执行身份认证。
本发明可以采用硬件、软件或者硬件和软件的组合来实现。本发明可以在一个计算机系统中以集中方式实现或者采用不同单元分散在若干互连的计算机系统之间的分布方式实现。配置成执行在此所述的方法的任何类型的计算机系统或者其他设备都是适合的。硬件和软件的典型组合可以是具有计算机程序的通用计算机系统，其中该计算机程序被装载和执行时控制计算机系统使得其执行在此所述的方法。
本发明也可嵌入在计算机程序产品中，其中该计算机程序产品包括使得能够实现在此所述的方法的所有特性，并且当被装载到计算机系统中时能够执行这些方法。本上下文中的计算机程序是指采用任何语言、代码或表示法的一组指令的任何表达，其中这组指令旨在使具有信息处理能力的系统直接地或者在下列操作的任一种或两者之后执行特定功能a)转换到另一种语言、代码或表示法；b)以不同素材形式再现。
本发明在不脱离其精神或基本属性的情况下可采用其他形式来实施。因此，应当参考所附权利要求而非前面说明书来表示本发明的范围。
权利要求
1.一种在语音通信链路上提供标识信息的方法，包括在语音通信链路上从呼叫参与者接收个人标识代码；使用个人标识代码来确定呼叫参与者的标识信息；在由语音通信链路运载的语音流内对呼叫参与者的标识信息进行编码；以及将语音流和标识信息发送给订户。
2.如权利要求1所述的方法，其中语音通信链路是电话通信链路。
3.如权利要求1所述的方法，其中标识信息表示呼叫参与者是否已被认证。
4.如权利要求1所述的方法，其中标识信息和语音流是数字信息，使得标识信息嵌入在语音流内。
5.如权利要求4所述的方法，所述编码步骤包括消除语音信号的不可听部分；以及在语音流内嵌入标识信息来代替语音信号的不可听部分。
6.如权利要求1所述的方法，还包括接收语音流和标识信息；以及对标识信息进行解码。
7.如权利要求6所述的方法，还包括表现标识信息的表示。
8.如权利要求7所述的方法，还包括播放语音流的可听表示。
9.如权利要求8所述的方法，其中与表现标识信息基本上同时播放接收语音流的可听表示。
10.一种用于在语音通信链路上提供标识信息的系统，包括用于在语音通信链路上从呼叫参与者接收个人标识代码的装置；用于使用个人标识代码来确定呼叫参与者的标识信息的装置；用于在由语音通信链路运载的语音流内对呼叫参与者的标识信息进行编码的装置；以及用于将语音流和标识信息发送给订户的装置。
11.如权利要求10所述的系统，其中语音通信链路是电话通信链路。
12.如权利要求10所述的系统，其中标识信息表示呼叫参与者是否已被认证。
13.如权利要求10所述的系统，其中标识信息和语音流是数字信息，使得标识信息嵌入在语音流内。
14.如权利要求13所述的系统，所述用于编码的装置包括用于消除语音信号的不可听部分的装置；以及用于在语音流内嵌入标识信息来代替语音信号的不可听部分的装置。
15.如权利要求10所述的系统，还包括用于接收语音流和标识信息的装置；以及用于对标识信息进行解码的装置。
16.如权利要求15所述的系统，还包括用于表现标识信息的表示的装置。
17.如权利要求16所述的系统，还包括用于播放语音流的可听表示的装置。
18.如权利要求17所述的系统，其中与表现标识信息基本上同时播放接收语音流的可听表示。
19.一种可机读存储装置，其上存储了具有可由机器执行以使该机器执行以下步骤的多个代码部分的计算机程序在语音通信链路上从呼叫参与者接收个人标识代码；使用个人标识代码来确定呼叫参与者的标识信息；在由语音通信链路运载的语音流内对呼叫参与者的标识信息进行编码；以及将语音流和标识信息发送给订户。
20.如权利要求19所述的可机读存储装置，其中语音通信链路是电话通信链路。
21.如权利要求19所述的可机读存储装置，其中标识信息表示呼叫参与者是否已被认证。
22.如权利要求19所述的可机读存储装置，其中标识信息和语音流是数字信息，使得标识信息嵌入在语音流内。
23.如权利要求22所述的可机读存储装置，所述编码步骤包括消除语音信号的不可听部分；以及在语音流内嵌入标识信息来代替语音信号的不可听部分。
24.如权利要求19所述的可机读存储装置，还包括接收语音流和标识信息；以及对标识信息进行解码。
25.如权利要求24所述的可机读存储装置，还包括表现标识信息的表示。
26.如权利要求25所述的可机读存储装置，还包括播放语音流的可听表示。
27.如权利要求26所述的可机读存储装置，其中与表现标识信息基本上同时播放接收语音流的可听表示。
全文摘要
一种在语音通信链路上提供标识信息的方法可包括在语音通信链路上从呼叫参与者接收个人标识代码，使用个人标识代码来确定呼叫参与者的标识信息，并且在由语音通信链路运载的语音流内对呼叫参与者的标识信息进行编码。可以将语音流和标识信息发送给订户。
文档编号H04M3/38GK1642203SQ200410087968
公开日2005年7月20日申请日期2004年10月27日优先权日2003年12月15日
发明者托马斯·E·克雷莫, 皮尤什·杰斯瓦尔, 维克托·S·摩尔申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：托马斯.E.克雷莫;皮尤什.杰斯瓦尔;维克托.S.摩尔
技术所有人：国际商业机器公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。