用于远程访问自动语音/说话人识别的服务器的便携式声接口的制作方法

文档序号：2820540阅读：412来源：国知局

专利名称：用于远程访问自动语音/说话人识别的服务器的便携式声接口的制作方法
此申请涉及名为“使用非声学与/或声学模型和数据库进行说话人确认/识别/分类的装置和方法”的申请(08/871784)，它与本申请共同转让，并同时提出申请。
本发明涉及自动语音/说话人识别(ASSR)，特别是用一个便携式声学耦合器或接口，在诸如电话线的通讯信道上远程访问一个ASSR服务器的一种ASSR技术。
2.相关的现有技术的讨论在典型的客户/服务器或用户/提供服务方系统中，中心服务器或提供服务方中的资源可被多个客户或用户访问，因此要采用某种形式的客户/用户鉴别技术以证实该客户/用户是系统的合法使用者。在许多这样的系统中，诸如PIN，关键词，或口令这样的鉴别码是通过键入鉴别码或以文本方式传送给操作者的的方式来传送的。在某些系统中，鉴别码以声音的方式来传送，即，鉴别码是读入服务器的。服务器(在此情况下是ASSR服务器)识别语音的发音，并与存储的合法声音鉴别码相比较以鉴别使用者是合法的客户。
在ASSR服务器/客户系统中，如果一个客户能够通过声音在诸如电话线这样的通讯信道的传输来远程传送其鉴别码将会非常方便，使任何用户在有电话线的地方就可以访问服务器。电话线可以是有线电话线路或无线电话线路。在无线电话的情况下，访问服务器是完全便携的，也就是说，无论何时何地，只要有一部无线电话和无线连接就可以访问。
与如上所述的电话传送的ASSR系统有关的操作上的困难包括(1)当声音数据通过电话线传送时，由于声音数据的衰减而造成的精度的降低；(2)用户端变化的背景噪声特性，这种特性依赖于用户呼叫时所用电话的位置，比如，当呼叫者正使用街道上的电话或在驾驶的汽车上呼叫，等等。这些情况导致数据或信号的完整性的降低，并进一步导致在语音/说话人识别中精度的严重下降。
如果在信号通过电话线被传送到服务器之前在用户端进行语音信号预处理(SSP)，数据丢失与识别精度下降的问题可以被减弱或消除。SSP包括表征传送装置、环境、说话人以及通讯信道的声学特征。SSP的信息被ASSR服务器处理以设置基准，选择适当的解码模型和算法来识别说话人，或者通过对信道传递函数和背景噪声的建模来对语音解码，从而减少语音的误识别率，或精确地完成说话人识别的任务。但是，为了在用户端执行SSP的任务，需要SSP设备，它包括配有SSP软件的一台计算机。在当前的标准电话或网络计算机(NC)中，都不具备这种SSP能力。
因此，需要有一种便携式的SSP设备，这种设备体积小，重量轻便于携带，可以与任何电话或数据通讯装置相连接，并且具有当经由通讯线路访问ASSR服务器，以及与服务器交互的整个过程中，易于精确地识别说话人的能力，以及在便携式SSP装置和ASSR服务器之间进行精确的语音识别通讯的能力。
发明概要本发明的示例性的实施方案包括一个便携式SSP装置，该SSP装置包括一个用于把包括语音、无声和背景噪声的声音信号转换为模拟信号的麦克风；一个用于把模拟信号转换为数字信号的模数转换器；一个数字信号处理器(DSP)，用于从数字信号产生表示语音的特征向量数据和表示无声和背景噪声信号的特征数据；一个耦合器，用于与一个声学或数据通讯装置相连接，以便在通讯信道上传送表示特征向量数据的信号，从而通过远程的ASSR服务器对语音进行识别。此耦合器最好是一种声耦合器，可把特征向量数据转换为声信号，在此情况下，通讯信道也是声学意义上的信道，如电话线。另一方面，耦合器还包括适当的接口，例如，连接器、端口及协议，用于与数字化的传送装置相连接，以在数据通讯信道上传送。
便携式SSP装置最好包括一个给特征向量数据加密的加密装置，以及一个用于压缩特征向量数据的压缩装置。便携式SSP装置最好包括一个用于接收和处理从ASSR服务器返回的信号的装置，以及把返回的信号转换为数字化的返回信号，以供DSP处理的装置。在此优选实施方案中，DSP还包括用于对数字化的返回信号进行解压的装置以及对数字化的返回信号进行解码的装置。
便携式SSP装置最好还包括一个使得易于对包括与说话人、无声和背景噪声有关的声学特征的通讯信道的传递函数进行估计的装置；最好是它通过给连接在远程信道上的ASSR服务器发送一组估计值参考信号。便携式SSP装置包括用于存储包括该装置特有的加密密码数据或鉴别数据的数据在内的数据存储器。
本发明的另一个示例性的实施方案包括一个ASSR系统，该系统具有一个便携式SSP装置，该SSP装置包括一个数字信号处理器(DSP)，用于处理读入麦克风的数字化的语音并产生表示语音的特征向量数据；一个耦合器，用于与连接于诸如电话线或数字通讯网络的连接端的通讯信道的通讯装置相连接，并将特征向量数据变换为信号以便在通讯信道上传送；以及一个连接于通讯信道的自动语音/说话人识别(ASSR)服务器，用以接收从便携式SSP通过通讯信道传送过来的信号，并处理接收到的信号，以便对语音进行识别。
系统中的ASSR服务器包括预存储的注册或鉴别数据的模型。此模型是在用户或客户注册时建立的。ASSR模型也存储词表和其他模型，例如语言模型与隐马尔可夫模型(HMM)，以用于语音识别。ASSR服务器处理从便携式SSP装置接收到的信号，并将处理信号与存储模型进行比较。
更有利的是，由于具有远程说话人识别能力，按照本发明的示例性的实施方案的系统提供了远程智能卡或磁卡驱动/关闭或者口令或PIN码修改与重新生效的能力。
另外，按照本发明的示例性的实施方案的远程语音识别系统为ASSR提供了甚至在不利的信号传送或严重信号畸变的通讯环境中低错误率大词汇量的语音识别能力。
附图简述本发明的优选实施方案将参考附图在下面详细描述，其中

图1示意了按照本发明的一个优选实施方案的便携式语音识别装置；图2是按照本发明的另一个示例性实施方案，带有图1所示装置的系统的方框图；图3是按照本发明的另一个示例性实施方案，带有图1所示装置的另一个系统的方框图；图4示意了按照本发明的示例性实施方案的系统在智能卡PIN鉴别/重置系统中的应用。
优选实施方案的详细描述图1所示是按照本发明的示例性实施方案的便携式语音信号预处理(SSP)装置99的一个方框图。麦克风100用于接收包括使用者所说的语音，无声及背景噪声在内的声音，并把声音转换为模拟电信号。麦克风100与模数转换器110相连，该模数转换器把来自麦克风100的模拟电信号转换为数字信号以馈送给数字信号处理器(DSP)120来处理。DSP120最好包括一个处理器和相关的存储器，以及预存的程序，用于处理数据并控制在便携式SSP装置99中的数据流。在本实施方案中，DSP120的功能包括把读入麦克风100的语音数据预处理为特征向量，处理无声及背景噪声数据以帮助建立或估计通讯信道的传递函数，并执行其他的ASSR功能，包括协调便携式SSP装置的数据传送与接收，加密/解密，如果必要的话还有数据的压缩/解压。这些功能与通讯信道传递函数的估计在下面将进一步描述。注意，对于上述的DSP功能或技术，每个对技术有一般熟悉程度的人都是了解的，并且有多种市场上可以买到的DSP都可被用于执行那些功能。例如，由德州仪器公司制造的TMS32010模块，由日本电子公司制造的UPD77720都适用于上述应用。
由DSP120处理后的数据被输出到声学耦合器150上，在其间数字信号被转换为音频信号。因此，从声耦合器来的音频信号可以被播放或读入诸如一个标准电话听筒这类音频通讯装置，用于在一个诸如电话线的音频通讯信道上传输。按照这个优选实施方案，声耦合器150包括一个把数字信号转换为音频信号的变换器和一个适用于与接收器或标准电话听筒的相连接的耦合器。例如，声耦合器的连接部分最好用柔性材料制作，如橡胶，柔性材料可以使声耦合器与标准电话配置的送话口牢固地相连或相配合，以便使便携式SSP装置99与标准电话设备可容易地连接或分离，无论用户在哪里，都使得便携装置从一部电话到另一部电话的携带和移动更为容易。便携式装置最好用电池自行供电。可以看出，便携装置的基本组件包括麦克风，模数转换器，DSP，耦合器与电池，它体积小而重量轻。便携装置可以是手持式的，或者用户可以像袋装计算器或皮夹一样把它装在口袋里。
再参考图1，加密装置130和压缩装置140是便携式ASSR装置99的可选择组件。加密装置130，可以是连接于DSP120的分立式芯片或模块，也可以是DSP120的一个组成程序，它用预先建立的密钥对DSP120预处理后的数据加密，用以提供在电话线上信号的保密处理。密钥可能是与用户有关的密码。DSP120最好在特征向量流中加入已知的信号，用于ASSR服务器200的处理。如果这个信号对于ASSR服务器200是已知的，而且是所期望的，附加信号就可被轻易地抽取出来，并且从服务器到客户的逆过程更为简单。例如，在无线通讯中，可使用信号的扩展谱调制。多种其他已知的加密技术或算法都可被用于加密/解密过程。例如，参考1996年Wiley出版的Bruce Schenier的《应用密码学》第二版中描述的加密算法。
压缩装置140是DSP120的可选择组件，它有可能是DSP120外部的组件或芯片，也有可能作为DSP120的一个预存储程序功能被包含在DSP120中。压缩装置140对预处理后的数据进行压缩，无论这些数据是加密的，还是未加密的，压缩完后再在电话线上的传输，其目的是在给定的电话线的低带宽条件下，增加所传输的由音频信号所携带的数据量。信号压缩技术也是众所周知的。压缩装置140最好执行无损压缩。
来自麦克风100的数字化信号的预处理包括产生表征被读入麦克风100的语音模式的向量序列的已有技术。例如，专利号为5,544,277的美国专利就描述了这样一类预处理技术。专利号为5,544,277的美国专利的公布在此包含作为参考。另外，DSP120处理无声和背景噪声数据以产生环境数据并通过电话线把这些数据馈送给一个ASSR服务器来处理。ASSR服务器最好被安排在一个中心位置，并与电话线或一个数字网络相连接以便通过任意电话或联网的工作站进行方便的访问。
按照本发明的另一个优选实施方案，DSP120协调从ASSR服务器经通讯线路到便携式SSP装置99的音频数据的接收。从ASSR服务器过来的音频数据包括询问进一步信息的提白或用户指令。在这个示例性实施方案中，声耦合器150包括一个接收器，这个接收器在形状和大小上都非常像用于与电话机的听筒相连的声耦合器的发送器。另一个扩音器可能与听筒或耦合器接在一起来播放收到的消息。DSP120包括可选择的预存储程序功能，如果加密和压缩过的数据从ASSR服务器传过来的话，能够对接收到的数据解压和解密。声耦合器150的接收器部分把从电话的听筒中接收过来的音频信号转换为数字信号用于DSP120的处理。
一个利用本发明的便携式SSP装置的系统在图2中说明。ASSR服务器200最好位于远离便携式SSP装置99的中心的位置，并且是可通过电话线用电话访问的。一旦建立了连接，即把便携式SSP装置99与ASSR服务器200连接起来了，一个语音/说话人识别系统就建立起来了。ASSR服务器与便携式SSP装置99进行通讯从而通过读取在用户端的当前无声与背景噪声，建立或估计通讯信道的传递函数。通讯信道的传递函数的估计技术也是众所周知的。例如，请参阅Prentice Hall在1987年出版的B.C.Kuo的《自动控制系统》，以及Mc Graw Hill在1988年出版的J.V.Candy的《信号处理现代方法》。下面，将描述按照本发明的一个示例性过程。DSP120在传输或通讯开始时产生不同的数据。这些不同的信号是具有已知特性的上升或下降的线形调频脉冲，一系列等间隔的带符号的音调与一个白噪声信号。序列宽度与信号之间的间隔被很好地建立起来。便携装置99一接收到从服务器200过来的输入音调信号就会产生。信号被产生两次。一次从DSP120产生，一次从麦克风100产生。服务器200接收到的声音信号与预先建立的参考信号进行比较并且信道与背景的传递函数被推断出来，产生信道的特征(signature)。这个特征用于对语音特征向量的解卷积。ASSR服务器最好包括用于语音或说话人识别的ASSR预存程序。例如，如果声学特征处于相应的状态，代表lefemes的隐马尔可夫模型(HMM)被用于描述观察到的声学特征的概率，并以最优路径来识别语音的发音。概率可以通过这样的方式来被训练，即用录制好的训练语音来与HMM匹配并由此更新概率。例如，专利号为5031217和5276766的美国专利描述了使用HMM和其他模型的语音识别技术。这里这些公开的专利被包括在内作为参考。按照本发明的示例性实施方案的ASSR服务器刻画了用户端的无声和背景噪声的特性。在用户无声期间或在如上所述的DSP120发送参考信号期间，它最好能考虑在连接开始时的背景噪声的存在。背景噪声由麦克风100所检测，由DSP120处理并在参考信号的第二部分之后发送。ASSR服务器200用这些信息来推断背景噪声并由此修改对接收到的输入向量的处理(例如，通过平均倒谱减法，解卷积，等)。另一方面，针对这种情况训练好的语音或说话人识别预存模型被启用。类似地，无声的时间段也被检测，并且与句子之间和用户说话之前的无声部分相联系的声音特征优选被用来估计背景噪声。
更为有利的是，本发明的示例性实施方案中的ASSR系统同时完成说话人与语音识别的功能。说话人识别可被用于远程访问ASSR服务器。最好，本发明的示例性ASSR系统以后台任务方式基本上连续地处理通讯数据，以便确认在一个对话过程中说话人的存在。
到目前为止，按照本发明的ASSR装置和系统在图示的说明中，通讯装置为一部电话，通讯信道为一条电话线，并且ASSR服务器与电话线相连接。通讯信道由一条数字通讯信道组成，如因特网(Internet)，企业内部网(Intranet)或局域网也在本发明的构想内。因而，ASSR服务器200可通过电话或数字网络来访问。图3说明了带有一台多媒体计算机160的作为与服务器200接口的便携装置99。在这个实施方案中，电话的听筒被包括一个麦克风和一个扬声器的多媒体计算机160所替代。声耦合器150的接收部分被安置在计算机扬声器的附近位置，声耦合器150的传送部分被安置在计算机麦克风的相近位置。计算机160包括一个调制解调器，用于通过电话线传输数据或通过一个因特网服务器300与服务器200相连接。如果因特网服务器300像服务器200一样包括ASSR能力，可以在计算机160和因特网服务器300之间建立一个ASSR系统或连接。在本实施方案中，多媒体计算机用作为音频通讯装置。
另一方面，便携式SSP装置99可以通过一个连接器连接到计算机上的一个或多个I/O端口。在这样的实施方案中，声耦合器150可以省去，因为从DSP120过来的数据可被直接送到计算机的处理器中。按照本发明的的另一个实施方案，多媒体计算机160可以是一台将上述便携式SSP装置99的各组件内置的便携式膝上型多媒体计算机。因此便携式膝上型多媒体计算机能够执行所有由便携式SSP装置99执行的功能。便携式膝上型计算机可以通过一个调制解调器或通过因特网服务器300与ASSR服务器直接相连，这种连接，例如，可通过诸如TCP/IP，NET BUI等协议来完成。
仍按照本发明的另一个实施方案，便携式SSP装置99的功能和组件可以内置于一部便携式电话。这样，便携式SSP电话包括DSP120，并且与ASSR服务器200的连接以及对它的访问就可以通过便携式电话的通讯信道来进行，这种通讯信道可能是模拟的，也可能是数字的(比如说，码分多址(CDMA)，全球通(GSM)，等等)。
更为有利的是，由于在便携式装置99中，具有前述的对从ASSR服务器而来的数据进行接收，解密或解压的能力，便携式装置99可以接收各种数据以执行解密或鉴别的功能。例如，在本次与通讯期间，接收密钥来对接收到的信号解密；接收曲奇(Cookies)用于确定密钥的有效长度，密码卡上的PIN的有效长度，等等；此前接收的数字检验码或预先收到的鉴别检验码，用于鉴别用户直到它们过期为止；接收噪声模式用于屏蔽或中断屏蔽噪声；以及接收智能卡上的PIN数字或码，它们与表征PIN终止日期的曲奇一起，是用智能卡的嵌入芯片所编码的内容的一部分，或者是在信用卡类型卡的磁区域上编码内容的一部分。所接收的数据被存在DSP120的存储器。通过已知的技术，一个与便携式装置200相连的接口可用于对DSP120的读/写/再编程。
因此，本发明的示例性装置和技术可被用于鉴别，重设或取消用户或客户的口令，注册，PIN，以及/或者加密/解密的密钥。这些任务可在一个智能卡或者有磁区域的卡上远程执行。
按照本发明的示例性实施方案的系统在智能卡鉴别/PIN重新设置系统中的一个应用在图4中说明。
智能卡的初始化在一个典型的智能卡系统中，一个智能卡是通过用一个机构的认证书与公共/个人密码集来首次初始化，从而被激活，使之可以投入使用。在注册服务器410中，系统管理员一般将一个新的智能卡与他自己的管理员智能卡同时插入，并敲入他的PIN号来授权一个新用户的注册。然后，管理员启动用户智能卡初始化程序，该程序一般将确认信息，比如用户的个人与公共密钥集，用户名，编号，智能卡编号等印在智能卡上。
注册服务器410，它可以等同于图3中的工作站220，生成用户概况，产生请求的个人/公共密码和认证书，并将信息下载到智能卡。接着，注册服务器410要求用户对着工作站扬声器说话以便确认。这些声音消息被送至说话人鉴别服务器420，它等同于图1至图3的ASSR服务器200。声音消息，认证书和特有的智能卡编号被存入一个相关的数据库或存入ASSR服务器200中备以后的确认用或其他用途。
另一方面，一旦认证书被公布以及建立了用户概况，注册服务器410把注册数据上载给上级服务器430和路径服务器440用于存储。注册数据也可以下载给工作站450和智能卡读取器460。工作站450包括便携式SSP99的组件和功能，或者一个便携式SSP可能与工作站450相连接以便利与说话人鉴别服务器420的关于说话人/语音信息的通讯。对于每一个机构的每个智能卡都产生一个RSA密码对。个人的密码被写入智能卡用于以后的PIN重新设置。智能卡用一个特有的编号同时在内部(写入)和外部(打印在卡上)进行初始化，以备后用。
在上述的安装或初始化的情况下，如果用户忘记了他的PIN或他的PIN的有效期已过并且没有重新设置，他可以按照这种方式远程重设或重建他的PIN，即通过他的个人计算机或一个手持便携式SSP装置99和智能卡读取器460(或者磁写入器，如果用一个磁条卡代替了智能卡的话)连接ASSR服务器上，来申请PIN的重新设置，这种方式如下所述。
用户用他的个人计算机与ASSR服务器建立连接(比如说通过SSL V2)，请求改变他的智能卡的PIN。对话框或语音提白会提示用户敲入他的用户ID，名字，智能卡编号，等等。ASSR服务器200根据敲入的信息访问预存的认证书和用户概况。然后ASSR服务器会提示用户对着个人计算机的传声器读入预置的语音消息，用于确认。
被访问的数据库中的用户概况和声音段与用户输入的声音消息相比较，进行确认。用户可能有几次机会来确保鉴别程序的输入正确。如果鉴别是正确的，并且用户是当前合法用户，ASSR服务器200用智能卡认证书和公共密码对PIN重新设置命令进行加密，并且把它送到用户的个人计算机和相关的智能卡阅读器。接着用户的智能卡利用它的特有的个人密码PIN重新设置命令进行解密。
如果智能卡的个人密码成功地为PIN重新设置命令进行了解密，智能卡就会被激活。智能卡可能包括对写入智能卡的特有编号和由ASSR服务器200提供的号码进行比较的电路。如果它们相同，则智能卡可解除锁定状态而进行PIN重新设置的操作。
一旦智能卡被激活，并且PIN被重新设置，用户可以对他的智能卡敲入一个新PIN。这种智能卡适用于任何保密事务。
用电话重新设置PIN如果计算机上没有扬声器，用户可以用电话呼叫ASSR服务器200，以便进行智能卡PIN的重新设置。利用相同的说话人鉴别过程，他可命令服务器在一个电子信封中建立加密的PIN重新设置命令以备后用。
利用个人计算机和智能卡读取器，用户通过ASSR服务器200与智能卡管理服务器建立保密套接层(SSL)的对话(只能利用宿主认证书)，并申请PIN的重新设置。接着ASSR服务器200把加密的信封发送到个人计算机智能卡读取器。当智能卡接收到电子信封后，就用智能卡的个人密码对信封中的PIN重新设置命令进行解密。只有个人密码正确的智能卡能对PIN重新设置命令进行解密。智能卡也对唯一智能卡编号和由智能卡管理服务器提供的号码进行比较。若数据匹配，智能卡就被重新设置，以便后面PIN的初始化和设置。
远程智能卡的失效
如果智能卡丢失或被盗，用户必须尽快地让他的智能卡失效。在这种情况下，他可以用电话通过ASSR服务器200连接到智能卡管理服务器，用同样的鉴别过程使他的智能卡失效。
上述按照本发明的示例性实施方案的系统的示例性应用可用于用声音确认的网络访问注册或口令。
一个网络用户执行一个初始化过程，为ASSR服务器数据库中的记录录制一套预置的说话人消息。ASSR服务器200可作为一个管理服务器，用说话人确认过程来执行所有注册ID和口令管理的任务，就像对智能卡用户确认中所描述的那样。
类似于PIN重新设置过程，如果一个用户忘记了他的注册口令或他的口令已经失效，他可以通过ASSR服务器200，经过确认，来申请改变口令或口令的重新生效，并且新口令或重新生效的口令会下载给用户。其他应用包括与电子钱卡或皮夹卡的交互，其中，一个IC芯片含有卡中有关钱的数量信息。当用卡购物时，钱的数量减少。用类似于如上所述的智能卡交互方法的过程，按照本发明的示例性实施方案的系统可用来给卡上加钱。
尽管本发明的某些实施方案已详细描述，但一个普通的技术人员就会实现数种变化或修改方案，而不偏离本发明精神。因此，应参考后面所附的权利要求书，以确定本发明范围。
权利要求
1.一个便携式语音识别装置，包括一个麦克风，用于把包括语音，无声，和背景噪声信号的声音转换为模拟信号；一个模数转换器，用于把该模拟信号转换为数字信号；一个数字信号处理器，用于从该数字信号产生表示所述语音的特征向量数据；一个声学耦合器，用于把该特征向量数据转换为声音信号，还用于与声音通讯装置相连接从而在通讯信道上传送该语音，便于在远处识别该语音。
2.按照权利要求1的装置，其特征是，还包括一个加密装置用于对该特征向量数据加密。
3.按照权利要求1的装置，其特征是，还包括一个数据压缩装置用于对该特征向量数据进行压缩。
4.按照权利要求1的装置，其特征是，此声学耦合器包括在通讯信道上接收从远处返回信号，并把此返回信号转换为数字返回数据供该DSP处理的装置。
5.按照权利要求4的装置，其特征是，此DSP还包括用于对该数字返回数据进行解压的装置。
6.按照权利要求4的装置，其特征是，此DSP还包括用于对该数字返回数据进行解密的装置。
7.按照权利要求1的装置，其特征是，还包括估计该通讯信道的传递函数的装置。
8.按照权利要求1的装置，其特征是，此DSP包括接收和处理从服务器而来的数据的装置，这个服务器在远处连接于此信道。
9.按照权利要求1的装置，其特征是，此DSP包括存储器用于存储包括该装置特有的密码数据的数据。
10.按照权利要求1的装置，其特征是，还包括用于表征通讯信道特征的装置，通讯信道的特征是与所述装置周围的无声和背景噪声相联系的。
11.一个语音识别系统，包括一个便携式语音信号预处理器，具有一个数字信号处理器(DSP)，用于处理读入SSP的数字化语音并产生表示该语音的特征向量数据；而且一个耦合器，用于与通讯装置相连接从而在通讯信道上传送代表该特征向量数据的信号；以及一个自动语音/说话人识别(ASSR)服务器，远程连接于通讯信道，用于通过该通讯信道接收从这个便携式SSP传过来的代表特征向量数据的所述信号，并处理该信号以实现对语音或说话人的识别。
12.按照权利要求11的系统，其特征是，该ASSR服务器包括鉴别数据的预存模型，通过处理从便携式SSP传过来的信号并且把处理过的信号与鉴别数据的预存模型相比较，以实现对合法用户的确认。
13.按照权利要求11的系统，其特征是，ASSR服务器包括一个用于语音识别的词表数据库，识别是通过处理从便携式SSP传过来的信号并且把处理过的信号与该数据库相比较而实现的。
14.按照权利要求11的系统，其特征是，ASSR服务器通过处理由便携式SSP接收过来的信号来确认用户口令。
15.按照权利要求11的系统，其特征是，ASSR服务器通过处理由便携式SSP接收过来的信号来辨识呼叫者，该信号源于呼叫者读入便携式SSP的语音。
16.按照权利要求11的系统，其特征是，便携式SSP包括接收和处理从ASSR服务器返回信号的装置。
17.按照权利要求16的系统，其特征是，该返回信号包括改变的确认数据和提白之一。
18.按照权利要求11的系统，其特征是，该便携式SSP包括相关的存储器，用于存储包括从该ASSR服务器接收来数据的数据。
19.按照权利要求11的系统，其特征是，还包括估计连接的传递函数的装置，该连接是通过通讯信道在便携式SSP和ASSR服务器之间的连接。
20.按照权利要求11的系统，其特征是，此耦合器是一种声耦合器，它把特征向量数据转换为声信号，并且此通讯信道也是声学意义上的信道。
21.按照权利要求11的系统，其特征是，该便携式SSP和该ASSR服务器包括通过一个通讯对话定期地执行说话人识别任务的装置。
22.一种通过声音来确认客户/服务器系统的合法客户的方法，包括这些步骤在自动语音识别(ASSR)服务器的存储器中，存储注册数据的多个模型；从相对于ASSR服务器远程分布的便携式语音信号预处理(SSP)装置，通过一个通讯信道连接到ASSR服务器上；把该注册数据读入便携式SSP装置；在该便携式SSP装置中，将该注册数据预处理为特征向量；通过所述通讯信道，ASSR服务器接收表示该特征向量的信号；及处理ASSR服务器接收的信号，并将处理过的信号与预存模型相比较，用于鉴别合法用户。
23.按照权利要求22的方法，其特征是，还包括一个改变用户口令的步骤，该步骤通过从ASSR服务器把一个改变后的口令数据传送给便携式SSP装置来实现。
24.按照权利要求22的方法，其特征是，还包括一个改变智能卡PIN的步骤，该步骤通过从ASSR服务器把一个改变后的智能卡数据馈送给便携式SSP装置来实现。
25.按照权利要求24的方法，其特征是，该改变后的智能卡数据被ASSR服务器加密，并由便携式SSP装置解密以改变该智能卡PIN。
26.按照权利要求22的方法，其特征是，还包括一个改变磁卡的PIN的步骤，该步骤通过从ASSR服务器把一个改变后的PIN数据馈送给磁卡写入器和便携式SSP装置来实现。
全文摘要
便携式语音信号预处理(SSP)装置具有,用于接收语音和背景噪声的麦克风,一个用于将接收到的噪声处理为特征向量的数字信号处理器(DSP),一个与通讯装置相连用于在通讯信道上传输的耦合器。一个自动语音/说话人识别(ASSR)服务器在通讯信道上接收预处理过的语音数据,并识别语音或说话人。一个带有便携式SSP装置和ASSR服务器的系统可被用于对远程的智能卡,磁卡或电子钱卡进行激活,重新设置,或改变PIN码。
文档编号G10L15/00GK1229229SQ98107970
公开日1999年9月22日申请日期1998年5月8日优先权日1997年6月11日
发明者D·肯尼维斯基, S·H·米斯, C·普罗彻罗, P·S·普恩申请人:国际商业机器公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：D.肯尼维斯基;S.H.米斯;C.普罗彻罗;P.S.普恩
技术所有人：国际商业机器公司
我是此专利的发明人

上一篇：连续语音识别中的标点符号自动生成装置及方法
上一篇：波形产生装置的制作方法