识别人的方法

文档序号：2819107阅读：352来源：国知局

专利名称：识别人的方法
技术领域：
本发明涉及一种识别人的方法，其中通过将从一个人的某段讲话导出的电信号与存储的这种信号相比较来识别这个人。
EP 0 896 711 B1和DE 1004 2571 C2所公开的借助于其声音识别人的方法比较一个信号，其对应于讲话整体或者从其中选出的声音序列。包含在这些信号中的个人特征使得个人的识别有或多或少的可靠性。
按照存储的比较信号的数量，即按照应被识别的人数的多少，用这种方法进行的识别过程的时间成比例地延长，并且此方法例如不适用于进入大型企业或大机关的鉴权控制。
本发明的目的在于给出一个新的、如本说明书开始处所述的方法，在更高的识别可靠性下本发明的方法可以比现有的方法实现更快的个人识别。
按照本发明，完成上述任务的方法的特征在于，被比较的信号从讲话的一个次音位区域导出。
本发明基于以下认识为了能够进行识别，由讲话或对应于讲话的整体电信号导出的一个短的、不是不可听见的片段信号已具有足够多的表征个人的特征。具有优点的是，由于信号的缩短，在识别过程中所要处理的数据范围相比现有方法明显减少，这样识别过程明显缩短。此外，在缩短的比较信号中的个人特征突出，同时这些特征在对应更长的声音序列的电信号中被严重地“抹掉”了。因而本发明也提高了识别的可靠性。符合或者不符合比较信号的错误判定几乎被排除。
具有优点的是，在导出被比较信号的第一个步骤中，将对应于整个讲话的、一个电声变换器的电输出信号进行声强归一化。这样由于微小的个人特征导致的信号区别有利地被滤除。声强归一化可以在话筒单元中进行，它可以连接到一台具有话筒输入端的计算机上。
在计算机中对此输出信号进行数字化，并且符合目的地形成对输出信号进行近似的傅里叶级数，它可作为计算机中其它信号处理的基础。
在本发明的一个具有优点的实施方式中，在对应于讲话的电变换器的数字化输出信号中，求出信号的一个准周期性区域。当讲话包含一个元音或半元音时，一个准周期性区域总是存在的。
在从例如对应字母a的准周期性区域可选出任意的次音位子区域时，在本发明的一个具有优点的实施方式中，为了形成一个比较信号或形成多个比较信号，分别只选出一个唯一的准周期。
合乎目的的是这里涉及准周期性区域1至m中的某个特定准周期n。非个人的信号特征—它只基于准周期性区域中比较周期的不同位置—从而被滤除。
在本发明另一个具有优点的设计中，对所选的准周期进行长度归一化，即被伸展或压缩到归一化长度T上。在准周期性中周期长度的波动以及尤其是与音高有关的周期持续期的差别从而得到均衡，并且信号的个人特征精确对应于周期T内特定的时刻。它们在比较中精确地显现出来。
在本发明的另一个设计中，由所选择的准周期和一个对于多个人求平均得到的这种准周期形成一个作为比较信号的商信号。
这种商信号与一个仅有少量个人特征的信号相关。相应地在商信号中个人特征要突出得多。
此外在本发明的优选实施方式中，多个—例如3个—要被存储的比较信号按照以下方式形成，即不同音高的讲话被记录和处理。在识别时进行内插，或者通过内插形成存储的比较信号的曲线簇。
识别方法可以是语言识别程序的组成部分，比较信号可以是语言合成程序的元件。
现在借助一个实施例和示出了该实施例的附图详细说明本发明。图中

图1是根据本发明的方法工作的识别装置的示意图，以及图2示出了对应一段讲话的电信号，由它可以根据本发明导出适用于个人识别的比较信号。
图1中附图标记1表示一个电声变换器，装置2接在其后面，该装置进行声强归一化。电声变换器1和归一化装置2一起组成一个设备单元3，它连接到计算机4的话筒输入端上。
计算机4包含由硬件和软件构成的装置5至12。
数字化装置5接收设备单元3的输出信号。由装置5数字化的信号到达装置6，在此装置6中形成对该信号进行近似的傅里叶级数，并且它是其它信号处理的基础。
装置7求出信号的一个准周期性区域，接在其后的装置8从这个区域中选出至少一个特定的准周期。也可以从多个求得的准周期性区域选出多个准周期。
在后接的装置9中完成对选出的准周期的处理，例如在时间上扩展或压缩到归一化持续时间。
根据应当存储一个比较信号还是应当识别一个人，经过处理的准周期作为比较信号被送至存储装置10或送至比较装置12。
在比较装置12中，经过处理的准周期与多个人的这种已存储的信号进行比较，并且通过确定与一个存储信号存在一致性而识别出一个人。
平均装置14由对多个个人所存储的信号形成一个平均信号，它可存储在存储装置10中并送至处理装置9。
下面借助图2进一步详细说明识别过程。
一个要识别的人—此人有一个比较信号被存储在存储装置10中—说出一个预定的词，例如“妈妈”。设备单元3由一个相应的声音信号形成一个声强归一化信号U(t)。此信号中与“妈妈”这个词的第一个元音“a”有关的部分被表示在图2中。
对应“妈妈”这个词的整个声强归一化信号U(t)通过装置5被数字化，并且接着在装置6中函数U(t)由一个傅里叶级数来表示。其它的信号处理基于这个傅里叶级数完成。
在接着的处理步骤中，装置7借助于整个信号U(t)中的一个时间上变化的观察窗口13求出一个具有准周期1至m的第一准周期性区域，并且从这个区域中选出至少一个准周期n。
由于准周期的持续时间存在波动并与相应的声高有关，在处理装置9中实现对选出的周期n到归一化持续期间T的扩展或压缩。此外在装置9中由已扩展或压缩的周期n和由装置11产生并存储在存储装置10中的信号形成一个商信号。后者表示多个人的信号的平均。在这个商信号中个人特征明显突出。除了商信号外，还可以形成一个与在特别情绪条件下记录的比较信号的商。
由处理装置9处理的比较信号—如果它是要识别的人群范围中的一个人的测试记录—被存储在装置10中，其中在一个这样的测试记录的情况下，多个(例如3个)比较信号被形成，即对于三个不同的声高形成，“妈妈”这个词以这些声高说出。在识别时相关信号被送至比较装置12，在其中完成与装置10中所存储的所有比较信号的比较。如果确定与某个存储信号一致，则此人被识别为属于识别个群范围。
权利要求
1.用于识别人的方法，其中通过将从一个人的某段特定讲话中导出的电信号与存储的这种信号相比较来识别出这个人，其特征在于，要比较的信号由讲话中的一个次音位区域导出。
2.如权利要求1所述的方法，其特征在于，在导出信号的第一个步骤中，对电声变换器(1)的对应于整个讲话的电输出信号进行声强归一化。
3.如权利要求1或2所述的方法，其特征在于，形成一个对对应于整个讲话的输出信号进行近似的傅里叶级数。
4.如权利要求2或3所述的方法，其特征在于，为了导出被比较的信号，求出输出信号的至少一个准周期性区域。
5.如权利要求4所述的方法，其特征在于，为了从求得的准周期性区域中导出被比较的信号，选出一个单个准周期或多个准周期。
6.如权利要求5所述的方法，其特征在于，选出一个按照其在准周期性区域(1至m)中的位置而确定的准周期(n)。
7.如权利要求5或6所述的方法，其特征在于，对所选出的准周期进行长度归一化。
8.如权利要求5至7中任一项所述的方法，其特征在于，从选出的准周期和一个用于对平均声音进行衡量的准周期形成一个商信号。
9.如权利要求1至5中任一项所述的方法，其特征在于，为了形成要存储的比较信号，多次以不同的声高记录讲话，并且在识别时在多个比较信号之间进行内插或通过内插形成比较信号的曲线簇。
10.如权利要求1至9中任一项所述的方法，其特征在于，此方法被集成到一个语言识别程序中。
11.如权利要求1至10中任一项所述的方法，其特征在于，要比较的信号被用作一个语言合成程序的组成部分。
全文摘要
本发明涉及一个用于识别人的方法，其中通过将从一个人的某段特定讲话导出的电信号与存储的这类信号相比较来识别出这个人。按照本发明，被比较的信号由讲话的一个次音位区域导出。特别是此信号与一个元音或一个半元音的准周期有关。
文档编号G10L17/02GK1902683SQ200480039510
公开日2007年1月24日申请日期2004年12月29日优先权日2003年12月31日
发明者马库斯·克雷斯申请人:马库斯·克雷斯

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马库斯.克雷斯
技术所有人：马库斯.克雷斯
我是此专利的发明人

上一篇：可调颤音弦马的制作方法
上一篇：语音/乐音编码设备及语音/乐音编码方法