用于减少对非期望消息的接收的方法和系统的制作方法

文档序号：2830511阅读：235来源：国知局

专利名称：用于减少对非期望消息的接收的方法和系统的制作方法
技术领域：
本发明涉及一种通过应用特征模板来减少对非期望消息的接收的方法和系统。
背景技术：
随着互联网电话(VoiceoverIP，网络电话，简称VoEP)的普及，VoIP用户M^越多地暴露于所谓SPIT之下(SPIT: SPAM over Internet Telephony,垃圾
网络电话)。目前，打往传统PSTN用户(PSTN:公众交换电话网)的广告电话，通常总是由主叫方支付费用。而基于不同的计费模式，主叫方可以几乎免费地呼叫VoEP用户，这在未来可能引发大量的SPIT来电。尤其是，批量发送录帝附的语音文件这种可能性，对于广告运营方来说是有吸引力的。可以由此推断，涉及到的VoIP用户将要求他们相应的VoIP供应商采取适当措施，以防止非期望的来电。
作为对抗SPIT的措施，首先使用所谓的白名单(英语White lists)和黒名单(英语Blacklists)。对于用户X来说，白名单包括時定于用户的信息，该信息是关于在通信网络中其他那些被分级为可靠的、并且因此被许可呼叫用户X的用户Y的。与此相反，黒名单包括特定于用户的信息，该信息是关于在通信网络中其i魁陛被分级为不可靠的、并且因此不被许可呼叫用户X的用户Y的。
然而，借助白名单和黒名单帮助的SPIT保护，在未知用户第一次进行呼叫的情况下是无效的，这是因为在这种情况下该未知用户的特定于用户的数据既不可能包括在被呼叫用户的白名单中也不可能包括在黒名单中。
此外可以考虑，基于消息与之前被识别为SPIT消息的相似性，该消息也可以被归类为SPIT。如果一个消息经常出现，另卩么这同样是对于非期望消息的强烈标志。
然而在此，精确的比较，例如以在代表了待比较的消息的比特流层面上的纯粹比较的方式，并不能达到目标，这是因为被呼叫方不能听到的轻微改变，例如通过重新编码或者在消息开始时的偶然延迟，可能会导致被比较的消息之
4间的差别。

发明内容
本发明要解决的技术问题是，构造一种方法和一种系统，使得减少在通信网络中对不期望消息的接收。
该技术问S131权利要求1和6在方法方面的特征以及通过权利要求7在系统方面的特征来解决。在从属权利要求中规定了本发明的改进实施方式。
本发明的主题是用来确定语音消息的特征模板的方法，其中，所述语音消息以M扫描产生的经过数字编码的音频信号的形式存在。该方法至少包括下列用于基于所述经过数字编码的音劍言号来确定特征模板的步骤在第一步骤中，在对音频信号应用适当的信号滤波器的过程中，尤其是在应用带通滤波器
的过程中，m滤除不重要的频率范围来抑制音鹏号的非语音部分。
在第二步骤中，应用映射规则(SQR)以倒每所述经过数字编码的音频信号的所有成分都映射到正数的范围内。
在第三步骤中，对音频信号的表征所述扫描的扫描率进行匹配。
在第四步骤中，关于最大值和平均值对通过匹配该扫描率产生的新的值域进行标准化，所述值域是经过数字编码的音频信号的全部成分的值域。
此外，本发明还涉及一种用于执行所述方法的系统以及设备和相应的通信网络。
本发明带来了这样的优点，即 >了对非期望消息的接收。

在图中示出本发明的一个实施例，下面详细说明该实施例。附图中
图1示出用于为消息M产生特征模板FP的框亂
图2示出借助附加的微分器DA来产生特征模板FP的变形方式；图3示出借助附加的阈值熗波器SWF和样本计数器SZ来产生特征模板FP的变形方式；
图4示出对两个消息Ml 、 M2的两个待征模板FP1 、 FP2的比较。
具体实施例方式
根据本发明，针对消息M确定特征模板FP。消息M在此是通信网络、例如网络电话通信网络中的语音消息。在此，消息M表现为M扫描产生的经过数字编码的音频信号的形式。本发明的方法的特征在于多个步骤，在执行这些步骤的过程中，基于经过数字编码的音劍言号来确定特征模板FP。在此，对特
征模板FP的确定是不可逆的，因此基于特征模板FP不能重建消息M。
所确定的特征模板FP例如可以被存储，和/或为了迸一步处理而被传输到位
于通信网络之内或之外的部件。此外，可以将所确定的特征模板FP与第二消息
M的第二特征，M FP进行比较，并确定这两个消息在内容方面是否是相同的。图1示出用于根据消息M产生特征模板FP的框图。下面阐述在框图中示
出的步骤。
首先，在第一步骤中，在向音频信号应用适当的信号滤波器的过程中，通过滤除不重要的频率范围来抑制音频信号糊瞎音部分。在此，尤其有利的是应用带通滤波器BPF，这是因为带通滤波器BPF主要是不会改变对于语音重要的频率范围，然而却尽可能地滤除了非语音部分。
在第二步骤中，应用映射规则SQR来将经过数字编码的音频信号(英语samples (样本))的所有成分都Wt到正数的范围内。映射指令SQR itt表现为例如平方值模i央或者绝对值模块在平方值模块的情况下，经过数字编码的音频信号的全部成分都将被平方，而在纟M值模块的情况下，针对经过数字编码的音频信号的全部成分形成相应的绝对值。
在第三步骤中， <昔助加法模块AS "音频信号的表征扫描的扫描率进行匹配。加法模块AS逐步地将经过数字编码的音频信号中的一些成分组合起来，从而导致了音频〗言号的扫描率被改变。每秒钟组合的样本数量n是可调节的。
在第四步骤中，借助标准化器(Nomiierer) RA，关于最大值和平均值对通过匹配扫描率所产生的新的值域进行标准化，所述值域是经过数字编码的音频信号的全部成分的值域。标准化器RA ttW音频信号的样本进行线性变换，使得标准化到最大值为1而平均值为0。
在所示方法之后紧接着输出经过数字编码的音频信号的所有经过改变的成分。所示方法的结果是在-1和1之间的数字序列，这，字表示消息M的特征模板FP。
上述步骤的次序是可以改变的，并不限于所示的次序。尤其是步骤可以被省略、重排次序或者多次执行。
在本发明的另一表现形式中，在附加的限制步骤中，所述音频信号的持续
6时间郷艮伟赃预定范围内，其中，所述限制步骤肯嫩在所述方法的任意位置被执行。这种长度限制m在这些步骤的次序中尽早地实现，以便将后续步骤中的计算开销最小化。
在本发明的另一表现形式中，在应用带通滤波器BPF之前先去除音zMt号
的直流分量(Gleichanteil)，其中，该直流分量表现为该音频信号的长时间平均值。
图2示出用附力啲微分器DA来产生特征模板FP的变形方式。微分器DA针对样本序列Xi， H、 2、 ...、 N，提供第二样本序列ypxj+l-xi， H、 2、 ...N-l。通过这种方式，代替使用单个时间段内的能量，将一个时间段内的能量相对于下一个时间段内能量的改变用作评估参数(Bewertungsgr5i3e)。通过应用微分器DA，有利地得到了抵抗叠加干扰的鲁棒性，所述叠加干扰例如是音量恒定的干扰信号。如图2所示，微分器的应用优选是在加法模块AS的应用之后或者是在标准化器RA的应用之后。
图3示出用附加的阈值滤波器SWF和样本计数器SZ来产生特征l嫩FP的一种变形方式。ilil应用阈值滤波器SWF把低于临界值的所有样本it;人音频信号中滤出。样本计数器SZ的应用保证了，产生特征模板的样本数量是正确的。通过这种方式，例如可以将音频信号的非常低声的部分滤出。可以在前述方法的任意位置处应用阈值滤波器SWF和样本计数器SZ。阈值滤波器SWF的应用tm是在带通滤波器BPF的应用之后并且在标准化器RA的应用之前以及在可能的微分器DA的应用之前。
图4示出对两个消息M1、 M2的两个待征模板FP1、 FP2的比较。本发明的方法使得基于计算得出的第一特征模板FP1的第一消息M1可以与第二消息M2的第二特征模板FP2进行比较。M这种方式可以确定这两个消息Ml、M2在内容方面是否相同或者是否近似相同。
对于将第二消息M2的第二特征模板FP2与第一消息Ml的第""^寺征模板FP1比较而言，可以确定这两^hf寺征模板的互相关函数c(k)。对于这两个数列sl(i)和s2(j)来说，按照下述方式来定义函数c(k)，其中这两个数列分别te^第一消息和第二消息的样本如果相关函数c(k)的结果fMl了预定的阈值，那么这些消息就被归类为相
同的消息。否则，这些消息被评定为不相同的消息。
在本发明的另一表现形式中，可以根据c(k)的最大值推导得到这两个消息Ml、 M2的连续的或者是多级的一致性程度。在这里，连续的一致性程度具有无穷多的中间级，而多级的一致性程度只具有有限数量的中间级。
在本发明的另一表现形式中，为了确定两个消息M1、 M2的一致性程度，也可以使用在互相关函数c(k)的最大值和自相关函数(第一消息Ml的特征模板与其自身相关)的最大值C0之间的比值C1/C0。
在本发明的另一表现形式中，可以从系统中存储的其他消息的自相关函数和互相关函数中确定出与相关函数c(k)有关的预定阈值或者用于多级分类的参考值。
本发明的方法是有效的，这是因为消息M的特征模板FP仅包含较小的数据量。ffiil这种方式，基于消息M的特征空间被大幅度缩减。每个特征模板FP的较小的数据量允许例如非常有效地在通信系统内存储和/劍每特征模板FP继
续传输。与逐个比特地比较消息m或者比m:接从消息m的音频信号推导出
的值例如哈希值不同，本发明的方法皿合用于比较被彼此不相关地一例如在经由模拟语音网络传输之后或者在对消息重新编码之后一数字化的消息。此外，根据本发明的方法在消息M的各种变形方式中对一定程度叠加的干扰噪声是不敏感的。育^安全且鲁棒地识别内容相同或近似相同的消息M。即使是在两个消息M1、 M2差别较小的情况下，例如不同的称呼或者在这两个消息M1、 M2的一个消息中插入很小的个性化部分，也能够可靠地识别出在内容方面基本相同的消息。因此该方法肖,确定这两个消息M1、 M2很可能携带相同的语音信息。在此，可以通过匹配数据率以及通过限制音频信号的长度来影响得到的特征模板FP1、 FP2的大小。
本发明的另一个优点在于，尽管消息Ml的特征模板FP1适合于与第二消息M2的第二特征模板FP2进行比较，但是人们根据特征模板FP1 、 FP2无法再逆运算得到原始的语音消息。只有这样该方法才能在分布式分析系统中使用，在该分布式分析系统中，以比较为目的在通信网络中传输特征模板，而不会出现接收方能够由此获得原》維音消息的情况。
在本发明的一个表现形式中，本发明的方法是由语音信箱服务器执行的。在本发明的另一表现形式中，本发明的方法是在通信网络中由至少一个客户端和至少一个服务器执行的，其中该客户端执行对消息M的特征模板FP的
确定，而该服务^^行对不同消息M的特征模板FP的比较。在此，客户端例如是基于网络的语音信箱系统或者诸如呼叫应答机的终端设备。该服务器例如由网络运营商在电话答录* 务范围内来提供。可替换地，该服务器也可以由独立的运营商来提供。
9
权利要求
1. 一种用于确定语音消息(M)的特征模板(FP)的方法，其中，所述语音消息(M)以通过扫描产生的经过数字编码的音频信号的形式存在，其特征在于，该方法至少包括以下用于基于所述经过数字编码的音频信号来确定所述特征模板(FP)的步骤-在第一步骤中在对音频信号应用适当的信号滤波器的过程中，尤其是在应用带通滤波器(BPF)的过程中，通过滤除不重要的频率范围来抑制音频信号的非语音部分；-在第二步骤中应用映射规则(SQR)以便将所述经过数字编码的音频信号的全部成分都映射到正数的范围内；-在第三步骤中对音频信号的表征所述扫描的扫描率进行匹配；-在第四步骤中关于最大值和平均值对通过匹配扫描率所产生的新的值域进行标准化，所述值域是经过数字编码的音频信号的全部成分的值域。
2. 根据权利要求1所述的方法，其特征在于，-所述这些步骤的7:^是可变的；禾口/或 -倉,瑕挝或者重复应用一个或多个步骤；禾口/或 -对所述特征模板(FP)的确定是不可逆的。
3. 根据权禾腰求l或2所述的方法，其特征在于，在附加的限制步骤中，将所述音频信号的持续时间被限制在预定范围内，其中，所述限制步骤能够在所述方法的任意位置被执行。
4. 根据前面任何一项权利要求所述的装置，其特征在于，在附加的求微分步骤中，借助微分器DA针对代表音频信号的样本序列Xi， H、 2、…、N确定出第二样本序列y产xw-x,， i=l、 2、 ...N-l，从而代替音^f言号的所述绝对样本值，而使用两个连续的样本值之间的差来确定所述特征模板 (FP)，其中，所述求微分步骤育,在所述方法的任意位置执行。
5. 根据前面任何一项权利要求所述的装置，其特征在于，在抑制音Mt号的非语音部分之前，将该音劍言号的直流分量去除，其中， itt流分量^该音频信号的长时间平均值。
6. —种在内容方面比较语音消息(Ml、 M2)的方法，-在该方法中，在第一步骤中，按照权利要求1为第一语音消息(Ml)确定第一特征模板(FPO;并且-在该方法中，在第二步骤中，按照权利要求1为第二语音消息(M2)确定第二特征模板(FP2);并且-在该方法中，借助互相关函数(c(k))来对所述第一特征模板和第二特征模板(FP1、 FP2)进行比较；-其中，当所述互相关函数(c(k))的结果集合中的至少一个OT过了预定阈值时，所述第一语音消息和第二语音消息(M、 M2)就它们的内容而言被评定为是相同的。
7. —种用于识别近似相同的语音消息(Ml、 M2)的系统，所述系统具有用于按照权利要求6的方法在内容方面对所述语音消息(M、 M2)进行比较的装置。
8. —种通信网络，所m信网络具有至少一个根据权利要求7所述的系统。
9. 根据权利要求8所述的通信网络，其中，所舰信网络是网络电话通信网络。
10. —种语音信箱服务器，所述的语音信箱服务器具有用于执行根据权利要求l所述的方法的装置。
11. 一种客户端，所述客户端具有用于根据权利要求1来确定消息(M)的特征模板(FP)的體。
12. —种服务器，所述服务器具有用于根据权利要求6在内容方面对语音消息(M、 M2)进行比较的装置。
13. —种根据权利要求6所述的方法在通信网络中的应用。
14. —种根据权利要求6所述的方法在VoIP通信网络中的应用。
全文摘要
本发明的主题是一种用来确定语音消息的特征模板的方法，其中所述语音消息以通过扫描产生的经过数字编码的音频信号的形式存在。为了基于所述经过数字编码的音频信号来确定特征模板，该方法至少包括下列步骤在第一步骤中，在对音频信号应用适当的信号滤波器的过程中，尤其是在应用带通滤波器的过程中，通过滤除不重要的频率范围来抑制音频信号的非语音部分。在第二步骤中，应用映射规则(SQR)以便将所述经过数字编码的音频信号的所有成分都映射到正数的范围内。在第三步骤中，匹配音频信号的表征所述扫描的扫描率。在第四步骤中，关于最大值和平均值对通过匹配扫描率所产生的新的值域进行标准化，所述值域是经过数字编码的音频信号的全部成分的值域。此外，本发明还涉及一种用于执行所示方法的系统以及设备和相应的通信网络。
文档编号G10L21/02GK101490742SQ200780026502
公开日2009年7月22日申请日期2007年7月13日优先权日2006年7月13日
发明者J·查辛斯基申请人:诺基亚西门子通信有限责任两合公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：J.查辛斯基
技术所有人：诺基亚西门子通信有限责任两合公司
我是此专利的发明人

上一篇：用于传递音频信息的改进的方法和装置的制作方法
上一篇：使用语音识别来检测应答机的制作方法