骚扰电话号码识别方法、装置及设备与流程

文档序号:17356891发布日期:2019-04-09 21:45阅读:422来源:国知局
骚扰电话号码识别方法、装置及设备与流程

本发明实施例涉及电话网络中的信息识别技术,尤其涉及骚扰电话号码识别方法、装置及设备。



背景技术:

社交媒体中广泛存在着不同形式的垃圾信息。早期的垃圾信息一般包括传统社交媒体中的垃圾邮件、垃圾网页等,近年来随着网络电话服务的发展,网络电话中普遍出现了新的垃圾信息的形式----骚扰电话。相较于传统社交媒体中的垃圾信息,骚扰电话需要用户及时做出响应,当一个电话响起的时,用户需要立刻决定是否接听电话,而在用户意识到这个电话是骚扰电话并挂断时,用户已经浪费了时间。更为严重的是,有相当一部分骚扰电话是诈骗电话,他们通过电话盗窃用户身份信息,甚至骗取用户钱财,给用户造成重大的经济损失。因此如何准确地识别骚扰电话号码成为亟待解决的问题。

目前,现有技术主要是通过构建黑名单的方式来识别骚扰电话号码,通过网络爬取工具从相关网站中爬取骚扰电话号码,或者根据用户的反馈标注来确定骚扰电话号码,然后将获得的骚扰电话号码存储在黑名单数据库中,并根据数据库中存储的骚扰电话号码和当前来电号码判断是否拦截当前电话。然而,这种识别方式准确率较低,一旦数据源发生错误则很容易将一个正常的电话号码误识别为骚扰电话号码,而事实上,用户对于未识别出的骚扰电话号码具有较高的容忍度,但是如果将正常电话号码误标记为骚扰电话号码,就很有可能严重影响用户的正常通话。

另外,现有技术中并没有考虑到对骚扰电话早期识别的重要性。根据在商业拨号平台上的实验研究,超过90%的骚扰电话号码的生命周期不到7天,而20%的智能手机用户会在接收到骚扰电话后提供反馈标注,也就是说,大部分的骚扰电话号码是在被不法分子充分使用了之后才被识别出来的,因此在早期就识别出骚扰电话号码就显得尤为重要。



技术实现要素:

本发明实施例提供一种骚扰电话号码识别方法及装置,以实现在早期识别出骚扰电话号码,并提高识别准确率的目的。

根据本发明的一个方面,提供一种骚扰电话号码识别方法,适于对目标号码进行识别,包括:接收到呼叫请求时,获取发起呼叫请求的目标号码、目标号码的实时呼叫信息以及目标号码的历史通话迭代参量,所述历史通话迭代参量是由神经网络根据目标号码的历史通话记录进行迭代分析而获得;根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

根据本发明的另一个方面,还提供一种骚扰电话号码识别装置,适于对目标号码进行识别,包括:神经网络模块,适于利用神经网络对所述目标号码的历史通话记录进行迭代分析并获得历史通话迭代参量;存储模块,适于存储所述历史通话迭代参量以及目标号码每一次通话产生的通话记录;信息获取模块,适于接收到呼叫请求时,获取发起呼叫请求的目标号码和目标号码的实时呼叫信息;骚扰电话检测模块,适于根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

根据本发明的另一个方面,还提供一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行的程序包括如上所述的骚扰电话号码识别方法。

通过本发明的各种实施方式,一方面,通过在每次接收到呼叫请求时,都会检测发起呼叫请求的目标号码是否为骚扰电话号码,如此可以在一个电话号码刚被激活后,在早期就识别出该号码是否是骚扰电话号码,提高识别骚扰电话号码的实时性;另一方面,通过结合目标号码的历史通话记录以及当前的实时呼叫信息来检测目标号码是否为骚扰电话号码,可以有效提高识别准确率;再一方面,通过利用神经网络来对历史通话记录进行分析,如此更契合通话网络随时间动态变化的特性,从而可以对待识别的电话号码进行动态分析,进一步提高了识别骚扰电话号码的实时性。

附图说明

图1为本发明某实施例提供的骚扰电话号码和正常电话号的生命周期与受欢迎程度的变化规律的示意图;

图2为本发明某实施例提供的骚扰电话号码和正常电话号码的生命周期的对比示意图;

图3为本发明某实施例提供的骚扰电话号码识别装置与终端交互的结构示意图;

图4为本发明某实施例提供的骚扰电话号码识别方法的流程示意图;

图5为本发明某实施例提供的循环神经网络对历史通话记录进行分析的流程示意图;

图6为本发明某实施例提供的循环神经网络对历史通话记录进行分析的数据流转示意图;

图7为本发明某实施例提供的循环神经网络进行迭代更新的流程示意图;

图8为本发明某实施例提供的检测目标号码是否为骚扰电话号码的流程示意图;

图9为本发明某实施例提供的骚扰电话号码识别方法的数据流转示意图;

图10为本发明某实施例提供的骚扰电话号码识别方法的流程示意图;

图11为本发明某实施例提供的骚扰电话号码识别方法的流程示意图;

图12为本发明某实施例提供的一种骚扰电话号码识别装置的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。

附图中的流程图和框图,图示了按照本发明各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现预定的逻辑功能的可执行指令。也应当注意,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

为了解电话网络的特性,本发明在真实的商业拨号平台上收集了大量数据,图1示出骚扰电话号码和正常电话号的生命周期与受欢迎程度的变化规律,曲线1代表骚扰电话号码,曲线2代表正常电话号码,可以看出,早期骚扰电话号码的受欢迎程度远高于正常电话号码,之后,正常电话号码的受欢迎程度逐渐趋于平稳,而骚扰电话号码的受欢迎程度则随着生命周期的延长而逐渐降低。图2示出了骚扰电话号码和正常电话号码的生命周期的对比,可以看出,骚扰电话号码的生命周期要远小于正常电话号码,事实上也是如此,随着时间的延长,骚扰电话号码越容易被识别出,因此制造骚扰电话的恶意商家/用户通常都会通过频繁更换电话号码来避免被识别出身份。基于电话网络的这些特性,本发明提出了识别骚扰电话号码的其中一个关键点,就是在早期阶段识别出骚扰电话号码的身份。

为了在早期阶段识别出骚扰电话号码的身份,本发明采用实时预测机制来识别骚扰电话号码,即针对待识别的目标号码,每次有新的通话行为时都会判断该目标号码是否是骚扰电话号码,这样就使得在该目标号码被激活使用后,在前几个通话内就能判断出目标号码是否是骚扰电话号码,进而对该骚扰电话号码采取相应的措施,有效阻止恶意商家/用户/软件对骚扰电话号码进行利用。

本发明的另一个关键点是采用了神经网络来对历史通话记录进行分析。对于通话网络,在发起呼叫时、通话过程中或者通话结束后,会产生相应的通话日志,从通话日志中可以抓取有效的通话记录信息来用于骚扰电话识别,随着时间推移,该号码后续每一新的通话都会更新历史通话日志,也就是说,历史通话日志代表了该号码按照时间顺序进行通话的历史行为,对于这种有时间顺序的信息,优选采用循环神经网络(rnn,recurrentneuralnetworks)来进行分析。循环神经网络(又称时间递归神经网络)是一种节点定向连接成环的人工神经网络。这种网络的内部状态可以展示动态时序行为,它可以利用内部的记忆来处理任意时序的输入序列,在处理单元之间既有内部的反馈连接又有前馈连接,因此,能很好地对有时间顺序的历史通话记录进行分析。

而传统社交媒体的垃圾信息识别技术,如朴素贝叶斯、逻辑回归以及决策树等,都是对固定长度的信息进行分析,因此仅适于对静态的信息进行分析,如邮件中的固定文本内容、评论网站中的评论信息等,但并不适于对长度动态变化的数据输入序列进行分析,因此社媒体中的垃圾信息识别技术不适于对有时间顺序的历史通话记录进行分析。

另外,传统社交媒体的垃圾信息识别技术主要是从文本内容上来考虑,通过构建垃圾信息的显著特征,并采逻辑回归、决策树等一些简单的学习方法来实现对垃圾信息的识别,这是由于传统社交媒体中的垃圾信息,例如垃圾邮件,通常都含有较为丰富的标题内容,因此检测系统通常可以通过分析邮件文本来判断是不是垃圾邮件,但骚扰电话并没有丰富的标题数据,当一个电话响起时,其包含的有用信息是极少的。再者,电话是即时的,当一个骚扰电话号码发起呼叫时,必须在短时间内完成分析并且决定是否要拦截该电话,而社交媒体对信息的即时性处理并没有这么高的要求。可以看出,传统社交媒体的信息与电话网络中的电话存在着较大差异,因此目前应用于传统社交媒体中的垃圾信息识技术对骚扰电话识别来说并不适用。

现有社交网络中还有关于链接符号预测的技术,即对社交网络中每一个社交关系都分配一个正面的或者负面的标签。如最开始的适用逻辑回归来模拟任务,后来又提出了矩阵分解,再后来技术是通过仅使用社交媒体中的正面链接和以内容为主的交互信息来确定负面链接。但骚扰电话的识别是需要找到一个负面的节点,即给其他用户制造骚扰信息的这个号码,而并非是找到一个负面链接。另外,通话网络是动态变化的,随着时间的推移会快速发展,因此当前静态社交网路中的链接符号预测技术对骚扰电话的识别也并不适用。

下面具体来看本发明的方案:

图3为本发明某一实施例提供的骚扰电话号码识别装置与终端交互的结构示意图,其中,目标号码的载体可以是终端1,通过终端1向骚扰电话号码识别装置2发起呼叫请求,骚扰电话号码识别装置2可以位于服务器中,当终端1发起呼叫请求时,骚扰电话号码识别装置2接收该呼叫请求,并判断该终端1承载的目标号码是否是骚扰电话号码,当该目标号码是骚扰电话号码时,骚扰电话号码识别装置2可以直接拦截终端1发出的呼叫请求信号,当判断该目标号码不是骚扰电话号码时,骚扰电话号码识别装置2可以将终端1发出的呼叫请求信号转发给被叫号码所在的终端中。

在某一实施例中,骚扰电话号码识别装置2还可以位于适于承载被叫号码的终端中,当终端1发起呼叫请求时,呼叫请求信号直接到达骚扰电话号码识别装置2,或者经由服务器转发至骚扰电话号码识别装置2中,骚扰电话号码识别装置2判断目标号码是否是骚扰电话号码,当该目标号码是骚扰电话号码时,骚扰电话号码识别装置2拦截终端1发出的呼叫请求信号,当判断该目标号码不是骚扰电话号码时,骚扰电话号码识别装置2可以直接响应该呼叫请求信号,其中,响应该呼叫请求信号的方式可以包括响铃、震动等。

在某一实施例中,骚扰电话号码识别装置2还可部分位于服务器,部分位于适于承载被叫号码的终端中。

图4为本发明某实施例提供的一种骚扰电话号码识别方法的流程示意图,该方法适于对目标号码进行识别,以检测目标号码是否为骚扰电话号码。如图4所示,该骚扰电话号码识别方法包括:

步骤s1:接收呼叫请求;

步骤s2:获取发起呼叫请求的目标号码、目标号码的实时呼叫信息以及目标号码的历史通话迭代参量;

步骤s3:根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

其中,所述历史通话迭代参量是由循环神经网络根据目标号码的历史通话记录进行迭代分析而获得。

根据在商业拨号平台上收集的数据,经分析,普通电话号码和骚扰电话号码在某些方面有着显著区别,具体包括:1)普通电话号码的通话行为一般发生在非休息时间段内,而对于在休息时间段内的产生通话行为的号码,其为骚扰电话号码的概率会相对较高;2)当被叫号码的联系人列表中存储有目标号码时,说明双方存在某种关联特性,此时目标号码为骚扰电话号码的概率会大大降低;3)当与普通电话号码进行通话时,其通话时长要大于与骚扰电话号码进行通话的通话时长。

根据普通电话号码和骚扰电话号码这些特性,其历史通话记录可以包括以下信息中的至少一种:目标号码发起呼叫请求时的时间戳、目标号码是否在被叫号码联系人列表中以及通话时长。所述实时呼叫信息包括以下信息中的至少一种:目标号码发起呼叫请求时的时间戳以及目标号码是否在被叫号码联系人列表中。由于获取实时呼叫信息发生被叫号码接听电话之前,因此实时呼叫信息可以不包括通话时长。

下面来看循环神经网络对目标号码历史通话记录的分析。

在某一实施例中,循环神经网络对所述目标号码的历史通话记录进行分析而获得历史通话迭代参量包括:利用循环神经网络对所述目标号码每一次符合条件的通话所对应的历史通话记录进行迭代处理,并获得处理后的历史通话迭代参量。

具体来说,当目标号码被激活后,每进行一个新的通话都会产生对应的通话记录,在这些通话记录中,符合条件的通话记录可以按照时间顺序动态输入到循环神经网络中,循环神经网络对每一符合条件的通话记录进行迭代分析,每次迭代分析可以包括两个输入和一个输出,其中一个输入是新获得的通话记录,另一个输入是上一次迭代分析得到的历史通话迭代参量,根据这两个输入得到本次迭代分析产生的新的历史通话迭代参量,且本次迭代产生的历史通话迭代参量可以作为下一次迭代分析的输入,如此实现对数据长度动态变化的历史通话记录进行迭代分析。

其中,目标号码的通话包括主叫和被叫,在某些实施方式中,循环神经网络可以不区分主叫和被叫而对目标号码每一次通话产生的通话记录进行迭代分析。在另外一些实施方式中,由于目标号码的主叫通话往往比被叫通话含有更多的有用的信息,因此符合条件的通话还可以是所述目标号码主动发起的历史电话呼叫,循环神经网络在分析时可以只对目标号码的连续主叫通话产生的通话记录进行迭代分析。其中,本发明中未明确指出目标号码的通话是主叫还是被叫时,可默认理解为是目标号码发起的主叫通话,但这并不能作为对本发明的限定。

参考图5所示的循环神经网络对历史通话记录进行分析的流程示意图,在某一实施例中,利用神经网络对所述目标号码每一次符合条件的通话所对应的历史通话记录进行迭代处理进一步包括,按照以下操作对每一次符合条件的通话所对应的历史通话记录进行迭代处理,直至第i次通话为符合条件的最后一次历史通话:

步骤a1:获取第i次通话的历史通话记录以及神经网络对前i-1次的历史通话记录进行分析所获得的历史通话迭代参量;

步骤a2:利用神经网络根据第i次通话的历史通话记录对前i-1次的历史通话记录对应的历史通话迭代参量进行更新,以获得前i次的历史通话记录所对应的历史通话迭代参量。

其中,i为自然数,当i为1时,前i-1次的历史通话记录对应的历史通话迭代参量为预设初始信息,该预设初始信息可以是随机生成的信息,也可以是通过机器学习得到一组数据。

图6为本发明某一实施例提供的循环神经网络对历史通话记录进行分析的数据流转示意图,下面结合图6以及相应的符号来进一步解释上述过程:

假设以p表示目标号码,以c表示历史通话记录,则向量表示目标号码第i次通话对应的历史通话记录,输入到循环神经网络模块中的序列可以表示为其中,每一个可以包括目标号码、被叫号码、目标号码发起呼叫请求时的时间戳、通话时长以及目标号码是否在被叫号码联系人列表中等信息。

当产生新的通话记录后,可以将通话记录中相应的特征信息进行提取,将提取的特征信息进行编码,得到对应的向量在某一实施例中,每一个包含四个提取特征,每个提取特征都是一个独热编码,并基于桶划分对这些提取特征进行编码。下面具体来看这四个提取特征:

1)周:每周有7天,所以将其编码为长度为7的独热编码矢量;

2)小时:一天有24小时,所以将其编码为长度为24的独热编码矢量;

3)目标号码是否在被叫号码联系人列表中:这个特征可以编码为0或者1,0代表目标号码在被叫号码联系人列表中,表示该目标号码可能是一个正常电话号码,1代表目标号码不在被叫号码联系人列表中,表示该目标号码可能是一个骚扰电话号码。

4)通话时长:该特征的数值为实际通话的时长,取值范围可以是0到正无穷,为了便于计算,可以根据实际的分布规律将其划分为若干组,例如根据在前期商业拨号平台上的实验,有a%的通话其通话时长为0,剩下b%的通话按照其分布规律分为n组,这样该特征就有n+1维。

将这四部分合在一起,就得到一个有(34+n)维的向量以上对提取特征的划分以及对特征维度的计算方法仅为举例,这并不能作为对本发明的限制。

其中,循环神经网络对前i-1次的历史通话记录进行分析所获得的历史通话迭代参量可以用来表示,相应地,可以表示为前i次的历史通话记录所对应的历史通话迭代参量。

参考图6,以目标号码产生的第i次通话记录为例,循环神经网络进行第i次的迭代分析处理,第i次的迭代分析处理包括两个输入,迭代分析处理后可以得到前i次的历史通话记录所对应的历史通话迭代参量可以理解,当目标号码产生第i+1次通话记录时,循环神经网络进行第i+1次迭代分析处理,此时作为其中一个输入,作为另一个输入又被输入到循环神经网络中,可见历史通话迭代参量既是循环神经网络的输出参量,又是循环神经网络作进行下一次迭代分析的输入,如此循环神经网络可以实现对数据长度动态变化的历史通话记录进行迭代分析,从而可以对待识别的电话号码进行动态分析,另外,由于每次产生新的通话记录时,都会根据新的通话记录更新历史通话迭代参量,因此历史通话迭代参量是实时更新的,也就是说,循环神经网络对历史通话记录的分析是实时的,这就使得当该电话号码被激活使用后,在前几个通话内就能判断出该电话号码是否为骚扰电话号码,提高对骚扰电话号码识别的实时性,从而在早期阶段就识别出骚扰电话号码的身份。

图7为本发明某一实施例提供的循环神经网络进行迭代更新的流程示意图,参考图7,步骤a2进一步包括:

步骤a21:根据第i次通话的历史通话记录和前i-1次的历史通话记录对应的历史通话迭代参量获得更新门和忘记门。

其中,所述更新门适于根据第i次通话的历史通话记录对前i-1次历史通话记录对应的历史通话迭代参量中的数据进行更新处理,所述忘记门适于根据第i次通话的历史通话记录对前i-1次历史通话记录对应的历史通话迭代参量中的数据进行过滤处理。

在其他实施例中,步骤a21还可以是:根据第i次通话的历史通话记录、前i-1次的历史通话记录对应的历史通话迭代参量以及相应的学习模型获得更新门和忘记门。

步骤a22:根据第i次通话的历史通话记录、前i-1次的历史通话记录对应的历史通话迭代参量、更新门以及忘记门获得前i次的历史通话记录所对应的历史通话迭代参量。

其中,考虑到正常电话号码的历史通话行为中也可能存在有异常通话行为的状况,而骚扰电话号码的历史通话行为中也可能存在有正常通话行为的状况,因此循环神经网络在对目标号码的历史通话记录进行分析时,一方面,要根据新获得的通话记录来对历史通话迭代参量中的数据进行更新,另一方面,也要根据新获得的通话记录来遗忘历史通话迭代参量中的某些偶然数据,如此来得到前i次的历史通话记录所对应的历史通话迭代参量

因此,对于的计算可以由两部分组成,一部分包括,不考虑数据更新时,进行数据处理后应该包含的信息,另一部分包括,考虑数据更新和数据遗忘时,进行数据处理后应该包含的信息,这就需要用到两个参量zi和其中,zi表示更新门,适于根据通话记录中的数据进行更新处理,表示不考虑更新门的情况下,应该更新成什么样子,那么,对于不考虑数据更新时,进行数据处理后应该包含的信息可以表示为对于考虑数据更新和数据遗忘时,进行数据处理后应该包含的信息可以表示为因此对于的计算,用数学公式可以表示为

其中,对于的计算也可以由两部分组成,一部分包括,考虑数据遗忘时,进行数据处理后应该包含的信息,另一部分包括进行数据处理后应该包含的信息,这就需要用到忘记门ri,忘记门ri适于根据通话记录中的数据进行过滤处理,那么,考虑数据遗忘时,进行数据处理后应该包含的信息可以表示为进行数据处理后应该包含的信息可以表示为其中,wh表示计算过程中用到的学习模型。因此对于的计算,用数学公式可以表示为

其中,tanh为激活函数-双曲正切函数。

其中,学习模型是根据一些预先制定的学习规则,对大量的数据进行主动的机器学习后得到的一个数值矩阵,它可以将向量中的一些数据进行组合、计算、变换等处理操作后得到一个线性加和的结果。具体来说,学习模型适于对历史通话记录和历史通话迭代参量中的数据进行如下至少一种处理操作:p1、按照设定规则抓取符合条件的数据;p2、按照设定规则删除数据;p3、按照设定规则对数据进行更新;p4、对数据的数值进行数学运算。

其中,更新门zi主要是根据新的通话记录在原来历史通话记录的基础上进行数据更新,如添加新的数据信息、将新的数据信息与原来的数据信息进行逻辑运算处理、对原来的信息进行进一步加工和变换等。其中,可根据学习模型wz来计算更新门zi,wz可以表示为数值矩阵,用于对向量中的数据进行组合、变换等处理操作。

在某一实施例中,对于学习模型wz,其对数据的处理可以包括上述“p1”的操作,举例来说,设定规则可以包括数据之间进行“与”操作的条件,比如“与”操作的条件包括通话时长大于n分钟,且目标号码在被叫号码联系人列表里中,满足这一条件时,就把这些信息数据抓取出来,并在更新后的的向量的对应位置生成一个非0且为正的数值,以表示满足上述条件。以上举例仅为可能的实施方式,并不能作为对本发明的限定。在其他实施例中,根据实际需求,学习模型wz对其对数据的处理还可包括上述p2-p4的操作或者其他操作,在此不再一一列举。

具体来说,对于更新门zi的计算,用数学公式可以表示为

其中,σ表示激活函数-sigmoid函数,适于将数据处理后的历史通话记录和历史通话迭代参量进行sigmoid变换,以便将更新门zi的值映射到[0,1]之间。sigmoid函数表示为

再来看忘记门,忘记门ri主要实现数据的过滤处理,如根据新的通话记录来决定将历史通话记录中的某些信息舍弃。其中,可根据学习模型wr来计算忘记门ri,wr可以表示为数值矩阵,用于对向量中的数据进行删除、变换等处理操作。

在某一实施例中,对于学习模型wr,其对数据的处理可以包括上述“p2”的操作,举例来说,假设目标号码之前出现了一个异常通话行为,比如通话时长过短,但接下来的通话行为又表现为一个正常通话行为,比如通话时长在正常范围内,或者目标号码在被叫号码联系人列表中,这说明前面的异常通话行为属于偶然事件,这时就需要忘记前面这个不正常的通话行为,通过学习模型wr将中对应位置的通话记录数据删除。以上举例仅为可能的实施方式,并不能作为对本发明的限定。在其他实施例中,根据实际需求,学习模型wz对其对数据的处理还可包括上述p1、p3、p4中的至少一种操作或者其他操作,在此不再一一列举。

具体来说,对于忘记门ri的计算,用数学公式可以表示为

同样,σ表示激活函数-sigmoid函数。

在某些实施例中,在得到前i次的历史通话记录所对应的历史通话迭代参量之后,还可以包括:将前i次的历史通话记录所对应的历史通话迭代参量进行数据转换,获得转换后的历史通话迭代参量,使得转换后的历史通话迭代参量适于呈现不同的参量输出形式,以便和实时呼叫信息的形式相匹配。

参考图6,转换后的历史通话迭代参量可以用参量来表示,具体来说,可以根据矩阵wo来对进行数据转换,对于的计算,用数学公式可以表示为

其中,σ表示激活函数-sigmoid函数,bo为截距。

其中,wo矩阵中的各位置可以设置相应的数值,根据数值设置的不同,wo矩阵与进行相应运算处理后,可以将其转换为不同的输出形式,具体需要转换为什么样的输出形式,可以根据获得的实时呼叫信息来确定,以便转换后的历史通话迭代参量可以和实时呼叫信息更好地进行合并。

其中,截距bo适于对计算结果进行数据平移。由于向量之间进行计算后,还需要通过sigmoid函数进行转换,如果前面输入的数值偏小,会影响线性求和后得到的数值的正负性,加入截距bo可以对数据计算结果进行平移,得到一个为正的数值,便于后续使用sigmoid函数进行数据转换。

参考图6,为了便于数据间的运算,在某一实施例中,和实时呼叫信息进行合并的参量可以是转换后的历史通话迭代参量而循环神经网络的参与复用的中间迭代参量可以仍为

继续参考图6,需要说明的是,以上过程描述了循环神经网络在获得第i次历史通话记录后,结合第i-1次迭代分析获得的历史通话迭代参量来获得在第i次迭代分析的历史通话迭代参量可以理解,对于历史通话迭代参量也是根据第i-1次的通话记录和前i-2次的通话记录所对应的历史通话迭代参量而得到的,相应地,在获得新的通话记录时,将根据第i+1次通话的历史通话记录和前i次的历史通话记录所对应的历史通话迭代参量来计算前i+1次历史通话记录所对应的历史通话迭代参量如此动态地分析历史通话记录。

进一步来说,图6从时间角度系统地展示了如何利用循环神经网络对每一次通话产生的通话记录进行迭代分析,从时间角度来看,输入循环神经网络的信息是按照时间信息进行排列的通话记录序列可以看出,随着时间的推移,该序列长度逐渐增加,在将历史通话记录输入到循环神经网络后,循环神经网络利用自身的隐藏层来对通话记录进行处理,其中,隐藏层即图6中示出的lstm(longshort-termmemory,长短期记忆网络)循环,它包括计算更新门和忘记门,并得到历史通话迭代参量经数据转换后可以得到适于表现不同输出形式的参量从图6中也可以看出,历史通话迭代参量可以作为中间迭代参量进行复用,因此每次迭代分析得到的历史通话迭代参量都是在上一次迭代分析的基础上结合本次获得的通话记录而得到的,如此对动态变化的历史通话记录进行分析处理,提高识别骚扰电话号码的实时性。

在某一实施例中,当i为1时,前i-1次的历史通话记录对应的历史通话迭代参量为预设初始信息该预设初始信息可以是任意随机数,可以是通过机器学习而得到的一组数值,当时,对应为预设值

下面具体介绍根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码的方法。

参考图8所示的检测目标号码是否为骚扰电话号码的流程示意图,在某一实施例中,步骤s3进一步包括:

步骤s31:将所述历史通话迭代参量和当前实时呼叫信息进行合并和数据处理;

步骤s32:将所述处理后的数据与预设值进行比较,根据比较结果判断所述目标号码是否为骚扰电话号码。

其中,对于实时呼叫信息,也需要对其进行独热编码,其编码方法与历史通话记录的编码类似,不同之处在于实时呼叫信息不包括通话时长。当第i次通话为符合条件的最后一次历史通话时,其实时呼叫信息可以用来表示。

图9从整体示出了骚扰电话号码识别方法的数据流转示意图,参考图9,骚扰电话号码识别主要包括两部分,一部分是循环神经网络模块,另一部分是骚扰电话检测模块。其中,循环神经网络模块主要负责对每一次通话产生的通话记录进行迭代分析处理,其具体处理过程可参考上述结合图6进行描述的内容,在此不再赘述,下面主要来介绍骚扰电话检测模块的检测过程。

以第i次通话为符合条件的最后一次历史通话为例,当接收到呼叫请求时,获取发起呼叫请求的目标号码p、目标号码的实时呼叫信息以及目标号码的历史通话迭代参量骚扰电话检测模块将实时呼叫信息和历史通话迭代参量进行合并和数据处理,得到一个处理后的数据并将该与预设值进行比较,根据比较结果判断目标号码是否为骚扰电话号码并输出检测结果在某一实施例中,输出1时,代表目标号码是骚扰电话号码,输出0时,代表目标号码不是骚扰电话号码。

进一步从时间角度来说,骚扰电话检测模块将循环神经网络模块输出的参量与其对应的每一次实时呼叫信息进行结合,经计算后得到对应的处理后的数据将处理后的数据与预设值进行比较后,得到对应的检测结果可以看出,在每次获得实时呼叫信息时,骚扰电话检测模块都会判断目标号码是否是骚扰电话号码,如此实时对骚扰电话号码进行判定,使得在该目标号码被激活使用后,在前几个通话内就能判断出目标号码是否是骚扰电话号码,实现对骚扰电话号码识别的实时预测机制,在早期阶段识别出骚扰电话号码的身份,进而对该骚扰电话号码采取相应的措施,有效阻止恶意商家/用户/软件对骚扰电话号码进行利用。

另外,为了提高识别骚扰电话号码的准确性,在某一实施例中,还可根据通话次数来确定是否对目标号码进行检测,参考图10所示的骚扰电话号码识别方法的流程示意图,该方法可以包括如下操作:

步骤b1:当所述目标号码的通话符合条件时,记录目标号码的历史通话次数;

假设以目标号码发起主叫的通话作为符合条件的通话,则当目标号码每次新发起主叫时,统计并更新目标号码的历史通话次数。

步骤b2:当所述历史通话次数在预设次数以上时,根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

其中,当通话次数小于预设通话次数时,可以仅通过循环神经网络模块对获得的历史通话记录进行分析以不断更新历史通话迭代参量,而骚扰电话检测模块并不判断目标号码是否为骚扰电话号码,而当通话次数在预设通话次数时以上时,循环神经网络模块可以继续根据获得的历史通话记录来更新历史通话迭代参量,骚扰电话检测模块开始根据历史通话迭代参量和实时呼叫信息来判断目标号码是否为骚扰电话号码。

在某一实施例中,步骤s31具体包括:将所述历史通话迭代参量和当前实时呼叫信息进行合并和数据处理,并添加偏移量,获得一个实数值,其中,所述实数值的取值范围在[0,1]之间。

具体来说,可以将历史通话迭代参量和实时呼叫信息进行向量拼接,然后点积一个和它一样长的向量来得到一个具体的标量,然后为该标量添加一个偏移量,得到一个线性加和的结果,最后通过非线性的sigmoid函数将前面得到的结果转化为一个[0,1]之间的实数值

其中,向量的拼接是指向量维度的拼接,举例来说,历史通话迭代参量维,实时呼叫信息有b维,拼接在一起可以得到一个a+b维的向量。

其中,偏移量适于将计算结果进行数据平移,以便得到一个为正的数值,便于后续使用sigmoid函数进行数据转换。

在某一实施例中,如图11所示的骚扰电话号码识别方法的流程示意图,在步骤s3之后还包括:

步骤s4、当确定目标号码为骚扰电话号码时,拦截当前呼叫请求和/或将目标号码标记为骚扰电话号码;

步骤s5、当确定目标号码不是骚扰电话号码时,响应目标号码发出的呼叫请求信号。

在某一实施例中,当目标号码向被叫号码发起呼叫请求时,还可以先检测目标号码是否已经被标记为骚扰电话号码,如果已经被标记为骚扰电话号码,则可以直接拦截该呼叫请求。

在某一实施例中,当目标号码与被叫号码通话结束后,或者被叫号码主动拒接目标号码发起的呼叫后,骚扰电话号码识别装置2获取相应的通话记录,并将该通话记录输入到循环神经网络模块中,循环神经网络模块根据该通话记录进行迭代分析处理,获得更新后的历史通话迭代参量。

在某一实施例中,对于已经标记为骚扰电话的号码,循环神经网络模块还可以继续动态分析该号码的历史通话记录,并根据分析结果决定是否撤回对该号码的标记。

当一个电话号码被激活后,为了在前几个通话内就识别出该号码是否是骚扰电话号码,在某些实施例中,还可以根据目标号码进行通话的次数设置对应历史通话记录的权值,具体来说,可以根据通话次数设置对应历史通话记录的权重损失,其历史通话记录的权重损失随着通话次数的增加而增加,这就使得前期通话的通话记录相对更重要,以便在早期就可以识别出骚扰电话号码。

举例来说,可以通过设置衰减因子δ来设置权重损失随时间变化的程度,以i表示目标号码的通话次数,δ取值为(0,1),如果要实现权重成倍递减,则衰减因子δi可以设置为δi=δi-1,设初始权值为w,历史通话记录对应的权值可以表示为wδi,那么,第一次通话时,历史通话记录对应的权值为w,第二次通话时,历史通话记录对应的权值为wδ,第三次通话时,历史通话记录对应的权值为wδ2,以此类推,由于δ取值为(0,1),因此历史通话记录对应的权值是随通话次数的增加成倍递减的。

图12为本发明某一实施例提供的一种骚扰电话号码识别装置的结构示意图,该装置适于对目标号码进行识别,以检测目标号码是否为骚扰电话号码。如图12所示,该骚扰电话号码识别装置包括:

神经网络模块10,适于利用神经网络对所述目标号码的历史通话记录进行迭代分析并获得历史通话迭代参量;

存储模块20,适于存储所述历史通话迭代参量以及目标号码每一次通话产生的通话记录;

信息获取模块30,适于接收到呼叫请求时,获取发起呼叫请求的目标号码和目标号码的实时呼叫信息;

骚扰电话检测模块40,适于根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

具体来说,当目标号码发起呼叫请求时,信息获取模块30获取目标号码和目标号码的实时呼叫信息,并向骚扰电话检测模块40发送获取的信息,骚扰电话检测模块40根据信息获取模块30获取的实时呼叫信息以及存储模块20中存储的历史通话迭代参量检测所述目标号码是否为骚扰电话号码。当通话结束后,存储模块20存储目标号码本次通话产生的通话记录,神经网络模块10根据该新的通话记录更新历史通话迭代参量,并将更新后的历史通话迭代参量存入存储模块20中,以便目标号码下次发起通话时,骚扰电话检测模块40根据更新后的历史通话迭代参量和下次通话的实时呼叫信息对目标号码进行骚扰电话识别。

在某一实施例中,神经网络模块10、存储模块20、信息获取模块30以及骚扰电话检测模块40可以设置于客户端中,也可以设置于服务器中,还可以部分设置在客户端中,部分设置在服务器中。

进一步,所述神经网络模块10具体适于:

利用神经网络对所述目标号码每一次符合条件的通话所对应的历史通话记录进行迭代处理,并获得处理后的历史通话迭代参量,其中,所述符合条件的通话包括所述目标号码主动发起的历史电话呼叫。

进一步,所述神经网络模块10包括获取单元和第一处理单元,所述神经网络模块10通过获取单元和第一处理单元对每一次符合条件的通话所对应的历史通话记录进行迭代处理,直至第i次通话为符合条件的最后一次历史通话;

其中,所述获取单元,适于获取第i次通话的历史通话记录以及神经网络对前i-1次的历史通话记录进行分析所获得的历史通话迭代参量;

所述第一处理单元,适于利用神经网络根据第i次通话的历史通话记录对前i-1次的历史通话记录对应的历史通话迭代参量进行更新,以获得前i次的历史通话记录所对应的历史通话迭代参量。

进一步,所述第一处理单元具体包括:

第一处理子单元,适于根据第i次通话的历史通话记录和前i-1次的历史通话记录对应的历史通话迭代参量获得更新门和忘记门,其中,所述更新门适于根据第i次通话的历史通话记录对前i-1次历史通话记录对应的历史通话迭代参量中的数据进行更新处理,所述忘记门适于根据第i次通话的历史通话记录对前i-1次历史通话记录对应的历史通话迭代参量中的数据进行过滤处理;

第二处理子单元,适于根据第i次通话的历史通话记录、前i-1次的历史通话记录对应的历史通话迭代参量、更新门以及忘记门获得前i次的历史通话记录所对应的历史通话迭代参量。

进一步,所述神经网络模块10还包括:

数据转换单元,适于在获得前i次的历史通话记录所对应的历史通话迭代参量之后,将前i次的历史通话记录所对应的历史通话迭代参量进行数据转换,使得转换后的历史通话迭代参量适于呈现不同的参量输出形式,以便和实时呼叫信息的形式相匹配。

进一步,所述第一处理子单元还包括:

根据第i次通话的历史通话记录、前i-1次的历史通话记录对应的历史通话迭代参量以及相应的学习模型获得更新门和忘记门,其中,所述学习模型适于对历史通话记录和历史通话迭代参量中的数据进行处理操作,所述处理操作包括如下一种或者其任意组合::

按照设定规则抓取符合条件的数据;

按照设定规则删除数据;

按照设定规则对数据进行更新。

进一步,当i为1时,前i-1次的历史通话记录对应的历史通话迭代参量为预设初始信息。

进一步,所述骚扰电话检测模块40具体包括:

第二处理单元,适于将所述历史通话迭代参量和当前实时呼叫信息进行拼接和数据处理;

比较判断单元,适于将处理后的数据与预设值进行比较,根据比较结果判断所述目标号码是否为骚扰电话号码。

进一步,所述第二处理单元具体适于:

将所述历史通话迭代参量和当前实时呼叫信息进行拼接和数据处理,并添加偏移量,获得一个实数值,其中,所述实数值的取值范围在[0,1]之间。

进一步,还包括:

拦截/标记模块50,适于当骚扰电话检测模块40确定目标号码为骚扰电话号码时,拦截当前呼叫请求和/或将目标号码标记为骚扰电话号码;

响应模块60,适于当确定目标号码不是骚扰电话号码时,响应目标号码发出的呼叫请求信号。

进一步,所述信息获取模块还适于,当通话结束时,获取本次通话记录;

所述神经网络模块还适于,利用神经网络根据信息获取模块新获取的通话记录对目标号码的历史通话记录进行更新,获得更新后的历史通话迭代参量。

所述拦截/标记模块还适于:

当接收到标记为骚扰电话的号码发起的呼叫请求时,拦截当前呼叫请求。

进一步,还包括:

通话次数记录模块70,适于当所述目标号码的通话符合条件时,记录目标号码的历史通话次数;

所述骚扰电话检测模块40还适于,当所述历史通话次数在预设次数以上时,根据所述历史通话迭代参量和当前实时呼叫信息检测所述目标号码是否为骚扰电话号码。

进一步,所述历史通话记录包括以下信息中的至少一种:

目标号码发起呼叫请求时的时间戳、目标号码是否在被叫号码联系人列表中以及通话时长。

进一步,所述实时呼叫信息包括以下信息中的至少一种:

目标号码发起呼叫请求时的时间戳以及目标号码是否在被叫号码联系人列表中。

本发明的骚扰电话号码识别装置与本发明任意实施例所提供的骚扰电话号码识别方法属于同一发明构思,可执行本发明任意实施例所提供的骚扰电话号码识别方法,具备执行方法相应的功能模块和有益效果。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1