一种基于号码模式的黑号码识别方法与流程

文档序号:11157099阅读:548来源:国知局
一种基于号码模式的黑号码识别方法与制造工艺

本发明涉及一种基于号码模式的黑号码识别方法,属于网络通信技术领域。



背景技术:

目前,一些诈骗骚扰份子通过改号软件生成大量连号号码进行电话诈骗或骚扰,同时,在现有的黑名单号码库中也发现了大量相似度极高的黑号码。这类黑号码通常长度固定,只更改其中某几位的号码,符合同一个号码模式。这类黑号码中,由于其单一号码的日呼叫频次极低,因此导致命中现有策略的概率不高,有大量黑号码并没有进行拦截。因此,如何根据这类号码之间的相似规律,找到表征其相似规律的号码模式,最终,能根据号码模式来识别其他未被拦截的号码同时对其进行治理,已成为技术人员急需解决的技术问题,目前还未发现相关技术解决方案。



技术实现要素:

有鉴于此,本发明的目的是提供一种基于号码模式的黑号码识别方法,能根据黑号码之间的相似规律来挖掘黑号码模式,从而有效识别现网中的未知黑号码。

为了达到上述目的,本发明提供了一种基于号码模式的黑号码识别方法,包括有:

步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;

步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;

步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码。

与现有技术相比,本发明的有益效果是:本发明通过从大量相似度极高的黑号码之间挖掘黑号码模式,并根据黑号码模式来识别出现网中未被发现的黑号码,技术方案简单易行,并对现网无需任何改变,从而具有较高的实用性和有效性。

附图说明

图1是本发明一种基于号码模式的黑号码识别方法流程图。

图2是图1步骤二的具体操作流程图。

图3是图2步骤25的具体操作流程图。

图4是计算两个号码之间的相似度的具体操作流程图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。

如图1所示,本发明一种基于号码模式的黑号码识别方法,包括有:

步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;

步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则表明两条相邻号码符合同一号码模式,提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;

步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码。

步骤一中,黑号码可能是诈骗、骚扰等非法号码,可以根据手机、座机等号码位数的不同,将黑号码进一步细分为:手机黑号码模式表、座机黑号码模式表、和其他黑号码模式表等。

如图2所示,图1步骤二还可以进一步包括有:

步骤21、初始化迭代序号t为1;

步骤22、初始化号码模式标识符flag为0、号码序号i为1,并初始化第t次迭代的新增号码数Am(t)为0;

步骤23、从黑号码模式表中提取第i、i+1条号码;

在多次迭代后,黑号码模式表中的第i或i+1条号码是黑号码、或者带有号码模式符的黑号码模式;

步骤24、计算第i、i+1条号码之间的相似度,并判断第i、i+1条号码之间的相似度值是否超过一定阈值?如果是,则继续下一步;如果否,则转向步骤27;

步骤25、逐一从第i、i+1条号码中提取每一位号码符,并判断处于相同位序上的两个号码符是否相同,然后将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上;

步骤26、将p作为一条新增号码保存到黑号码模式表中,更新flag为1,更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,然后转向步骤28;

步骤27、判断flag是否为0?如果是,则将第i条号码作为一条新增号码保存到黑号码模式表中,更新flag为0,更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,然后继续下一步;如果否,则更新flag为0,然后继续下一步;

步骤28、更新i:i=i+1,然后判断是否已提取完黑号码模式表中的所有号码?如果是,则继续下一步;如果否,则转向步骤23;

步骤29、判断第t次迭代的新增号码数Am(t)和第t-1次迭代的新增号码数Am(t-1)是否相同?如果是,则说明多次迭代后黑号码模式表中的所有结果处于收敛状态,删除黑号码模式表中不包含有号码模式符的黑号码,本流程结束;如果否,则更新t:t=t+1,然后转向步骤22。

步骤29中,删除黑号码模式表中不包含有号码模式符的黑号码后,黑号码模式表中所剩下的都是带有号码模式符的黑号码模式,将所有黑号码模式按正则表达式进行描述,将待识别号码和其一一匹配,并根据匹配结果判断待识别号码是否是黑号码。

如图3所示,图2步骤25还可以进一步包括有:

步骤251、设置号码位序n为1;

步骤252、判断第i、i+1条号码在第n位序上的号码符是否相同?如果是,则将相同的号码符写入到黑号码模式p的第n位序上,然后继续下一步;如果否,则将一个号码模式符(例如*)写入到黑号码模式p的第n位序上,然后继续下一步;

步骤253、更新n:n=n+1,并判断n是否大于第i条号码的号码位数?如果是,则本流程结束;如果否,则转向步骤252。

如图4所示,计算两条号码之间的相似度,还可以进一步包括有:

步骤A1、计算两条号码之间的海明距离:逐一比较两条号码在每一位上的号码符是否相同,并统计不同号码符的个数,所述不同号码符的个数即是两条号码之间的海明距离;

例如,两条黑号码13511223344、13521456874之间的海明距离为6,黑号码13511223344和黑号码模式135*1*53*74之间的海明距离为5,两条黑号码模式135*1*53*74、136*1**3*74之间的海明距离为2;

步骤A2、计算两条号码之间的相似度:其中Sim(Ni,Nj)是号码Ni、Nj之间的相似度,hm(Ni,Nj)是号码Ni、Nj之间的海明距离,L是号码Ni或Nj的号码位数。

例如,两条号码:13512134560和13512475670,分别在第6、7、8、9、10位上的号码符不同,不同号码符的个数为5,则它们之间的海明距离是5,相似度为

使用本发明方法对2016年6月6日获得的黑号码表进行号码模式训练,共得到14条黑号码模式。将第二天的黑号码表中的黑号码和这14条黑号码模式进行匹配,共发现7条符合黑号码模式的黑号码,占总数的95%左右,因此,经过实验验证,本发明可以在现网中有效地识别黑号码,并且进行拦截。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1