一种基于号码模式的黑号码识别方法与流程

文档序号:11157099阅读:来源:国知局

技术特征:

1.一种基于号码模式的黑号码识别方法,其特征在于,包括有:

步骤一、将位数相同的多条已知黑号码按一定顺序写入黑号码模式表中;

步骤二、从黑号码模式表中逐一提取每两条相邻号码,并计算相邻号码之间的相似度,当其相似度值超过阈值时,则提取两条相邻号码在对应位序上的相同号码符来构成一条黑号码模式,并写入到黑号码模式表中;

步骤三、将待识别号码和黑号码模式表中的所有黑号码模式逐一进行匹配,如果待识别号码和黑号码模式表中的一条黑号码模式匹配一致,则待识别号码是黑号码。

2.根据权利要求1所述的方法,其特征在于,步骤一中,根据号码位数的不同,将黑号码进一步细分为:手机黑号码模式表、座机黑号码模式表、和其他黑号码模式表。

3.根据权利要求1所述的方法,其特征在于,步骤二进一步包括有:

步骤21、初始化号码模式标识符flag为0、号码序号i为1;

步骤22、从黑号码模式表中提取第i、i+1条号码;

步骤23、计算第i、i+1条号码之间的相似度,并判断第i、i+1条号码之间的相似度值是否超过一定阈值,如果是,则继续下一步;

步骤24、逐一从第i、i+1条号码中提取每一位号码符,并判断处于相同位序上的两个号码符是否相同,然后将相同的号码符写入到黑号码模式p的对应位序上,将不同的号码符替换成统一的号码模式符写入到黑号码模式p的对应位序上;

步骤25、将p作为一条新增号码保存到黑号码模式表中,更新flag为1,然后转向步骤26;

步骤26、更新i:i=i+1,然后判断是否已提取完黑号码模式表中的所有号码,如果否,则转向步骤22。

4.根据权利要求3所述的方法,其特征在于,步骤23中,当第i、i+1条号码之间的相似度值未超过一定阈值时,还包括有:

步骤A、判断flag是否为0,如果是,则将第i条号码作为一条新增号码保存到黑号码模式表中,更新flag为0,然后继续步骤26;如果否,则更新flag为0,然后继续步骤26。

5.根据权利要求4所述的方法,其特征在于,步骤21之前还包括有:

步骤20、初始化迭代序号t为1,这样,

步骤21中还包括有:初始化第t次迭代的新增号码数Am(t)为0,

步骤25和步骤A中,将p或第i条号码作为一条新增号码保存到黑号码模式表中,同时还包括有:更新第t次迭代的新增号码数Am(t):Am(t)=Am(t)+1,

步骤26中,当已提取完黑号码模式表中的所有号码时,还包括有:

步骤27、判断第t次迭代的新增号码数Am(t)和第t-1次迭代的新增号码数Am(t-1)是否相同,如果是,则删除黑号码模式表中不包含有号码模式符的黑号码,本流程结束;如果否,则更新t:t=t+1,然后转向步骤21。

6.根据权利要求3所述的方法,其特征在于,步骤24还进一步包括有:

步骤241、设置号码位序n为1;

步骤242、判断第i、i+1条号码在第n位序上的号码符是否相同,如果是,则将相同的号码符写入到黑号码模式p的第n位序上,然后继续下一步;如果否,则将一个号码模式符写入到黑号码模式p的第n位序上,然后继续下一步;

步骤243、更新n:n=n+1,并判断n是否大于第i条号码的号码位数,如果是,则本流程结束;如果否,则转向步骤242。

7.根据权利要求1所述的方法,其特征在于,步骤三中,将黑号码模式表中的所有黑号码模式按正则表达式进行描述,将待识别号码和其一一匹配,并根据匹配结果判断待识别号码是否是黑号码。

8.根据权利要求1所述的方法,其特征在于,计算两条号码之间的相似度,进一步包括有:

步骤B1、计算两条号码之间的海明距离:逐一比较两条号码在每一位上的号码符是否相同,并统计不同号码符的个数,所述不同号码符的个数即是两条号码之间的海明距离;

步骤B2、计算两条号码之间的相似度:其中Sim(Ni,Nj)是号码Ni、Nj之间的相似度,hm(Ni,Nj)是号码Ni、Nj之间的海明距离,L是号码Ni或Nj的号码位数。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1