短信号码归属信息的识别方法、装置及存储介质与流程

文档序号:17323279发布日期:2019-04-05 21:39阅读:479来源:国知局
短信号码归属信息的识别方法、装置及存储介质与流程

本发明涉及短信号码识别技术领域,尤其涉及一种短信号码归属信息的识别方法、装置及存储介质。



背景技术:

随着大数据技术的发展,用户收到的来自各个企业的推送短信也日益增多。在现有技术中,短信是由短代或运营商进行发出的,当用户收到短信时,移动终端显示的短信来源都是一个具体的号码,导致用户无法确认该短信的来源,也无法判断该短信的来源是否与短信内容相符。



技术实现要素:

本发明实施例提供一种短信号码归属信息的识别方法,能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度。

本发明实施例一提供一种短信号码归属信息的识别方法,包括如下步骤:

s1:提取若干个初始号码组成初始号码集;

s2:将所述初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将所述替代号码放入替代号码集;将所述替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将所述替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将所述中间号码集中的所有号码作为更新后的初始号码;

s3:对步骤s2进行迭代,直至所述中间号码集中的所有号码被替代变量替换的次数为n,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,n为不小于零的整数,所述前缀号码为排列在所述替代变量之前的号段;

s4:识别所述输出号码集中各个前缀号码对应的归属信息。

作为上述方案的改进,所述重合度具体为:

在所述替代号码集中,未经所述替代变量替换的号段相同的替代号码出现的频数。

作为上述方案的改进,步骤s1还包括:将所述初始号码集拆分为若干个子初始号码集,将所述若干个子初始号码集分别分配至多个处理模块中,并将各个所述子初始号码集中的号码更新为各个处理模块的初始号码。

本发明实施例二对应提供了一种短信号码归属信息的识别装置,包括:处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如本发明实施例一所述的短信号码归属信息的识别方法。

本发明实施例三对应提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如本发明实施例一所述的短信号码归属信息的识别方法。

本发明实施例提供的一种短信号码归属信息的识别方法、装置及存储介质与现有技术相比,具有如下有益效果:

基于重合度的判断通过迭代的方法对大量的号码进行有选择性地合并,能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度,从而缩短了用户确认该短信的来源的时间,并能够在收到短信的同时判断该短信号码的归属信息是否与短信内容相符,避免因无法判断短信归属而无法判断诈骗短信和垃圾短信造成用户的损失。

附图说明

图1是本发明实施例一提供的一种短信号码归属信息的识别方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,是本发明一实施例提供的一种短信号码归属信息的识别方法的流程示意图,包括以下步骤:

s1:提取若干个初始号码组成初始号码集;

s2:将初始号码的最后一位未经替换的字符替换为替代变量,得到替代号码;将替代号码放入替代号码集;将替代号码集中重合度小于预设重合度的替代号码对应的初始号码放入中间号码集;将替代号码集中重合度不小于预设重合度的替代号码进行合并,将合并后的合并号码放入中间号码集;将中间号码集中的所有号码作为更新后的初始号码;

s3:对步骤s2进行迭代,直至中间号码集中的所有号码被替代变量替换的次数为n,选取迭代后得到的中间号码集中所有号码的前缀号码,作为输出号码集;其中,n为不小于零的整数,前缀号码为排列在替代变量之前的号段;

s4:识别输出号码集中各个前缀号码对应的归属信息。

进一步的,重合度具体为:在替代号码集中,未经替代变量替换的号段相同的替代号码出现的频数。

进一步的,步骤s1还包括:将初始号码集拆分为若干个子初始号码集,将若干个子初始号码集分别分配至多个处理模块中,并将各个子初始号码集中的号码更新为各个处理模块的初始号码。

在一个具体的实施例中,企业发送短信是使用企业某一专属号段+随机几位号码的方式进行发送,初始号码集为:{100085126,100085215,100085428,100085691,100085688,1069111243,1069111293,1069111241,1069111249,1069111783,1069111747,1069111764,1022158197},替代变量为x,预设的重合度为4,n为3。

执行步骤s2,可得替代号码集{1008512x,10008521x,10008542x,10008569x,10008568x,106911124x,106911129x,106911124x,106911124x,106911178x,106911174x,106911176x,102215819x},此时替代号码集中不存在重合度不小于4的替代号码,将替代号码放入中间号码集,并将中间号码集中的所有号码作为更新后的初始号码。

执行步骤s3,对步骤s2进行第一次迭代,得到{1000851x6,1000852x5,1000854x8,1000856x1,1000856x8,10691112x3,10691112x3,10691112x1,10691112x9,10691117x3,10691117x7,10691117x4,10221581x7},此时对替代号码集中重合度大于预设重合度的替代号码进行合并,合并后的合并号码为10691112xx,进一步可以得到中间号码集{10691112xx,100085126,100085215,100085428,100085691,100085688,1069111783,1069111747,1069111764,1022158197}。

将上一中间号码集中的号码更新为初始号码,进行第二次迭代,得到{1069111xxx,100085x26,100085x15,100085x28,100085x91,100085x88,1069111x83,1069111x47,1069111x64,1022158x97},此时对替代号码集中重合度大于预设重合度的替代号码进行合并,合并后的合并号码为1069111xxx和100085xxx,进一步可以得到中间号码集{1069111xxx,100085xxx,1022158197}。

此时,中间号码集中的所有号码被替代变量替换的次数已到达3次。

选取中间号码集{1069111xxx,100085xxx,1022158197}中所有号码的前缀号码,得到输出号码集{1069111,100085,1022158197}。

识别号码1069111,100085,1022158197对应的归属信息,该归属信息可以为企业,例如xx通讯集团有限公司,xx银行,xx游戏公司等。

需要说明的是,上述具体实施例仅为示例性的,在实际实施过程中,初始号码集可能包括上万或上亿的初始号码个数,因此,将初始号码集拆分为若干个子初始号码集,将若干个子初始号码集分别分配至多个处理模块中,并将各个子初始号码集中的号码更新为各个处理模块的初始号码,从而在各个处理模块中同时进行合并和归属信息识别,能够有效地提高号码合并效率和归属信息识别效率。

在识别归属信息后,在用户的移动终端上,将原短信号码替换为该归属信息,使用户直接获取发件人的短信号码归属。

本发明实施例二对应提供了一种短信号码归属信息的识别装置,包括处理器、存储器以及存储在存储器中且被配置为由处理器执行的计算机程序,处理器执行计算机程序时实现如本发明实施例一的短信号码归属信息的识别方法。短信号码归属信息的识别装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。短信号码归属信息的识别装置可包括,但不仅限于,处理器、存储器。

本发明实施例三对应提供了一种计算机可读存储介质,其特征在于,计算机可读存储介质包括存储的计算机程序,其中,在计算机程序运行时控制计算机可读存储介质所在设备执行如本发明实施例一的短信号码归属信息的识别方法。

所称处理器可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是短信号码归属信息的识别装置的控制中心,利用各种接口和线路连接整个短信号码归属信息的识别装置的各个部分。

存储器可用于存储计算机程序和/或模块,处理器通过运行或执行存储在存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现短信号码归属信息的识别装置的各种功能。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

其中,短信号码归属信息的识别装置集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。

本发明实施例提供的一种短信号码归属信息的识别方法、装置及存储介质与现有技术相比,具有如下有益效果:

基于重合度的判断通过迭代的方法对大量的号码进行有选择性地合并,能够判断大量短信号码的归属信息,提高用户的信息获取效率和准确度,从而缩短了用户确认该短信的来源的时间,并能够在收到短信的同时判断该短信号码的归属信息是否与短信内容相符,避免因无法判断短信归属而无法判断诈骗短信和垃圾短信造成用户的损失。

需说明的是,以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。另外,本发明提供的装置实施例附图中,模块之间的连接关系表示它们之间具有通信连接,具体可以实现为一条或多条通信总线或信号线。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1