电话号码识别方法及装置与流程

文档序号:11583649阅读:1230来源:国知局
电话号码识别方法及装置与流程

本申请涉及计算机网络技术领域,尤其涉及电话号码识别方法及装置。



背景技术:

各大互联网公司均有关键词过滤系统,其中部分公司有在文本内检测手机号码的需求,号码检测通常与其他关键词组合使用,以是否能够促成完整的交易进行风险评估。例如,在目前的很多社交论坛,个人网站上,经常会出现售卖违法违禁品和提供色情服务的信息,并留下各种正常与变式的手机号码(如18810450382,①⑧8①=o⑷⑸0=3⒏⒋),这种情况下需要在网页中检测这些手机号码并提取。

目前对于网页中手机号码的提取主要是基于正则表达式,将手机号码的特定抽取规则转换成正则表达式,然而,该方法存在如下不足:

1、占用内存大,运行效率低

从本质上讲,正则表达式引擎可笼统分为两类:确定性有限状态自动机(deterministicfiniteautomaton,dfa)引擎和非确定性有限状态自动机(nfa)引擎。针对大量手机号码构造确定性有限状态自动机需要占用较多的内存,匹配速度较快;而非确定性有限状态自动机是回溯引擎,可以处理更复杂的正则表达式,但是匹配速度较确定性有限状态自动机慢。

2、匹配精准度差、不容易应付大量的变形手机号码的情况

正则表达式很难写的非常精确。仅手机号段匹配一项,目前已存在的超过100个,数字的规则性不够强,很难在正则表达式中精确的匹配这些号段名,只能处理一些相对规则简单的手机号码,容错性不够,对于大量非法网页中的变形手机号码(如:188=1o45=384)并不能正确识别出。

3、具有安全漏洞

如果正则表达式对外泄露或者被外界探测出,外界即可以构造出一个可以规避当前表达式的手机号码。



技术实现要素:

本申请实施例提供一种电话号码识别方法,用以高速、精确地检测电话号码及各种变式的电话号码,该方法包括:

获取电话号段及电话号段变式;

根据电话号段及电话号段变式构造确定性有限状态自动机;

根据所述确定性有限状态自动机查找待检测目标数据中的电话号段;

对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

本申请实施例还提供一种电话号码识别装置,用以高速、精确地检测电话号码及各种变式的电话号码,该装置包括:

号段获取模块,用于获取电话号段及电话号段变式;

自动机构造模块,用于根据电话号段及电话号段变式构造确定性有限状态自动机;

号段查找模块,用于根据所述确定性有限状态自动机查找待检测目标数据中的电话号段;

号码识别模块,用于对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

本申请实施例提供一种电话号码识别方法,用以高速、精确地检测电话号码及各种变式的电话号码,该方法包括:

根据确定性有限状态自动机查找待检测目标数据中的电话号段,所述确定性有限状态自动机根据预设电话号段及电话号段变式构造;

对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

本申请实施例还提供一种电话号码识别装置,用以高速、精确地检测电话号码及各种变式的电话号码,该装置包括:

号段查找模块,用于根据确定性有限状态自动机查找待检测目标数据中的电话号段,所述确定性有限状态自动机根据预设电话号段及电话号段变式构造;

号码识别模块,用于对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

一个实施例中,所述电话号段变式根据电话号段生成;所述预设电话号段及电话号段变式存储于数据库中。

一个实施例中,在有新的电话号段时,所述数据库添加入新的电话号段和根据新的电话号段生成的新的电话号段变式。

一个实施例中,所述确定性有限状态自动机包括二数组前缀树,所述二数组前缀树包括状态数组及前驱状态数组;

所述号段查找模块具体用于:在所述二数组前缀树中输入待检测目标数据,查找待检测目标数据中的电话号段。

一个实施例中,该装置还包括:

预处理模块,用于对待检测目标数据进行预处理,所述预处理包括标签去除、字符转换和字符过滤其中之一或任意组合;

所述号段查找模块具体用于:根据确定性有限状态自动机查找预处理后的待检测目标数据中的电话号段。

一个实施例中,该装置还包括:

规则检查模块,用于对识别出的电话号码进行规则检查,所述规则检查包括数字群组检查、数字频率检查和号码宽度检查其中之一或任意组合。

本申请实施例中,根据确定性有限状态自动机查找待检测目标数据中的电话号段,确定性有限状态自动机根据预设电话号段及电话号段变式构造;对查找到的电话号段,通过电话号码范式匹配识别出电话号码;其中对于电话号段匹配部分采用了构造确定性有限状态自动机,该部分仅需匹配已知号段和字符替代的变形号段,所占用的内存很小,匹配速度快;对于电话号码匹配部分采用了电话号码范式匹配,该部分进行数组内的字符匹配,具有较高的效率;实施过程中不但能够匹配出电话号码,也容易应付大量的变形电话号码的情况,匹配精准度高;且由于采取的是非表达式检测法完成整套检测,不容易被泄露且无法被探测,安全性大大提高。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本申请实施例中电话号码识别方法的流程示意图;

图2为本申请实施例中电话号码识别方法的具体实例过程示意图;

图3为本申请实施例中数据库处理和确定性有限状态自动机构建的示例图;

图4为本申请实施例中采用java实现网页手机号码识别方法的示例图;

图5为本申请实施例中另一电话号码识别方法的流程示意图;

图6为本申请实施例中电话号码识别装置的结构示意图;

图7为本申请实施例中图6所示电话号码识别装置的一具体实例的结构示意图;

图8为本申请实施例中图6所示电话号码识别装置的另一具体实例的结构示意图;

图9为本申请实施例中图6所示电话号码识别装置的又一具体实例的结构示意图;

图10为本申请实施例中另一电话号码识别装置的结构示意图;

图11为本申请实施例中图10所示电话号码识别装置的一具体实例的结构示意图;

图12为本申请实施例中图10所示电话号码识别装置的另一具体实例的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本申请实施例做进一步详细说明。在此,本申请的示意性实施例及其说明用于解释本申请,但并不作为对本申请的限定。

为了在待检测目标数据(例如网页、文本等)中高速、精确的检测是否含有电话号码(例如手机号码、座机号码),以及对各种变式的电话号码均具有很好的适应性,本申请实施例提供一种电话号码识别方法。

本申请实施例中提及的确定性有限状态自动机是一个能实现状态转移的自动机。对于一个给定的属于该自动机的状态和一个属于该自动机字母表∑的字符,它都能根据事先给定的转移函数转移到下一个状态(这个状态可以是先前那个状态)。本申请实施例中根据电话号段及电话号段变式构造确定性有限状态自动机。

根据本申请一个实施例,在构造确定性有限状态自动机时,例如可以根据预设的电话号段及电话号段变式构造二数组前缀树。其中预设的电话号段及电话号段变式可以是全部电话号段及电话号段变式,也可以是预设的部分电话号段及电话号段变式。trie(前缀树或称字典树)是一种有序树,用以保存关联数组。二数组trie(double-arraytrie)包括状态数组(base数组)及前驱状态数组(check数组)。其中base数组的每个元素表示一个trie节点,即一个状态;check数组表示某个状态的前驱状态。

下面举一例说明根据电话号段及电话号段变式构造确定性有限状态自动机的过程。本例中采用的是构造一个二数组trie,具体步骤可以包括:

1、初始化代表状态的数组base[]和用以检查前驱状态的数组check[],数组类型均有int[]型。初始值例如可设为:base[0]=1;check[0]=0。

2、对于每一群兄弟节点,如[a1,a2,a3…an],寻找一个begin值,使得check[begin+a1…an]=0,也就是找到了n个空闲空间用以存放这些值。

3、将这群兄弟节点的check值设置为check[begin+an]=begin。

4、如果这个兄弟节点没有孩子,设置其base值为负值;否则,在该节点下插入孩子(begin=当前节点base值,重复步骤2)。

5、所有的号段均插入完成,则该确定性有限状态自动机构造完毕。

在构造完确定性有限状态自动机后,根据该确定性有限状态自动机查找待检测目标数据中的电话号段。实施例中,可以在上述构造的二数组前缀树中输入待检测目标数据,查找待检测目标数据中的电话号段。例如,在构造完成的二数组trie中查找待检测目标数据中是否包含电话号段的过程可以包括:

1、定义当前状态p为base[0]=1,依次查询需要查找的字符串char的每一个字符;

2、设当前需要查找的字符串下标为n,则新输入的字符为char[n],跳转到的新状态为base[char[n-1]]+char[n],检查check数组,若check[base[char[n-1]+char[n]]]=base[char[n-1]],代表匹配成功,下一次匹配从当前状态开始。否则,匹配失败,匹配过程结束。

如图1所示,本申请实施例中电话号码识别方法可以包括:

步骤101、获取电话号段及电话号段变式;在某些实施例中可以获取全部电话号段及电话号段变式,或者可以获取预设的部分电话号段及电话号段变式;

步骤102、根据电话号段及电话号段变式构造确定性有限状态自动机;

步骤103、根据确定性有限状态自动机查找待检测目标数据中的电话号段;

步骤104、对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

由图1所示流程可以得知,与现有技术中针对大量手机号码构造确定性有限状态自动机或非确定性有限状态自动机的技术方案相比,本申请实施例中对于电话号段匹配部分采用了构造确定性有限状态自动机,该部分仅需匹配已知号段(以手机号段为例,仅有200多个已知号段)和字符替代的变形号段,所占用的内存很小,匹配速度快;对于电话号码匹配部分采用了电话号码范式匹配,该部分进行数组内的字符匹配,具有较高的效率。并且,本申请实施例的匹配精准度高,也容易应付大量的变形电话号码的情况;由于采取的是非表达式检测法完成整套检测,不容易被泄露且无法被探测。

具体实施时,利用电话号段作为电话号码匹配的切入点,通过电话号段及电话号段变式构造一个确定性有限状态自动机,提高匹配效率。实施时先获取电话号段及电话号段变式,为后续构造确定性有限状态自动机提供词库。在实施例中,电话号段及电话号段变式可以存储于一数据库中,从数据库中获取电话号段及电话号段变式。在从数据库中获取电话号段及电话号段变式之前,需要先获取电话号段,根据电话号段生成电话号段变式,增强对变式电话号码的识别,将电话号段及电话号段变式存入数据库。为了应对实际应用中遇到的各种变式电话号码,在自动根据电话号段生成电话号段变式时,主要进行字符的替换,例如130的手机号段,需要生成i30,13o,i3o的号段各一个,然后自动存入数据库。

现有技术中利用正则表达式匹配灵活性较差,当需要对一些新特征进行匹配时,往往需要修改整个正则表达式。而在本申请实施例中,可以动态将当前的已知的电话号段添加到数据库并自动构造确定性有限状态自动机。具体实施时,在有新的电话号段时,可以根据新的电话号段生成新的电话号段变式,将新的电话号段和新的电话号段变式添加到数据库。电话号段的更新通常很慢,开始的时候可以一次性的把已知的号段加到数据库,运营商更新出新的号段时候再及时添加到数据库。

在数据库中存储了电话号段及电话号段变式后,就可以根据数据库里面的词库构建出确定性有限状态自动机。在构造完确定性有限状态自动机后,根据该确定性有限状态自动机查找待检测目标数据中的电话号段。

实施例中,为了进一步提高电话号码检测的精确性,还可以在根据确定性有限状态自动机查找待检测目标数据中的电话号段之前,对待检测目标数据进行预处理,后续对预处理后的待检测目标数据,根据确定性有限状态自动机查找电话号段。其中预处理例如可以包括标签去除、字符转换和字符过滤等处理其中之一或任意组合。例如,网页文本可能包含有大量的html标签,针对html标签,可以使用htmlparser的开源项目进行标签去除,获得纯文本。又如,非法网页的手机号码往往是变式的,中间夹带各种特色字符,如1=881o=450=38④,对于获取到的纯文本,可以进行字符转换和字符过滤,如大小写转换、数字转换和特殊字符过滤等,具体实施时可以自定义一些转换和过滤的字符文件库以供比对应用。例如上面的号码通过进行转换变成了18810450384。实施例中,转换文本与原文本的映射关系可以存在一个数组里面,后续可以通过查询该数组从转换文本位置还原到原文本的位置里面。

在查找出待检测目标数据中的电话号段后,需要进一步对查找到的这些电话号段,通过电话号码范式匹配识别出电话号码。范式是指公认的具有某一格式的数据结构,一种公认的规范好的数据形式。比如中国手机号码,号码范式可以是11位数字,运营商号段(3位)+地区号段(4位)+用户号码(4位)。电话号码的定义并没有严格的规定,以手机号码为例,匹配时例如可以将只有11位长度和前面的3位特殊号段作为识别条件。例如,可以考虑到中国的区号86,号码的范式是以3位特殊号段开头的连续11位数字,或者前面包含中国区号86字样,后面满足上述条件的连续13位数字。通过这样的规则确定是否为手机号码。实施例中,考虑到非法网页中的大量变式号码,可以对特殊字符例如字符o,i做数字容错处理,即遇到也当成数字处理。

实施例中,上述电话号段和范式的匹配方法过强,可能会造成部分过匹配的现象,针对实际过程中遇到的一些过匹配问题,实施例中可以设置一系列特殊规则进行再检查判别。此外,现有技术中利用正则表达式匹配,灵活性较差,当需要对一些新特征进行匹配时,往往需要修改整个正则表达式。而在本申请实施例中,对于电话号码范式以外的特征匹配,如特殊规则检查,可以采用多规则匹配方法,当需要对新特征进行匹配时,仅需要增加或修改其中的某条规则,因此具有较强的灵活性和适应性。具体实施时,对前述通过电话号码范式识别出的电话号码再进行规则检查,这些规则检查例如可以包括数字群组检查、数字频率检查和号码宽度检查等其中之一或任意组合,这些规则具有很强实用性和便捷性。

其中的数字群组检查例如可以是在如下场景实施:对于某些数据网页,会出现大量类似电话号码的数字串,针对该情况,可以设置数字群组规则,检查号段两端是否是数字或者是“-”等数组连接符,检查该号码是否在数字群组里,对于连续的三号码、多号码情况,可以增加markpoint标志,记录下上一个号码的位置,紧跟其后的数字群组号码可以放行。

数字频率检查例如可以是在如下场景实施:网页中大量不规则的html标签,导致htmlparser并不能很好的去除所有的标签,往往留下大段的css字符串,特殊的数字串很容易造成干扰。根据实际的业余场景,中文网页为主,而css以英文字符为主,统计识别出的号码一定距离内的英文字符和数字的频率,设置阈值,大于阈值的可以认为是css干扰。

号码宽度检查例如可以是在如下场景实施:跨标签的数字组合成电话号码也是干扰源之一,跨标签的特征是数字距离很大,导致还原到网页原文本里,整个号码的宽度异常大,设置合理的宽度阈值可以有效防止这一干扰。

图2为本申请实施例中电话号码识别方法的具体实例过程示意图,如图2所示,本例中先获取预设电话号段,生成变式号段,存入数据库,其中预设的电话号段可以是全部电话号段,也可以是预设的部分电话号段;再根据电话号段及电话号段变式构造确定性有限状态自动机;将待检测目标数据例如网页文本进行预处理后,根据确定性有限状态自动机查找待检测目标数据中的电话号段,其中预处理包括特殊字符转换和特殊字符过滤等;匹配出电话号段后,进行电话号码范式匹配;最后对识别出的电话号码再进行特殊规则检查,如数字群组检查、数字频率检查和号码宽度检查等。图3为本申请实施例中数据库处理和确定性有限状态自动机构建的示例图,如图3所示,将电话号段添加入数据库,生成电话号段变式后也将电话号段变式存入数据库;根据数据库中的电话号段和电话号段变式构建出确定性有限状态自动机。

本申请实施例的电话号码识别方法采用主流编程语言java或c++等均可实现。图4为本申请实施例中采用java实现网页手机号码识别方法的示例图。如图4所示,在java核心系统中,先进行手机号段插入,自动生成手机号段变式,将手机号段及手机号段变式存入mysql数据库;再根据mysql数据库中手机号段及手机号段变式构建出二数组前缀树的确定性有限状态自动机;在输入待匹配网页后,先进行网页文本预处理,再根据确定性有限状态自动机匹配手机号段,手机号段匹配成功后进行手机号码范式匹配,最后进行特殊规则检查,输出匹配结果。

在另一实施例中,上述构造确定性有限状态自动机的过程可以由一个能够实现其功能的设备实施,该设备与后续进行电话号码识别的设备可以是不同设备。如图5所示,本例提供另一电话号码识别方法,包括:

步骤501、根据确定性有限状态自动机查找待检测目标数据中的电话号段,其中确定性有限状态自动机根据预设电话号段及电话号段变式构造;

步骤502、对查找到的电话号段,通过电话号码范式匹配识别出电话号码。

图5所示电话号码识别方法由一进行电话号码识别的设备完成,该设备不同于构造确定性有限状态自动机的设备。

在一个实施例中,电话号段变式根据电话号段生成;预设电话号段及电话号段变式存储于数据库中。在有新的电话号段时,所述数据库添加入新的电话号段和根据新的电话号段生成的新的电话号段变式。

在一个实施例中,当确定性有限状态自动机包括二数组前缀树,所述二数组前缀树包括状态数组及前驱状态数组,可以在所述二数组前缀树中输入待检测目标数据,查找待检测目标数据中的电话号段。

实施例中同样可以对待检测目标数据执行前述预处理过程,也可以对识别出的电话号码执行前述规则检查过程。

基于同一发明构思,本申请实施例中还提供了一种电话号码识别装置,如下面的实施例所述。由于该装置解决问题的原理与电话号码识别方法相似,因此该装置的实施可以参见电话号码识别方法的实施,重复之处不再赘述。

图6为本申请实施例中电话号码识别装置的结构示意图。如图6所示,本申请实施例中电话号码识别装置可以包括:

号段获取模块601,用于获取电话号段及电话号段变式;号段获取模块601是图6所示电话号码识别装置中负责完成获取电话号段及电话号段变式功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件;

自动机构造模块602,用于根据电话号段及电话号段变式构造确定性有限状态自动机;自动机构造模块602是图6所示电话号码识别装置中负责完成构造确定性有限状态自动机功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件;

号段查找模块603,用于根据所述确定性有限状态自动机查找待检测目标数据中的电话号段;号段查找模块603是图6所示电话号码识别装置中负责完成查找电话号段功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件;

号码识别模块604,用于对查找到的电话号段,通过电话号码范式匹配识别出电话号码。号码识别模块604是图6所示电话号码识别装置中负责完成电话号码范式匹配功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

在一个实施例中,所述号段获取模块601具体可以用于:从数据库中获取电话号段及电话号段变式;如图7所示,本例中图6所示电话号码识别装置还可以包括:

数据库处理模块701,用于在所述号段获取模块从数据库中获取电话号段及电话号段变式之前,获取电话号段,根据电话号段生成电话号段变式;将电话号段及电话号段变式存入数据库。数据库处理模块701是图7所示电话号码识别装置中负责完成数据库处理功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

具体实施时,所述数据库处理模块701还可以用于:

在有新的电话号段时,根据新的电话号段生成新的电话号段变式,将新的电话号段和新的电话号段变式添加到数据库。

具体实施时,所述自动机构造模块602具体可以用于:根据电话号段及电话号段变式构造二数组前缀树,所述二数组前缀树包括状态数组及前驱状态数组;

所述号段查找模块603具体可以用于:在所述二数组前缀树中输入待检测目标数据,查找待检测目标数据中的电话号段。

图8为本申请实施例中图6所示电话号码识别装置的具体实例图。如图8所示,图6所示电话号码识别装置还可以包括:

预处理模块801,用于对待检测目标数据进行预处理,所述预处理包括标签去除、字符转换和字符过滤其中之一或任意组合;预处理模块801是图8所示电话号码识别装置中负责完成待检测目标数据预处理功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

所述号段查找模块603具体可以用于:根据所述确定性有限状态自动机查找预处理后的待检测目标数据中的电话号段。实施例中预处理模块801也可以包含于图7所示的电话号码识别装置中。

图9为本申请实施例中图6所示电话号码识别装置的具体实例图。如图9所示,图6所示电话号码识别装置还可以包括:

规则检查模块901,用于对识别出的电话号码进行规则检查,所述规则检查包括数字群组检查、数字频率检查和号码宽度检查其中之一或任意组合。实施例中规则检查模块901也可以包含于图7或图8所示的电话号码识别装置中。规则检查模块901是图9所示电话号码识别装置中负责完成电话号码规则检查功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

图10为本申请实施例中另一电话号码识别装置的结构示意图。如图10所示,本申请实施例中电话号码识别装置可以包括:

号段查找模块1001,用于根据确定性有限状态自动机查找待检测目标数据中的电话号段,确定性有限状态自动机根据预设电话号段及电话号段变式构造;号段查找模块1001是图10所示电话号码识别装置中负责完成查找电话号段功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件;

号码识别模块1002,用于对查找到的电话号段,通过电话号码范式匹配识别出电话号码。号码识别模块1002是图10所示电话号码识别装置中负责完成电话号码范式匹配功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

在一个实施例中,电话号段变式根据电话号段生成;预设电话号段及电话号段变式存储于数据库中。

具体实施时,在有新的电话号段时,数据库添加入新的电话号段和根据新的电话号段生成的新的电话号段变式。

具体实施时,确定性有限状态自动机包括二数组前缀树,所述二数组前缀树包括状态数组及前驱状态数组;

所述号段查找模块1001具体可以用于:在所述二数组前缀树中输入待检测目标数据,查找待检测目标数据中的电话号段。

图11为本申请实施例中图10所示电话号码识别装置的具体实例图。如图11所示,图10所示电话号码识别装置还可以包括:

预处理模块1101,用于对待检测目标数据进行预处理,所述预处理包括标签去除、字符转换和字符过滤其中之一或任意组合;预处理模块1101是图11所示电话号码识别装置中负责完成待检测目标数据预处理功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

所述号段查找模块1001具体可以用于:根据所述确定性有限状态自动机查找预处理后的待检测目标数据中的电话号段。

图12为本申请实施例中图10所示电话号码识别装置的具体实例图。如图12所示,图10所示电话号码识别装置还可以包括:

规则检查模块1201,用于对识别出的电话号码进行规则检查,所述规则检查包括数字群组检查、数字频率检查和号码宽度检查其中之一或任意组合。实施例中规则检查模块1201也可以包含于图11所示的电话号码识别装置中。规则检查模块1201是图12所示电话号码识别装置中负责完成电话号码规则检查功能的部分,可以是软件、硬件或二者的结合,例如可以是完成该提供功能的处理芯片等元器件。

综上所述,本申请实施例中,根据确定性有限状态自动机查找待检测目标数据中的电话号段,确定性有限状态自动机根据预设电话号段及电话号段变式构造;对查找到的电话号段,通过电话号码范式匹配识别出电话号码;其中对于电话号段匹配部分采用了构造确定性有限状态自动机,该部分仅需匹配已知号段和字符替代的变形号段,所占用的内存很小,匹配速度快;对于电话号码匹配部分采用了电话号码范式匹配,该部分进行数组内的字符匹配,具有较高的效率;实施过程中不但能够匹配出电话号码,也容易应付大量的变形电话号码的情况,匹配精准度高;且由于采取的是非表达式检测法,由一整套完整的电话号码识别方法或装置完成整套检测,不容易被泄露且无法被探测,安全性大大提高。另外对于字符的转换和规则判别部分,也采用的是数组内字符匹配,具有较高的效率。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施例而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1