基于递归的电话号码的识别方法及装置的制造方法_5

文档序号:9436225阅读:来源:国知局
余的待识别电话号码串,触发预处理模块执行预处理操作、划分模块执行 划分操作以及识别模块执行识别操作,直至剩余的待识别电话号码串被全部识别完。
[0185] 在本发明一实施例中,预处理模块410还适于:
[0186] 确定原始待识别电话号码串中是否包含指定的分隔符;
[0187] 若原始待识别电话号码串中包含指定的分隔符,则按照该分隔符切分原始待识别 电话号码串,得到切分后的至少两个目标待识别电话号码串。
[0188] 在本发明一实施例中,指定的分隔符包括下列至少之一:顿号、逗号、分号、斜杜、 反斜杠、竖杆。
[0189] 在本发明一实施例中,预处理模块410还适于:
[0190] 在得到切分后的至少两个目标待识别电话号码串之后,对于各个目标待识别电话 号码串,确定该目标待识别电话号码串的头部是否具有国家区号;
[0191] 若是,则去除该目标待识别电话号码串头部的国家区号。
[0192] 在本发明一实施例中,预处理模块410还适于:
[0193] 在去除该目标待识别电话号码串头部的国家区号之后,分析去除了国家区号之后 的目标待识别电话号码串;
[0194] 若目标待识别电话号码串的头部具有地区区号且该地区区号不完整,则补充该地 区区号使其完整;
[0195] 若目标待识别电话号码串的头部具有地区区号且该地区区号重复,则对该地区区 号进行去重处理。
[0196] 在本发明一实施例中,识别模块430还适于:
[0197] 判断第一指定位数的号码串是否满足第一类别电话号码的属性特征;
[0198] 若是,则根据第一类别电话号码的属性特征,确定至少两个探测位数;
[0199] 分别采用各个探测位数对目标待识别电话号码串进行切分,得到切分结果;
[0200] 根据切分结果,从至少两个探测位数中选取最优探测位数对第一指定位数的号码 串进行补全。
[0201 ] 在本发明一实施例中,识别模块430还适于:
[0202] 对于各个探测位数,利用该探测位数对目标待识别电话号码串的、第一指定位数 的号码串之后的电话号码串进行切分,得到第一切分号码和第二切分号码;
[0203] 比较第一切分号码和第二切分号码,确定两者对应位置上号码相同的位数,作为 该探测位数对应的切分结果。
[0204] 在本发明一实施例中,识别模块430还适于:
[0205] 比较各个探测位数对应的号码相同的位数;
[0206] 从各个探测位数中,选取对应号码相同的位数最大的作为最优探测位数;
[0207] 对第一指定位数的号码串补全最优探测位数。
[0208] 在本发明一实施例中,划分模块420,还适于在识别模块判断第一指定位数的号码 串是否符合第一类别电话号码的属性特征之后,若第一指定位数的号码串不符合第一类别 电话号码的属性特征,则选取新的符合电话号码格式的划分规则对目标待识别电话号码串 重新进行划分,得到第二指定位数的号码串;
[0209] 识别模块430,还适于判断第二指定位数的号码串是否符合第二类别电话号码的 属性特征;若是,则根据第二类别电话号码的属性特征,对第二指定位数的号码串进行补 全。
[0210] 在本发明一实施例中,如图5所示,图4展示的装置还可以包括获取模块450,与预 处理模块410相耦合,适于通过以下步骤获取原始待识别电话号码串:
[0211] 从网页中获取兴趣点P0I信息;
[0212] 从P0I信息中提取原始待识别电话号码串。
[0213] 根据上述任意一个优选实施例或多个优选实施例的组合,本发明实施例能够达到 如下有益效果:
[0214] 在本发明实施例中,首先对原始待识别电话号码串进行与电话号码格式相关的 预处理操作,使得预处理操作后的目标待识别电话号码串与电话号码格式一致,以便于后 续基于预处理操作后的目标待识别电话号码串进行电话号码的识别,提高电话号码的识别 率。并且,本发明实施例结合不同类别的电话号码(如固定电话或移动电话等)具有的特 征,采用不同类别的电话号码对应的电话号码格式的划分规则对目标待识别电话号码串进 行划分,根据划分得到的第一指定位数的号码串识别出其对应的电话号码的类别,实现对 不同类别的电话号码的有效识别。进一步,在识别出第一指定位数的号码串对应的电话号 码的类别之后,如果仍然存在剩余的待识别电话号码串,则本发明实施例基于递归操作,则 对剩余的待识别电话号码串进行重复递归,直至剩余的待识别电话号码串被全部识别完。
[0215] 另外,本发明实施例还结合了同一个电话单元中的两个固定电话或移动电话有很 大的相似性的特点,采用后向探测位数判定的方案,对目标待识别电话号码串进行探测、识 另IJ,进一步提高了电话号码识别的准确性。
[0216] 在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施 例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构 和技术,以便不模糊对本说明书的理解。
[0217] 类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在 上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施 例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保 护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面 的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此, 遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身 都作为本发明的单独实施例。
[0218] 本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地 改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单 元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或 子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任 何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开 的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代 特征来代替。
[0219] 此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例 中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的 范围之内并且形成不同的实施例。例如,在权利要求书中,所要求保护的实施例的任意之一 都可以以任意的组合方式来使用。
[0220] 本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行 的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用 微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的基于递归的电话号码的 识别装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里 所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产 品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个 信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任 何其他形式提供。
[0221] 应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领 域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中, 不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词"包含"不排除存在 未列在权利要求中的元件或步骤。位于元件之前的单词"一"或"一个"不排除存在多个这 样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来 实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件 项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为 名称。
[0222] 至此,本领域技术人员应认识到,虽然本文已详尽示出和描述了本发明的多个示 例性实施例,但是,在不脱离本发明精神和范围的情况下,仍可根据本发明公开的内容直接 确定或推导出符合本发明原理的许多其他变型或修改。因此,本发明的范围应被理解和认 定为覆盖了所有这些其他变型或修改。
[0223] 本发明实施例还公开了:A1、一种基于递归的电话号码的识别方法,包括:
[0224] 预处理操作,对原始待识别电话号码串进行与电话号码格式相关的预处理,得到 处理后的目标待识别电话号码串;
[0225] 划分操作,从初始位置起,根据符合电话号码格式的划分规则对所述目标待识别 电话号码串进行划分,得到第一指定位数的号码串;
[0226] 识别操作,识别出所述第一指定位数的号码串对应的电话号码的类别;
[0227] 递归操作,如果仍然存在剩余的待识别电话号码串,则对剩余的待识别电话号码 串进行重复递归,直至剩余的待识别电话号码串被全部识别完。
[0228] A2、根据A1所述的方法,其中,对剩余的待识别电话号码串进行重复递归,包括:
[0229] 对剩余的待识别电话号码串执行所述预处理操作、所述划分操作以及所述识别操 作。
[0230] A3、根据A1或A2所述的方法,其中,所述对原始待识别电话号码串进行与电话号 码格式相关的预处理操作,得到处理后的目标待识别电话号码串,包括:
[0231] 确定所述原始待识别电话号码串中是否包含指定的分隔符;
[0232] 若所述原始待识别电话号码串中包含指定的分隔符,则按照该分隔符切分所述原 始待识别电话号码串,得到切分后的至少两个目标待识别电话号码串。
[0233] A4、根据A1-A3任一项所述的方法,其中,所述指定的分隔符包括下列至少之一: 顿号、逗号、分号、斜杜、反斜杜、竖杆。
[0234] A5、根据A1-A4任一项所述的方法,其中,在得到切分后的至少两个目标待识别电 话号码串之后,还包括:
[0235] 对于各个目标待识别电话号码串,确定该目标待识别电话号码串的头部是否具有 国家区号;
[0236] 若是,则去除该目标待识别电话号码串头部的国家区号。
[0237] A6、根据A1-A5任一项所述的方法,其中,在去除该目标待识别电话号码串头部的 国家区号之后,还包括:
[0238] 分析去除了国家区号之后的所述目标待识别电话号码串;
[0239] 若所述目标待识别电话号码串的头部具有地区区号且该地区区号不完整,则补充 该地区区号使其完整;
[0240] 若所述目标待识别电话号码串的头部具有地区区号且该地区区号重复,则对该地 区区号进行去重处理。
[0241] A7、根据A1-A6任一项所述的方法,其中,识别出所述第一指定位数的号码串对应 的电话号码的类别,包括:
[0242] 判断所述第一指定位数的号码串是否满足第一类别电话号码的属性特征;
[0243] 若是,则根据所述第一类别电话号码的属性特征,确定至少两个探测位数;
[0244] 分别采用各个探测位数对所述目标待识别电话号码串进行切分,得到切分结果;
[0245] 根据所述切分结果,从所述至少两个探测位数中选取最优探测位数对所述第一指 定位数的号码串进行补全。
[0246] A8、根据A1-A7任一项所述的方法,其中,所述分别采用各个探测位数
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1