基于递归的电话号码的识别方法及装置的制造方法_6

文档序号:9436225阅读:来源:国知局
对所述目标 待识别电话号码串进行切分,得到切分结果,包括:
[0247] 对于各个探测位数,利用该探测位数对所述目标待识别电话号码串的、所述第一 指定位数的号码串之后的电话号码串进行切分,得到第一切分号码和第二切分号码;
[0248] 比较所述第一切分号码和所述第二切分号码,确定两者对应位置上号码相同的位 数,作为该探测位数对应的切分结果。
[0249]A9、根据A1-A8任一项所述的方法,其中,根据所述切分结果,从所述至少两个探 测位数中选取最优探测位数对所述第一指定位数的号码串进行补全,包括:
[0250] 比较所述各个探测位数对应的号码相同的位数;
[0251 ] 从所述各个探测位数中,选取对应号码相同的位数最大的作为最优探测位数;
[0252] 对所述第一指定位数的号码串补全所述最优探测位数。
[0253] A10、根据A1-A9任一项所述的方法,其中,在判断所述第一指定位数的号码串是 否符合第一类别电话号码的属性特征之后,还包括:
[0254] 若所述第一指定位数的号码串不符合第一类别电话号码的属性特征,则选取新的 符合电话号码格式的划分规则对所述目标待识别电话号码串重新进行划分,得到第二指定 位数的号码串;
[0255] 判断所述第二指定位数的号码串是否符合第二类别电话号码的属性特征;
[0256] 若是,则根据所述第二类别电话号码的属性特征,对所述第二指定位数的号码串 进行补全。
[0257] All、根据A1-A10任一项所述的方法,其中,通过以下步骤获取所述原始待识别电 话号码串:
[0258] 从网页中获取兴趣点P0I信息;
[0259] 从所述P0I信息中提取所述原始待识别电话号码串。
[0260] B12、一种基于递归的电话号码的识别装置,包括:
[0261] 预处理模块,适于对原始待识别电话号码串进行与电话号码格式相关的预处理操 作,得到处理后的目标待识别电话号码串;
[0262] 划分模块,适于从初始位置起,根据符合电话号码格式的划分规则对所述目标待 识别电话号码串进行划分,得到第一指定位数的号码串;
[0263] 识别模块,适于识别出所述第一指定位数的号码串对应的电话号码的类别;
[0264] 递归模块,适于如果仍然存在剩余的待识别电话号码串,则对剩余的待识别电话 号码串进行重复递归,直至剩余的待识别电话号码串被全部识别完。
[0265] B13、根据B12所述的装置,其中,所述递归模块还适于:
[0266] 对于剩余的待识别电话号码串,触发所述预处理模块执行预处理操作、所述划分 模块执行划分操作以及所述识别模块执行识别操作,直至剩余的待识别电话号码串被全部 识别完。
[0267] B14、根据B12或B13所述的装置,其中,所述预处理模块还适于:
[0268] 确定所述原始待识别电话号码串中是否包含指定的分隔符;
[0269] 若所述原始待识别电话号码串中包含指定的分隔符,则按照该分隔符切分所述原 始待识别电话号码串,得到切分后的至少两个目标待识别电话号码串。
[0270] B15、根据B12-B14任一项所述的装置,其中,所述指定的分隔符包括下列至少之 一:顿号、逗号、分号、斜杜、反斜杜、竖杆。
[0271] B16、根据B12-B15任一项所述的装置,其中,所述预处理模块还适于:
[0272] 在得到切分后的至少两个目标待识别电话号码串之后,对于各个目标待识别电话 号码串,确定该目标待识别电话号码串的头部是否具有国家区号;
[0273] 若是,则去除该目标待识别电话号码串头部的国家区号。
[0274] B17、根据B12-B16任一项所述的装置,其中,所述预处理模块还适于:
[0275] 在去除该目标待识别电话号码串头部的国家区号之后,分析去除了国家区号之后 的所述目标待识别电话号码串;
[0276] 若所述目标待识别电话号码串的头部具有地区区号且该地区区号不完整,则补充 该地区区号使其完整;
[0277] 若所述目标待识别电话号码串的头部具有地区区号且该地区区号重复,则对该地 区区号进行去重处理。
[0278] B18、根据B12-B17任一项所述的装置,其中,所述识别模块还适于:
[0279] 判断所述第一指定位数的号码串是否满足第一类别电话号码的属性特征;
[0280] 若是,则根据所述第一类别电话号码的属性特征,确定至少两个探测位数;
[0281] 分别采用各个探测位数对所述目标待识别电话号码串进行切分,得到切分结果;
[0282] 根据所述切分结果,从所述至少两个探测位数中选取最优探测位数对所述第一指 定位数的号码串进行补全。
[0283] B19、根据B12-B18任一项所述的装置,其中,所述识别模块还适于:
[0284] 对于各个探测位数,利用该探测位数对所述目标待识别电话号码串的、所述第一 指定位数的号码串之后的电话号码串进行切分,得到第一切分号码和第二切分号码;
[0285] 比较所述第一切分号码和所述第二切分号码,确定两者对应位置上号码相同的位 数,作为该探测位数对应的切分结果。
[0286] B20、根据B12-B19任一项所述的装置,其中,所述识别模块还适于:
[0287] 比较所述各个探测位数对应的号码相同的位数;
[0288] 从所述各个探测位数中,选取对应号码相同的位数最大的作为最优探测位数;
[0289] 对所述第一指定位数的号码串补全所述最优探测位数。
[0290] B21、根据B12-B20任一项所述的装置,其中,
[0291] 所述划分模块,还适于在所述识别模块判断所述第一指定位数的号码串是否符合 第一类别电话号码的属性特征之后,若所述第一指定位数的号码串不符合第一类别电话号 码的属性特征,则选取新的符合电话号码格式的划分规则对所述目标待识别电话号码串重 新进行划分,得到第二指定位数的号码串;
[0292] 所述识别模块,还适于判断所述第二指定位数的号码串是否符合第二类别电话号 码的属性特征;若是,则根据所述第二类别电话号码的属性特征,对所述第二指定位数的号 码串进行补全。
[0293] B22、根据B12-B21任一项所述的装置,其中,还包括获取模块,适于通过以下步骤 获取所述原始待识别电话号码串:
[0294] 从网页中获取兴趣点P0I信息;
[0295] 从所述P0I信息中提取所述原始待识别电话号码串。
【主权项】
1. 一种基于递归的电话号码的识别方法,包括: 预处理操作,对原始待识别电话号码串进行与电话号码格式相关的预处理,得到处理 后的目标待识别电话号码串; 划分操作,从初始位置起,根据符合电话号码格式的划分规则对所述目标待识别电话 号码串进行划分,得到第一指定位数的号码串; 识别操作,识别出所述第一指定位数的号码串对应的电话号码的类别; 递归操作,如果仍然存在剩余的待识别电话号码串,则对剩余的待识别电话号码串进 行重复递归,直至剩余的待识别电话号码串被全部识别完。2. 根据权利要求1所述的方法,其中,对剩余的待识别电话号码串进行重复递归,包 括: 对剩余的待识别电话号码串执行所述预处理操作、所述划分操作以及所述识别操作。3. 根据权利要求1或2所述的方法,其中,所述对原始待识别电话号码串进行与电话号 码格式相关的预处理操作,得到处理后的目标待识别电话号码串,包括: 确定所述原始待识别电话号码串中是否包含指定的分隔符; 若所述原始待识别电话号码串中包含指定的分隔符,则按照该分隔符切分所述原始待 识别电话号码串,得到切分后的至少两个目标待识别电话号码串。4. 根据权利要求1-3任一项所述的方法,其中,所述指定的分隔符包括下列至少之一: 顿号、逗号、分号、斜杜、反斜杜、竖杆。5. 根据权利要求1-4任一项所述的方法,其中,在得到切分后的至少两个目标待识别 电话号码串之后,还包括: 对于各个目标待识别电话号码串,确定该目标待识别电话号码串的头部是否具有国家 区号; 若是,则去除该目标待识别电话号码串头部的国家区号。6. 根据权利要求1-5任一项所述的方法,其中,在去除该目标待识别电话号码串头部 的国家区号之后,还包括: 分析去除了国家区号之后的所述目标待识别电话号码串; 若所述目标待识别电话号码串的头部具有地区区号且该地区区号不完整,则补充该地 区区号使其完整; 若所述目标待识别电话号码串的头部具有地区区号且该地区区号重复,则对该地区区 号进行去重处理。7. 根据权利要求1-6任一项所述的方法,其中,识别出所述第一指定位数的号码串对 应的电话号码的类别,包括: 判断所述第一指定位数的号码串是否满足第一类别电话号码的属性特征; 若是,则根据所述第一类别电话号码的属性特征,确定至少两个探测位数; 分别采用各个探测位数对所述目标待识别电话号码串进行切分,得到切分结果; 根据所述切分结果,从所述至少两个探测位数中选取最优探测位数对所述第一指定位 数的号码串进行补全。8. 根据权利要求1-7任一项所述的方法,其中,所述分别采用各个探测位数对所述目 标待识别电话号码串进行切分,得到切分结果,包括: 对于各个探测位数,利用该探测位数对所述目标待识别电话号码串的、所述第一指定 位数的号码串之后的电话号码串进行切分,得到第一切分号码和第二切分号码; 比较所述第一切分号码和所述第二切分号码,确定两者对应位置上号码相同的位数, 作为该探测位数对应的切分结果。9. 根据权利要求1-8任一项所述的方法,其中,根据所述切分结果,从所述至少两个探 测位数中选取最优探测位数对所述第一指定位数的号码串进行补全,包括: 比较所述各个探测位数对应的号码相同的位数; 从所述各个探测位数中,选取对应号码相同的位数最大的作为最优探测位数; 对所述第一指定位数的号码串补全所述最优探测位数。10. -种基于递归的电话号码的识别装置,包括: 预处理模块,适于对原始待识别电话号码串进行与电话号码格式相关的预处理操作, 得到处理后的目标待识别电话号码串; 划分模块,适于从初始位置起,根据符合电话号码格式的划分规则对所述目标待识别 电话号码串进行划分,得到第一指定位数的号码串; 识别模块,适于识别出所述第一指定位数的号码串对应的电话号码的类别; 递归模块,适于如果仍然存在剩余的待识别电话号码串,则对剩余的待识别电话号码 串进行重复递归,直至剩余的待识别电话号码串被全部识别完。
【专利摘要】本发明提供了一种基于递归的电话号码的识别方法及装置。该方法包括:预处理操作,对原始待识别电话号码串进行与电话号码格式相关的预处理,得到处理后的目标待识别电话号码串;划分操作,从初始位置起,根据符合电话号码格式的划分规则对所述目标待识别电话号码串进行划分,得到第一指定位数的号码串;识别操作,识别出所述第一指定位数的号码串对应的电话号码的类别;递归操作,如果仍然存在剩余的待识别电话号码串,则对剩余的待识别电话号码串进行重复递归,直至剩余的待识别电话号码串被全部识别完。本发明实施例基于递归操作,则对剩余的待识别电话号码串进行重复递归,直至剩余的待识别电话号码串被全部识别完。
【IPC分类】H04M1/2745, H04M1/725
【公开号】CN105187600
【申请号】CN201510643026
【发明人】马健
【申请人】北京奇虎科技有限公司, 奇智软件(北京)有限公司
【公开日】2015年12月23日
【申请日】2015年9月30日
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1