一种地址比较的方法及设备的制造方法_4

文档序号:9471445阅读:来源:国知局

[0094]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0095]尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优 选实施例以及落入本发明范围的所有变更和修改。
[0096]显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发 明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求 及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【主权项】
1. 一种地址比较的方法,其特征在于,包括: 分别对两条原始地址信息进行分词,得到各自对应的包括多个地址元素的分词结果; 分别基于获得的每一条原始地址信息的分词结果,确定相应的原始地址信息的各地址 元素类型,并在预设的地址元素组合规则库中,分别筛选出符合所述每一条原始地址信息 的各地址元素类型的地址元素组合规则; 基于获得的两条原始地址信息各自对应的地址元素组合规则,提取出一条公共地址元 素组合规则; 基于所述公共地址元素组合规则对所述两条原始地址信息进行关键信息提取,得到两 条目标地址信息,并对所述两条目标地址信息进行地址元素匹配,得到两条原始地址信息 的相似度比较结果。2. 如权利要求1所述的方法,其特征在于,分别对两条原始地址信息进行分词,得到各 自对应的包括多个地址元素的分词结果,具体包括: 按照预设的地址分词库分别对两条原始地址信息进行分词,得到各自对应的包括多个 地址元素的分词结果,所述地址分词库中存储有多个标准地址元素。3. 如权利要求1所述的方法,其特征在于,分别基于获得的每一条原始地址信息的分 词结果,确定相应的原始地址信息的各地址元素类型,具体包括: 分别基于获得的每一条原始地址信息的分词结果,分别对每一条原始地址信息中的各 地址元素进行分析,确定每一条原始地址信息中的各地址元素的地址元素类型。4. 如权利要求1、2或3所述的方法,其特征在于,基于获得的两条原始地址信息各自对 应的地址元素组合规则,提取出一条公共地址元素组合规则,具体包括: 对获得的两条原始地址信息各自对应的地址元素组合规则进行地址元素类型分析,将 两条原始地址信息各自对应的地址元素组合规则中都存在的地址元素类型提取出来,得到 一条公共地址元素组合规则,所述地址元素组合规则为多个地址元素类型的组合。5. 如权利要求4所述的方法,其特征在于,基于所述公共地址元素组合规则对所述两 条原始地址信息进行关键信息提取,得到两条目标地址信息,并对所述两条目标地址信息 进行地址元素匹配,得到两条原始地址信息的相似度比较结果,具体包括: 基于所述公共地址元素组合规则中的地址元素类型,对所述两条原始地址信息进行关 键信息提取,得到两条目标地址信息; 对所述两条目标地址信息中相同地址元素类型对应的地址元素进行匹配,得到每一条 地址元素类型的匹配度,对每一条地址元素类型的匹配度进行加权求和得到两条原始地址 信息的相似度比较结果。6. -种地址比较的设备,其特征在于,包括: 分词模块,用于分别对两条原始地址信息进行分词,得到各自对应的包括多个地址元 素的分词结果; 筛选模块,用于分别基于获得的每一条原始地址信息的分词结果,确定相应的原始地 址信息的各地址元素类型,并在预设的地址元素组合规则库中,分别筛选出符合所述每一 条原始地址信息的各地址元素类型的地址元素组合规则; 提取模块,用于基于获得的两条原始地址信息各自对应的地址元素组合规则,提取出 一条公共地址元素组合规则; 匹配模块,用于基于所述公共地址元素组合规则对所述两条原始地址信息进行关键信 息提取,得到两条目标地址信息,并对所述两条目标地址信息进行地址元素匹配,得到两条 原始地址信息的相似度比较结果。7. 如权利要求6所述的设备,其特征在于,分别对两条原始地址信息进行分词,得到各 自对应的包括多个地址元素的分词结果时,所述分词模块具体用于: 按照预设的地址分词库分别对两条原始地址信息进行分词,得到各自对应的包括多个 地址元素的分词结果,所述地址分词库中存储有多个标准地址元素。8. 如权利要求6所述的设备,其特征在于,分别基于获得的每一条原始地址信息的分 词结果,确定相应的原始地址信息的各地址元素类型时,所述筛选模块具体用于: 分别基于获得的每一条原始地址信息的分词结果,分别对每一条原始地址信息中的各 地址元素进行分析,确定每一条原始地址信息中的各地址元素的地址元素类型。9. 如权利要求6、7或8所述的设备,其特征在于,基于获得的两条原始地址信息各自对 应的地址元素组合规则,提取出一条公共地址元素组合规则时,所述提取模块具体用于: 对获得的两条原始地址信息各自对应的地址元素组合规则进行地址元素类型分析,将 两条原始地址信息各自对应的地址元素组合规则中都存在的地址元素类型提取出来,得到 一条公共地址元素组合规则,所述地址元素组合规则为多个地址元素类型的组合。10. 如权利要求9所述的设备,其特征在于,基于所述公共地址元素组合规则对所述 两条原始地址信息进行关键信息提取,得到两条目标地址信息,并对所述两条目标地址信 息进行地址元素匹配,得到两条原始地址信息的相似度比较结果时,所述匹配模块具体用 于: 基于所述公共地址元素组合规则中的地址元素类型,对所述两条原始地址信息进行关 键信息提取,得到两条目标地址信息; 对所述两条目标地址信息中相同地址元素类型对应的地址元素进行匹配,得到每一条 地址元素类型的匹配度,对每一条地址元素类型的匹配度进行加权求和得到两条原始地址 信息的相似度比较结果。
【专利摘要】本发明公开了一种地址比较的方法及设备,以解决现有的地址比较效率低且准确性低的问题。该方法为,分别对两条原始地址信息进行分词,得到各自的分词结果;分别基于获得的分词结果,确定相应的各地址元素类型,并在预设的地址元素组合规则库中,分别筛选出符合每一条原始地址信息的各地址元素类型的地址元素组合规则;基于获得的两条地址元素组合规则,提取出一条公共地址元素组合规则;基于公共地址元素组合规则对两条原始地址信息进行关键信息提取,得到两条目标地址信息,对该两条目标地址信息进行地址元素匹配,得到相似度比较结果,这样,在对地址一致性进行比较时的比较速度快、比较结果准确度高,还能够确定待比较地址双方之间的范围差异。
【IPC分类】G06F17/30
【公开号】CN105224610
【申请号】CN201510566384
【发明人】郑佳栋, 王生, 王伟, 李欣, 汪利宝
【申请人】方正国际软件有限公司, 方正国际软件(北京)有限公司
【公开日】2016年1月6日
【申请日】2015年9月8日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1