物流系统中地址信息的处理方法及装置与流程

文档序号:11691032阅读:280来源:国知局
物流系统中地址信息的处理方法及装置与流程

本申请涉及物流技术领域,特别是涉及物流系统中地址信息的处理方法及装置。



背景技术:

为便于行政管理,通常每个国家有各自的区划层级关系。例如,美国本土的行政区划层级包括第一级为州,第二级为郡,第三级为市。又例如,俄罗斯第一级区划为联邦市、共和国、州、自治区,第二级区划为县、市镇。为进行全球地址的物理,需要采集原始地址信息以建立国际地址库。然而,采集的原始地址信息,即源数据为没有经过数据质量检查的原始地址数据,一方面可能没有体现出区划层级关系,或者体现出的区划层级关系不准确。另一方面,由于在国际地址数据中,不同国家的行政区划层级可能不同(如,美国是州/郡/市;俄罗斯是市、共和国、州、自治区/县、市镇),导致来自不同国家的原始地址数据区划层级关系错乱。

例如,目前一些国际地址产品在用户界面(ui,userinterface)显示的区划链由于不能根据不同的国家而变化,在ui中对于不同的国家使用单一的区划层级链名称从而导致诸多问题。首先,单一区划层级链名称不能准确反映出各个国家的区划层级关系。例如,对于美国地址显示的是州/郡/市,而对于俄罗斯,地址仍然显示的是州/郡/市,导致不能正确反映出俄罗斯的区划层级链关系,并造成用户的认知错误。更严重的是,由此造成地址数据和链路名称对应错误,甚至引起物流流转错误。例如,将俄罗斯的区划层级链名称在ui中显示为州/郡/市,将会使得莫斯科市显示为莫斯科州,若在物流业务系统中将该数据存为莫斯科州,将导致在物流链路中无法进行下一步路由出现流转错误。

目前现有数据编译系统在数据编译过程中完全依赖于源数据,容易导致编译系统与源数据耦合性强,不同的源数据区划层级链可能不一样,从而影响编译系统的适应性。

在一些方案中数据编译过程中对编译层级使用硬编码,然而这种方案也存在问题。首先,全球地址数据编译过程是个建设、升级逐步完善的过程,即使针对一种数据源,编译系统也需要编译不同版本的数据,而不同版本的数据在区划层级关系处理上可能存在不一致的情况,针对这种情况,如果编译系统使用硬编码,需要针对不同版本的源数据修改编译系统。另外,国际地址库建设可能会涉及到多种数据源,需要针对不同国家的区划链来调整编译过程中的区划层级关系,如果使用硬编码的方式指定各国编译层级关系,在编译时调整区划层级关系会显得繁琐而混乱。例如,俄罗斯地址еврейская只有一级地址只需要编译第一级,абакан则需要编译2级地址,юго-западный需要编译三级地址,如果使用硬编码就需要在编译系统代码开发中分别处理不同数据源,这样不同源数据间使用编译系统就需要修改代码,这样大大削弱国际地址编译系统的可扩展性和健壮性。然而,每个国家都可能存在大量这样不同的区划层级模型,这样将导致开发的代码量大增而混乱,同时也就导致了系统的维护困难。另外,系统编译过程中,编译层级数可能会根据地址质量检查结果调整,如果调整编译层级,则需要开发人员去定位相关的代码做相应的修改。同时,编译系统的开发者和数据实际编译者可能不是同一人,数据编译者甚至可能不是技术人员,这样将增加国际地址编译的难度。

因此,需要一种新的技术方案,在全球地址数据编译过程中,针对各个国家的地址,正确指定原始地址信息中的区划层级关系及层级链名称。



技术实现要素:

本申请提供了一种特别是涉及物流系统中地址信息的处理方法及装置,在全球地址数据编译过程中,通过提供地址编译模型数据能够针对各个国家的地址,方便灵活地正确指定原始地址信息中的区划层级关系及层级链名称。

本申请提供了如下方案:

一种物流系统中地址信息的处理方法,包括:

根据源数据中包括的原始地址信息,查询并获得与所述原始地址信息相关的标准国际区划数据,其中,所述源数据中还包括所述原始地址信息的地址区划层级,所述地址区划层级包括从高到低的行政区划隶属关系,所述标准国际区划数据中包括标准区划地址信息和所述标准区划地址信息的地址区划层级关系链;

按照源数据中从高级别到底级别的顺序,识别所述原始地址信息中第一个属于所述标准区划地址信息的原始地址信息;

将所述第一个属于所述标准区划地址信息的原始地址信息作为地址编译模型数据中的最高级别地址,其中,所述地址编译模型数据用于指导将新的源数据编译处理为标准的国际地址;

根据所述标准区划地址信息的地址区划层级关系链,按照从高到低的级别,依次识别所述原始地址信息中下一级属于所述标准区划地址信息的原始地址信息;

针对每一个识别出的属于所述标准区划地址信息的原始地址信息,在所述地址编译模型数据中记录识别出的原始地址信息为标准地址信息,以及记录所述识别出的原始地址信息在所述标准区划地址信息的地址区划层级关系链中的级别,作为所述标准地址信息在所述地址编译模型数据中的编译层级。

一种物流系统中地址信息的处理装置,包括:

标准地址获取单元,用于根据源数据中包括的原始地址信息,查询并获得与所述原始地址信息相关的标准国际区划数据,其中,所述源数据中还包括所述原始地址信息的地址区划层级,所述地址区划层级包括从高到低的行政区划隶属关系,所述标准国际区划数据中包括标准区划地址信息和所述标准区划地址信息的地址区划层级关系链;

识别单元,用于按照源数据中从高级别到底级别的顺序,识别所述原始地址信息中第一个属于所述标准区划地址信息的原始地址信息;将所述第一个属于所述标准区划地址信息的原始地址信息作为地址编译模型数据中的最高级别地址,其中,所述地址编译模型数据用于指导将新的源数据编译处理为标准的国际地址;根据所述标准区划地址信息的地址区划层级关系链,按照从高到 低的级别,依次识别所述原始地址信息中下一级属于所述标准区划地址信息的原始地址信息;

记录单元,用于针对每一个识别出的属于所述标准区划地址信息的原始地址信息,在所述地址编译模型数据中记录识别出的原始地址信息为标准地址信息,以及记录所述识别出的原始地址信息在所述标准区划地址信息的地址区划层级关系链中的级别,作为所述标准地址信息在所述地址编译模型数据中的编译层级。

根据本申请提供的具体实施例,本申请公开了以下技术效果:

通过本申请实施例,在全球地址数据编译过程前,利用各个国家源数据中的原始地址信息建立地址编译模型数据,从而在编译过程能够正确指定新源数据中原始地址信息中的区划层级关系及层级链名称。

在地址数据编译过程中,相对于使用硬编码的方式指定各国编译层级关系,在本申请中使用地址编译模型数据的编译方式,针对同一源数据的不同版本层级不一致的问题,只需修改相应的地址编译模型数据,重新编译数据获得新的编译成果数据即可。针对不同源数据,也可以使用相应的地址编译模型数据编译源数据,数据编译的模型化,使得数据编译具有更广泛的适应性。

在一些实施例中,在编译相应国家的源数据前获得该地址信息相对应的地址编译模型数据,根据该地址编译模型数据编译新源数据,能够识别新源数据区划层级错乱以及进行纠正,并且可以根据需要调整地址编译模型数据,根据新的地址编译模型数据编译出新的成果数据,从而削弱数据编译系统与源数据的耦合性,使得编译系统具有更广泛的应用性处理源数据区划层级错误,使得行政区划跳级更加易于处理。

在一些实施例中,地址编译模型数据定义了各国的地址区划层级关系链,从而能在用户ui中进行显示。根据地址编译模型数据定义的编译语言,指示了需要显示的相应语言,解决了国际地址各国多语言环境区划层级链路显示的问题。同时,需要进行编译层级修改时,只需将地址编译模型数据中对应的区划层级链显示名称做相应的修改,国际地址服务根据相应的地址编译模型数据, 就能向应用或用户ui提供准确的、多语言区划链名称,简化了多语言层级链名称的处理和显示。

当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的方法的流程图;

图2是本申请实施例提供的另一方法的流程图;

图3是本申请实施例提供的另一方法的流程图;

图4是本申请实施例提供的另一方法的流程图;

图5是本申请实施例提供的第一装置的示意图;

图6是本申请实施例提供的第二装置的示意图;

图7是本申请实施例提供的第三装置的示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。

参见图1所示,图1是本申请实施例提供的方法的流程图。图1所示的物流系统中地址信息的处理方法包括以下操作。

s101:根据源数据中包括的原始地址信息,查询并获得与原始地址信息相关的标准国际区划数据,其中,源数据中还包括原始地址信息的地址区划层级, 地址区划层级包括从高到低的行政区划隶属关系,标准国际区划数据中包括标准区划地址信息和标准区划地址信息的地址区划层级关系链。其中,源数据为采集的原始地址信息,即源数据为没有经过数据质量检查的原始地址数据,其中包括未经过处理的所采集的原始地址信息。

例如,源数据中包括原始的地址信息,以及原始地址信息的地址区划层级区划链,如:在未进行编译之前,源数据呈现出四级地址,即一级地址anadolu,二级地址三级地址为keban,四级地址为

标准国际区划数据中包括客观的地址信息即标准区划地址信息以及地址的层级关系,即标准区划地址信息的地址区划层级关系链。例如为一个土耳其客观完整的地址链,其中keban、分别是第一级、第二级、第三级区划地址信息数据,即省——县——乡级别地址。标准国际区划数据可以通过wiki或google地理编码api接口获取。

s102:按照源数据中从高级别到底级别的顺序,识别原始地址信息中第一个属于标准区划地址信息的原始地址信息。

以上述例子为例,按照源数据中从高级别到低级别的顺序,与标准国际区划数据比对,识别出原始地址信息中第一个属于标准区划地址信息的原始地址信息为anadolu并不是真实的区划地址(仅地区)。

s103:将第一个属于标准区划地址信息的原始地址信息作为地址编译模型数据中的最高级别地址,其中,地址编译模型数据用于指导将新的源数据编译处理为标准的国际地址。

因此在编译的时候原一级地址anadolu应跳过,将第一个属于标准区划地址信息的原始地址信息作为地址编译模型数据中的最高级别地址,即使得示例中的源数据中的二级地址跳级为新的一级地址。

s104:根据标准区划地址信息的地址区划层级关系链,按照从高到低的级别,依次识别原始地址信息中下一级属于标准区划地址信息的原始地址信息。

s105:针对每一个识别出的属于标准区划地址信息的原始地址信息,在地 址编译模型数据中记录识别出的原始地址信息为标准地址信息,以及记录识别出的原始地址信息在标准区划地址信息的地址区划层级关系链中的级别,作为标准地址信息在地址编译模型数据中的编译层级。

例如,针对识别出的属于标准区划地址信息的原始地址信息,在地址编译模型数据中依次记录识别出的原始地址信息为标准地址信息keban、源数据中的2、3、4级地址应为新的1、2、3级。因此,记录识别出的原始地址信息在标准区划地址信息的地址区划层级关系链中的级别作为标准地址信息在地址编译模型数据中的编译层级:编译层级:2|3|4。在利用该地址编译模型数据编译新的地址时,针对土耳其第一级为anadolu第二级地址为的所有源地址编译模型为:编译层级2|3|4。

通过上述实施例,参照对比数据,确定各国正确的区划层级关系链,并能够确定源数据中区划跳级处理、区划错乱情况。

参见图2所示,图2是本申请实施例提供的方法的流程图。相对于1,图2所示的物流系统中建立国际地址的方法中,还包括以下操作。

s201:识别属于标准区划地址信息的原始地址信息,是否与标准区划地址信息一致。

s202:响应于原始地址信息与标准区划地址信息完不一致,在地址编译模型数据中记录地址替换信息,地址替换信息包括指示在使用源地址数据模型编译处理中,将新源数据中的原始地址信息替换为标准区划地址信息。

例如,识别源数据中的地址信息即第二级地址与标准区划地址信息不一致,正确的土耳其语为因此,在地址编译模型数据中记录地址替换信息,地址替换信息包括指示在使用该源地址数据模型编译处理中,将新源数据中的所有原始地址信息替换为标准区划地址信息

通过上述实施例,实现了实现了对源数据准确的检查,确保了数据的准确性。

参见图3所示,图3是本申请实施例提供的另一种方法的流程图。相对于2,图3所示的物流系统中建立国际地址的方法中,还包括以下操作:

s301:识别源数据的原始地址信息所属的国家;

s302:在地址编译模型数据中记录编译语言,编译语言为国家的官方语言和/或者预定的非官方语言。

通常,源数据一般为国家官方语言,因此,识别源数据的原始地址信息所属的国家,从而获知需要提供的官方语言。同时,在业务系统中有些语言,例如英语语种较为必需,所以对于缺少英语语种地址的国家源数据,在数据编译阶段可以翻译英语语种地址,使得可以提供每个国家的官方语言和英语这两种语种地址。有些国家还提供使用比较广泛的语种,例如瑞士除了英语外还会提供法语、意大利语和德语地址。通过在地址编译模型数据中根据需要记录编译语言,可以根据该地址编译模型数据,编译语言为该国家的官方语言和/或者预定的非官方语言。例如,根据需要针对土耳其的地址编译模型数据中记录编译语言为土耳其和英语(tr|en)。

本申请实施例提供的另一种方法中,还可以包括以下操作:

在地址编译模型数据中,记录标准国际区划数据中包括的标准区划地址信息的地址区划层级关系链。

例如,在国际地址对外提供服务时候,不仅需要提供地址、邮编数据,还需要提供具体国家的区划层级关系链。当需要提供土耳其和英语两种语言时,记录土耳其的标准区划地址信息的地址区划层级链为土耳其语种:英语语种为provinces|cities|villages。

综上,在一种示例中,可以确定土耳其第一级为anadolu第二级地址为的地址编译模型数据是:编译层级:2|3|4,编译语种为tr|en,错误名称替换为区划链为:tr:en:provinces|cities|villages。

在以下的方法实施例中,将描述在编译过程中,如何利用上述实施例所生成的地址编译模型数据指导源数据编译,从而获得正确指定导原始地址信息中的区划层级关系及层级链名称。所获得的具有正确的区划层级关系及层级链的地址信息可以加入国际地址库。

参见图4所示,图4是本申请实施例提供的另一种方法的流程图。该方法实施例还包括:

s401:读取新的源数据,新源数据中包括地址信息和地址信息的地址区划层级;

s402:根据地址信息,查找包括与地址信息相对应的标准地址信息的地址编译模型数据;

s403:根据地址编译模型数据,调整新的源数据的地址信息和地址信息的地址区划层级关系,使得新的数据源的地址信息和标准地址信息相同,以及新源数据的地址信息的地址区划层级和地址编译模型数据中的编译层级相同。

例如,在地址服务启动时,地址服务系统会加载国际地址数据,在加载土耳其地址时,服务系统会读取到土耳其的地址编译模型数据。在编译过程中,编译系统读取土耳其的编译模型,按照模型中指定的编译层级:2|3|4编译源数据中的第二、三、四地址,重新组织为第一级、第二级、第三级地址。

在一种方法实施例中,方法还包括:识别属于新源数据中的地址信息是否与标准区划地址信息完全一致;响应于地址信息与标准区划地址信息完不完全一致,在地址编译模型数据中记录地址替换信息,根据地址编译模型数据中的地址替换信息,将新的源数据中的地址信息替换为标准区划地址信息。

例如,编译系统按照编译模型指定的替换将源地址中的替换为

在一种方法实施例中,在地址编译模型数据中包括编译语言,该方法还包括:利用地址编译模型数据,根据编译语言,将调整后的新源数据的地址信息以国家的官方语言和/或者预定的非官方语言输出。

例如,土耳其源数据只有土耳其语地址,而根据地址编译模型数据的编译语言,还指定了英语语种地址是必须的,所以在将土耳其地址编译完成后编译系统再通过土耳其语翻译获得英语语种地址,即将调整后的新源数据的地址信息以土耳其语和英文进行输出。

在一种方法实施例中,方法还包括:利用地址编译模型数据,根据编译语言,将所记录的标准国际区划数据中包括的标准区划地址信息的地址区划层级关系链以国家的官方语言和/或者预定的非官方语言输出。

例如,上述示例,当根据编译语言需要提供土耳其和英语两种语言时,提 供地址区划层级链为土耳其语种:英语语种为provinces|cities|villages。

另外,地址服务初始化阶段,获得地址编译模型数据,用于指导数据地址数据、邮编数据、街道数据加载。

参加图5所示,图5是本申请实施例提供的第一装置的示意图。该物流系统中建立国际地址的装置,包括:

标准地址获取单元501,用于根据源数据中包括的原始地址信息,查询预先获得与原始地址信息相关的标准国际区划数据,其中,源数据中还包括原始地址信息的地址区划层级,地址区划层级包括从高到低的行政区划隶属关系,标准国际区划数据中包括标准区划地址信息和标准区划地址信息的地址区划层级关系链;

识别单元502,用于按照源数据中从高级别到底级别的顺序,识别原始地址信息中第一个属于标准区划地址信息的原始地址信息;将第一个属于标准区划地址信息的原始地址信息作为地址编译模型数据中的最高级别地址,其中,地址编译模型数据用于指导将新的源数据编译处理为标准的国际地址;根据标准区划地址信息的地址区划层级关系链,按照从高到低的级别,依次识别原始地址信息中下一级属于标准区划地址信息的原始地址信息;

记录单元503,用于针对每一个识别出的属于标准区划地址信息的原始地址信息,在地址编译模型数据中记录识别出的原始地址信息为标准地址信息,以及记录识别出的原始地址信息在标准区划地址信息的地址区划层级关系链中的级别,作为标准地址信息在地址编译模型数据中的编译层级。

在一种装置实施例中,识别单元502,还用于识别属于标准区划地址信息的原始地址信息,是否与标准区划地址信息完全一致;

记录单元503,还用于响应于原始地址信息与标准区划地址信息完不完全一致,在地址编译模型数据中记录地址替换信息,地址替换信息包括指示在使用源地址数据模型编译处理中,将新源数据中的原始地址信息替换为标准区划地址信息。

在一种装置实施例中,识别单元502,还用于识别源数据的原始地址信息 所属的国家;记录单元503,还用于在地址编译模型数据中记录编译语言,编译语言为国家的官方语言和/或者预定的非官方语言。

在一种装置实施例中,记录单元503,还用于在地址编译模型数据中,记录标准国际区划数据中包括的标准区划地址信息的地址区划层级关系链。

参加图6所示,图6是本申请实施例提供的第二装置的示意图。该物流系统中地址信息的处理装置还包括:

新数据读取单元601,用于读取新的源数据,新源数据中包括地址信息和地址信息的地址区划层级;

查找单元602,用于根据地址信息,查找包括与地址信息相对应的标准地址信息的地址编译模型数据;

调整单元603,用于根据地址编译模型数据,调整新的源数据的地址信息和地址信息的地址区划层级关系,使得新的数据源的地址信息和标准地址信息相同,以及新源数据的地址信息的地址区划层级和地址编译模型数据中的编译层级相同。

在一种装置实施例中,识别单元502,还用于识别属于新源数据中的地址信息是否与标准区划地址信息完全一致;

调整单元603,还用于响应于地址信息与标准区划地址信息完不完全一致,在地址编译模型数据中记录地址替换信息,根据地址编译模型数据中的地址替换信息,将新的源数据中的地址信息替换为标准区划地址信息。

参加图7所示,图7是本申请实施例提供的第三装置的示意图。在地址编译模型数据中包括编译语言,该物流系统中建立国际地址的装置还包括:

翻译单元701,用于利用地址编译模型数据,根据编译语言,将调整后的新源数据的地址信息以国家的官方语言和/或者预定的非官方语言输出。

在一种装置实施例中,翻译单元701,还用于利用地址编译模型数据,根据编译语言,将所记录的标准国际区划数据中包括的标准区划地址信息的地址区划层级关系链以国家的官方语言和/或者预定的非官方语言输出。

本申请提供的方案定义了地址编译模型数据,降低了编译系统与源数据的耦合性,使得编译系统具有更好灵活性。针对不同的数据源定义相应的地址模 型,使得编译系统具有更广泛的适应性。针对不同国家定义的地址编译模型数据包括了区划层级关系链,定义的地址编译模型数据解决了不同语言环境区划链显示。

本发明提供的方案可以应用于利用源数据建立区划层级树、为国际地址创建唯一标识码、创建国际地址多语言关联、创建国际地址邮编关联、创建国际邮编库、创建国际邮编规则库、创建国际详细地址库、国际地址数据正确性检查阶段。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上对本申请所提供的物流系统中地址信息的处理方法及装置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1