整合数据库的方法和装置的制作方法

文档序号:6362986阅读:175来源:国知局
专利名称:整合数据库的方法和装置的制作方法
技术领域
本发明涉及数据库领域,特别是指一种整合数据库的方法和装置。
背景技术
现阶段中,兴趣点属性整合过程基本上都是采用人工搜索查询的方法来比对,把相同信息的索引整合在一起。这种传统的制作方式已经很难满足日益增长的大规模快速更新索引数据的要求。这种传统方式耗费人工,效率低下。

发明内容
本发明要解决的技术问题是提供一种整合数据库的方法和装置,提高了整合数据库的效率。为解决上述技术问题,本发明的实施例提供技术方案如下:一方面,提供一种整合数据库的方法,包括:从第一数据库中分别获取一第一兴趣点的基本属性、所述第一兴趣点的附加属性;从第二数据库中获取各个第二兴趣点的基本属性;根据所述第一兴趣点的基本属性、所述第二数据库中各个所述第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度;判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果;如果所述第一判断结果为否,则将所述第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中;如果第一判断结果为是,则进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合。所述的整合数据库的方法,其特征在于,还包括:从所述第二数据库中分别获取一第二兴趣点的基本属性;从所述第一数据库中获取各个第一兴趣点的基本属性;根据所述第二兴趣点的基本属性、第一数据库中各个第一兴趣点的基本属性,生成所述第二兴趣点和各个所述第一兴趣点之间的相似度;判断所述第一数据库中是否包含与所述第二兴趣点的相似度大于第二预定值的第一兴趣点,生成第二判断结果;如果所述第二判断结果为否,则从所述第一数据库删除所述第二兴趣点的基本属性和所述第二兴趣点的附加属性。所述进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合的步骤包括:从与所述第一兴趣点之间的相似度大于预定值的第二兴趣点中,选择相似度最高的第二兴趣点;进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合。所述进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合的步骤包括:判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则使用所述第一兴趣点的附加属性更新所述相似度最高的第二兴趣点的附加属性;或者判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则将所述第一兴趣点的附加属性添加所述相似度最高的第二兴趣点的附加属性中。所述基本属性包括:兴趣点的名称、兴趣点的地址以及兴趣点的电话号码中的一个或多个的任意组合。另一方面,提供一种整合数据库的装置,包括:第一获取单元,从第一数据库中分别获取一第一兴趣点的基本属性、所述第一兴趣点的附加属性;第二获取单元,从第二数据库中获取各个第二兴趣点的基本属性;第一生成单元,根据所述第一兴趣点的基本属性、所述第二数据库中各个所述第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度;第一判断单元,判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果;复制单元,如果所述第一判断结果为否,则将所述第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中;整合单元,如果第一判断结果为是,则进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合。所述的整合数据库的装置还包括:第三获取单元,从所述第二数据库中分别获取一第二兴趣点的基本属性;第四获取单元,从所述第一数据库中获取各个第一兴趣点的基本属性;第二生成单元,根据所述第二兴趣点的基本属性、第一数据库中各个第一兴趣点的基本属性,生成所述第二兴趣点和各个所述第一兴趣点之间的相似度;第二判断单元,判断所述第一数据库中是否包含与所述第二兴趣点的相似度大于第二预定值的第一兴趣点,生成第二判断结果;删除单元,如果所述第二判断结果为否,则从所述第一数据库删除所述第二兴趣点的基本属性和所述第二兴趣点的附加属性。所述整合单元包括:选择子单元,从与所述第一兴趣点之间的相似度大于预定值的第二兴趣点中,选择相似度最高的第二兴趣点;整合子单元,进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合。
所述整合子单元具体为:判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则使用所述第一兴趣点的附加属性更新所述相似度最高的第二兴趣点的附加属性;或者判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则将所述第一兴趣点的附加属性添加所述相似度最高的第二兴趣点的附加属性中。所述基本属性包括:兴趣点的名称、兴趣点的地址以及兴趣点的电话号码中的一个或多个的任意组合。本发明的实施例具有以下有益效果:上述方案中,从第一数据库中获取第一兴趣点的基本属性、所述第一兴趣点的附加属性;根据所述第一兴趣点的基本属性、第二数据库中各个第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度;判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果;如果所述第一判断结果为否,则将所述第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中;如果第一判断结果为是,则进行所述第一兴趣点的附加属性和所述第二兴趣点的附加属性之间的整合,能够实现第一数据库和第二数据库之间的自动数据整合,提供了作业效率。


图1表示本发明所示的整合数据库的方法的流程示意图;图2表示本发明所示的一种整合数据库的装置的结构示意图;图3表示本发明所示的整合数据库的方法的一应用场景的流程示意图;图4表示本发明所示的整合数据库的方法的另一应用场景的流程示意图。
具体实施例方式为使本发明的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。如图1所示,为本发明所示的一种整合数据库的方法,包括:步骤11,从第一数据库中获取第一兴趣点的基本属性、所述第一兴趣点的附加属性;所述基本属性包括:兴趣点的名称、兴趣点的地址以及兴趣点的电话号码中的一个或多个的任意组合。所述附加属性可以为:营业时间、营业价格等营业信息。例如,第一数据库可以为新版本的数据库,第二数据库可以为旧版本的数据库。例如,第一数据库中包括多个第一兴趣点,ID为I的第一兴趣点的基本属性为:名称:新世界酒店,地址:朝阳门外大街I号,电话号码:010-65978888。ID为I的第一兴趣点的附加属性为:营业时间:9.00-16.00,营业种类:西餐、菜品价格、最新的团购价格等等。本领域技术人员明白,第一数据库可以包含很多条的兴趣点记录。步骤12,从第二数据库中获取各个第二兴趣点的基本属性;步骤13,根据所述第一兴趣点的基本属性、第二数据库中各个第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度;具体差分细则如下:根据名称,地址,电话相似度,计算相似度:相同:新版兴趣点与上版兴趣点的名称、电话、地址均相等,相似度为100 ;相似度高:例如:第一数据库的兴趣点的基本属性:
权利要求
1.一种整合数据库的方法,其特征在于,包括: 从第一数据库中分别获取一第一兴趣点的基本属性、所述第一兴趣点的附加属性; 从第二数据库中获取各个第二兴趣点的基本属性; 根据所述第一兴趣点的基本属性、所述第二数据库中各个所述第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度; 判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果; 如果所述第一判断结果为否,则将所述第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中; 如果第一判断结果为是,则进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合。
2.根据权利要求1所述的整合数据库的方法,其特征在于,还包括: 从所述第二数据库中分别获取一第二兴趣点的基本属性; 从所述第一数据库中获取各个第一兴趣点的基本属性; 根据所述第二兴趣点的基本属性、第一数据库中各个第一兴趣点的基本属性,生成所述第二兴趣点和各个所述第一兴趣点之间的相似度; 判断所述第一数据库中是否包含与所述第二兴趣点的相似度大于第二预定值的第一兴趣点,生成第二判断结果; 如果所述第二判断结果为否,则从所述第一数据库删除所述第二兴趣点的基本属性和所述第二兴趣点的附加属性。
3.根据权利要求1所述的整合数据库的方法,其特征在于,所述进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合的步骤包括: 从与所述第一兴趣点之间的相似度大于预定值的第二兴趣点中,选择相似度最高的第~■兴趣点; 进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合。
4.根据权利要求3所述的整合数据库的方法,其特征在于,所述进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合的步骤包括: 判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则使用所述第一兴趣点的附加属性更新所述相似度最高的第二兴趣点的附加属性;或者 判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则将所述第一兴趣点的附加属性添加所述相似度最高的第二兴趣点的附加属性中。
5.根据权利要求1所述的整合数据库的方法,其特征在于,所述基本属性包括:兴趣点的名称、兴趣点的地址以及兴趣点的电话号码中的一个或多个的任意组合。
6.一种整合数据库的装置,其特征在于,包括: 第一获取单元,从第一数据库中分别获取一第一兴趣点的基本属性、所述第一兴趣点的附加属性; 第二获取单元,从第二数据库中获取各个第二兴趣点的基本属性; 第一生成单元,根据所述第一兴趣点的基本属性、所述第二数据库中各个所述第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度; 第一判断单元,判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果; 复制单元,如果所述第一判断结果为否,则将所述第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中; 整合单元,如果第一判断结果为是,则进行所述第一兴趣点的附加属性和与所述第一兴趣点之间的相似度大于第一预定值的所述第二兴趣点的附加属性之间的整合。
7.根据权利要求6所述的整合数据库的装置,其特征在于,还包括: 第三获取单元,从所述第二数据库中分别获取一第二兴趣点的基本属性; 第四获取单元,从所述第一数据库中获取各个第一兴趣点的基本属性; 第二生成单元,根据所述第二兴趣点的基本属性、第一数据库中各个第一兴趣点的基本属性,生成所述第二兴趣点和各个所述第一兴趣点之间的相似度; 第二判断单元,判断所述第一数据库中是否包含与所述第二兴趣点的相似度大于第二预定值的第一兴趣点,生成第二判断结果; 删除单元,如果所述第二判断结果为否,则从所述第一数据库删除所述第二兴趣点的基本属性和所述第二兴趣点的附加属性。
8.根据权利要求6所述的整合数据库的装置,其特征在于,所述整合单元包括: 选择子单元,从与所述第一兴趣点之间的相似度大于预定值的第二兴趣点中,选择相似度最高的第二兴趣点; 整合子单元,进行所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性的数据整合。
9.根据权利要求8所述的整合数据库的装置,其特征在于,所述整合子单元具体为: 判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则使用所述第一兴趣点的附加属性更新所述相似度最高的第二兴趣点的附加属性;或者 判断所述第一兴趣点的附加属性和所述相似度最高的第二兴趣点的附加属性是否相同;如果相同,则不进行处理;如果不相同,则将所述第一兴趣点的附加属性添加所述相似度最高的第二兴趣点的附加属性中。
10.根据权利要求6所述的整合数据库的装置,其特征在于,所述基本属性包括:兴趣点的名称、兴趣点的地址以及兴趣点的电话号码中的一个或多个的任意组合。
全文摘要
本发明提供一种整合数据库的方法和装置,涉及数据领域,为解决现有技术中需要人工整合数据库的方法的技术问题而发明。所述方法包括从第一数据库中分别获取一第一兴趣点的基本属性、所述第一兴趣点的附加属性;从第二数据库中获取各个第二兴趣点的基本属性;根据所述第一兴趣点的基本属性、所述第二数据库中各个所述第二兴趣点的基本属性,生成所述第一兴趣点和各个所述第二兴趣点之间的相似度;判断所述第二数据库中是否包含有与所述第一兴趣点之间的相似度大于第一预定值的第二兴趣点,生成第一判断结果;如果所述第一判断结果为否,则将第一兴趣点的基本属性和所述第一兴趣点的附加属性复制到所述第二数据库中。本发明提高了数据处理效率。
文档编号G06F17/30GK103207859SQ20121000766
公开日2013年7月17日 申请日期2012年1月11日 优先权日2012年1月11日
发明者陶海超, 肖霖, 程鹏, 邹兴中, 杨卫军 申请人:北京四维图新科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1