更新地理信息数据增量的方法及装置的制造方法_3

文档序号:9765989阅读:来源:国知局
息的数据增量包括:第一添加模块,用于将第一并集中的项集作为数据增量添加至新增数据集中;第一删除模块,用于将第四并集中的项集从原始数据集中删除。
[0070]由于原始频繁项集与新增频繁项集的并集必然是频繁项集,因此可以直接将其添加至新增数据集;并且原始非频繁项集与新增非频繁项集的并集必然是非频繁项集,因此可以直接将其从原始数据集中删除。
[0071]通过本发明实施例,将不同类型的项集分类计算,可以实现快速更新计算结果的目的,达到提高更新效率的技术效果。
[0072]可选地,更新单元包括:第一判断模块,用于判断第二并集中的项集是否是非频繁项集;第二删除模块,用于在第二并集中的项集是非频繁项集时,将该非频繁项集对应的原始频繁项集从原始数据集中删除;和/或第二判断模块,用于判断第三并集中的项集是否是频繁项集;第二添加模块,用于第三并集中的项集是频繁项集时,将该频繁项集对应的原始非频繁项集添加到新增数据集中。
[0073]也即,在求原始频繁项集与新增非频繁项集的并集时,若原始频繁项集变化为非频繁项集,则需要将该非频繁项集对应的原始频繁项集从原始数据集中删除;和/或,在求原始非频繁项集与新增频繁项集的并集时,若原始非频繁项集变化为频繁项集,则需要将该频繁项集对应的原始非频繁项集添加到新增数据集中。
[0074]通过本发明实施例,可以根据项集在数据库增量更新前后是否为频繁的情形动态的更新数据结构的方式,达到提高更新效率的目的。
[0075]上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0076]在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0077]在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0078]所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0079]另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0080]所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(R0M,Read-0nly Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0081]以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
【主权项】
1.一种更新地理信息数据增量的方法,其特征在于,包括: 获取地理信息的原始数据集和新增数据集; 对所述原始数据集和所述新增数据集进行计算,得到增量计算结果; 根据所述增量计算结果更新所述地理信息的数据增量。2.根据权利要求1所述的方法,其特征在于,获取地理信息的原始数据集和新增数据集包括: 扫描地理信息数据库; 根据扫描结果生成地理信息的候选项集,所述候选项集包括所述原始数据集和所述新增数据集。3.根据权利要求1所述的方法,其特征在于,对所述原始数据集和所述新增数据集进行计算,得到增量计算结果包括: 将所述原始数据集划分为原始频繁项集和原始非频繁项集,并将所述新增数据集划分为新增频繁项集和新增非频繁项集,其中,在数据集中,支持度计数大于等于数据集中事务记录数目与最小支持度阈值的乘积的项集为频繁项集,支持度计数小于数据集中事务记录数目与最小支持度阈值的乘积的项集为非频繁项集; 计算所述原始频繁项集与所述新增频繁项集的并集,得到第一并集; 计算所述原始频繁项集与所述新增非频繁项集,得到第二并集; 计算所述原始非频繁项集与所述新增频繁项集,得到第三并集; 计算所述原始非频繁项集与所述新增非频繁项集,得到第四并集; 将所述第一并集、所述第二并集、所述第三并集和所述第四并集作为所述增量计算结果O4.根据权利要求3所述的方法,其特征在于,根据所述增量计算结果更新所述地理信息的数据增量包括: 将所述第一并集中的项集作为数据增量添加至所述新增数据集中; 将所述第四并集中的项集从所述原始数据集中删除。5.根据权利要求3所述的方法,其特征在于,根据所述增量计算结果更新所述地理信息的数据增量包括: 判断所述第二并集中的项集是否是非频繁项集; 若是,则将该非频繁项集对应的原始频繁项集从所述原始数据集中删除; 和/或 判断所述第三并集中的项集是否是频繁项集; 若是,则将该频繁项集对应的原始非频繁项集添加到所述新增数据集中。6.一种更新地理信息数据增量的装置,其特征在于,包括: 获取单元,用于获取地理信息的原始数据集和新增数据集; 计算单元,用于对所述原始数据集和所述新增数据集进行计算,得到增量计算结果; 更新单元,用于根据所述增量计算结果更新所述地理信息的数据增量。7.根据权利要求6所述的装置,其特征在于,所述获取单元包括: 扫描模块,用于扫描地理信息数据库; 生成模块,用于根据扫描结果生成地理信息的候选项集,所述候选项集包括所述原始数据集和所述新增数据集。8.根据权利要求6所述的装置,其特征在于,所述计算单元包括: 划分模块,用于将所述原始数据集划分为原始频繁项集和原始非频繁项集,并将所述新增数据集划分为新增频繁项集和新增非频繁项集,其中,在数据集中,支持度计数大于等于数据集中事务记录数目与最小支持度阈值的乘积的项集为频繁项集,支持度计数小于数据集中事务记录数目与最小支持度阈值的乘积的项集为非频繁项集; 第一计算模块,用于计算所述原始频繁项集与所述新增频繁项集的并集,得到第一并集; 第二计算模块,用于计算所述原始频繁项集与所述新增非频繁项集,得到第二并集;第三计算模块,用于第一计算模块,用于计算所述原始非频繁项集与所述新增频繁项集,得到第二并集; 第四计算模块,用于计算所述原始非频繁项集与所述新增非频繁项集,得到第四并集;确定模块,用于将所述第一并集、所述第二并集、所述第三并集和所述第四并集作为所述增量计算结果。9.根据权利要求8所述的装置,其特征在于,根据所述增量计算结果更新所述地理信息的数据增量包括: 第一添加模块,用于将所述第一并集中的项集作为数据增量添加至所述新增数据集中; 第一删除模块,用于将所述第四并集中的项集从所述原始数据集中删除。10.根据权利要求8所述的装置,其特征在于,所述更新单元包括: 第一判断模块,用于判断所述第二并集中的项集是否是非频繁项集; 第二删除模块,用于在所述第二并集中的项集是非频繁项集时,将该非频繁项集对应的原始频繁项集从所述原始数据集中删除; 和/或 第二判断模块,用于判断所述第三并集中的项集是否是频繁项集; 第二添加模块,用于所述第三并集中的项集是频繁项集时,将该频繁项集对应的原始非频繁项集添加到所述新增数据集中。
【专利摘要】本发明公开了一种更新地理信息数据增量的方法及装置。其中,该方法包括:获取地理信息的原始数据集和新增数据集;对原始数据集和新增数据集进行计算,得到增量计算结果;根据增量计算结果更新地理信息的数据增量。本发明解决了相关技术中地理信息的数据更新效率低的技术问题。
【IPC分类】G06F17/30
【公开号】CN105528391
【申请号】CN201510846820
【发明人】舒彬, 李蕴, 林涛, 刘凤成, 孙昕, 张欣, 马雪峰, 张凯, 程林, 刘俊勇, 吴振升, 管轶众
【申请人】国网北京市电力公司, 国家电网公司, 北京电力经济技术研究院, 国网数通(北京)科技有限公司
【公开日】2016年4月27日
【申请日】2015年11月26日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1