一种智慧城市中大数据关联关系的表示方法

文档序号:9751002阅读:1523来源:国知局
一种智慧城市中大数据关联关系的表示方法
【技术领域】
[0001] 本发明涉及信息技术领域,尤其是涉及智慧城市中大数据关联关系的表示方法。
【背景技术】
[0002] 为了高效地分析利用智慧城市中的大数据资源,需要深入研究大数据关联关系。 目前对于大数据关联关系的研究已经蓬勃兴起,但是工作主要集中在关联关系的挖掘方 面,对于关联关系的表示问题没有得到足够的重视。而如何有效地表示大数据之间的关联 关系是进一步研究关联关系动态生长的前提条件,是指导城市居民智慧行为的重要保证。
[0003] 关联关系的表示是指采用数学模型来表示数据之间的相关性,是进一步利用关联 关系的基本条件。关联关系的表不面临的主要挑战有:
[0004] a)关联关系种类多,依据自变量个数、触发方式、作用阶段、语义逻辑等分类条件, 关联关系可以有多种不同划分,如何用统一的方法来表示不同种类的关联关系是研究的难 占 .
[0005] b)关联关系之间存在联系,多个关联关系可能具有相同的自变量、因变量,一个关 系的因变量可能是另一个关系的自变量,如何表示出关联关系之间的相关性也是关联关系 表示中的重要问题。
[0006] -般地,关联关系由以下基本要素组成,形
[0007] 如:R = (A1,A2,…,An,B,rule,type,duration,enzyme)。其中,A1,A2,…,An表不 自变量,B表示因变量,rule表示关联规则,type表示关联起作用的方式(触发型或周期型), duration表示关联起作用的时间段,enzyme表示数据酶(关联关系发生所不可缺少的条 件)。与数据描述方式相似,典型的关联关系的表示方法也可以有XML描述语言等。XML语言 可以清晰准确的表示出因变量在自变量的影响下所发生变化的情形,用于表示单一的数据 关联关系。但是由于每个关联关系拥有独立的XML表示形式,多个关联关系之间的联系不能 得到展现,进而不能对于智慧城市中大数据之间广泛存在的关联关系有一个全面综合的展 不。

【发明内容】

[0008] 为了克服上述现有方法的不足,本发明提供了一种全面、综合、可优化、可动态更 新的智慧城市中大数据关联关系的表示方法。
[0009] 本发明提供一种智慧城市中大数据关联关系的表示方法,包括:
[0010] -种数据关系图,以数据实体为节点,以自变量对于因变量的影响为有向边(箭头 指向因变量,箭尾指向自变量)。考虑到数据实体中除了内容以外,还包括承载者、时空信息 等其他属性,每个属性的变化所引起的后果是不同的,为了描述清晰,数据关系图中的关联 关系特指内容的相关性,对于其他属性的相关性可以采用类似的方法处理。
[0011] 特别的,数据关系图中只描绘一对一的数据关系,即一个自变量对于一个因变量 的影响,在使用该表示方法时,需要对数据关系做分离和聚合的预处理。对于含有多个自变 量的数据关系,首先执行分离操作,即对于独立起作用的每一个自变量,分别取其对因变量 的影响,将一个多自变量的关联关系转化为多个单自变量的关联关系;进一步地,对于多个 自变量联合起作用的关系,若这些自变量在它们所参与的其他关系中总是联合起作用的, 则对这些自变量执行聚合操作,即将它们作为一个数据节点表示到数据关系图中。
[0012] 四种基本数据关联关系的表;^方法:
[0013]
[0015] 特别的,对于复本关系,存在四种面向应用关联关系的表;^方法:
[0016]
[0017] 上述四类基本数据关联关系的表示方法通过复合、传递,可以表示智慧城市中大 数据大部分的关联关系。
[0018] 本发明还提供了一种智慧城市中大数据关联关系的优化方法,包括:
[0019] 利用数据关系的传递性,在满足关系传递约束的条件下,将部分间接数据关系转 化为直接数据关系,提高数据对变化的响应速度。在数据关系图中,一些数据关系能够在多 个数据之间实现传递,传递开始的第一个数据称为初始数据,传递到达的最后一个数据称 为终点数据。特别的,k步传递关系是指从初始数据到终点数据S中间经过了 k步关系传递, 表示为{3-1〗1}「1{1"-1以门~门丨叫,4#1%特别的,为了避免存在环,要求传递过程 中的每个数据关系只能出现一次。
[0020] -种数据关系传递的约束,从数据安全的角度考虑,一些数据关系的作用只能直 接来自于初始数据,不能间接地通过关系传递来影响另一数据,我们将这种约束条件称为 关系传递约束,满足关系传递约束的数据关系称为传递受限关系。k步传递约束是指有效的 关系传递只能在k步以内(含步k)实现,多于k步的传递被认为是无效的。满足k步传递约束 的有效关系集合称为k步受限关系集,表不成U*^=1 α
[0021] 数据关系图的k步优化,是指将i步受限关系转化为直接关系,其中i^k,从而得到 k步优化数据关系图。全步长优化,又称kMAX步优化,是指将所有的传递关系全部转化为直接 关系,即关系传递约束步长为数据关系图中关系传递的最大步长k MAX。特别的,在优化后的 数据关系图中,在一对特定的数据之间,允许存在多个不同步长的数据关系,对于同一步长 的多个数据关系可以合并后得到唯一一个该步长的数据关系。
[0022] 本发明还提供了一种智慧城市中大数据关联关系的事务处理方法:
[0023]在数据关系图中,事务是指自变量的改变致使因变量依据数据关系执行数据更新 的一系列操作。
[0024]当数据变化导致事务时,依据形式,分为:
[0025] a)添加数据D。首先在数据关系图中添加数据节点D,然后数据D等待与其相关的数 据关系加入。若数据D是通过复本关系生成的复本数据,则依据复本关系的功能划分,参照 源数据的数据关系或者新分配任务的情况,为复本数据设置数据关系。若新数据D被分配数 据关系,则应依据后面介绍的"添加关系"的操作再做处理。
[0026] b)修改数据D。在数据关系图中修改数据D之后,以数据D为干扰源数据的干扰受体 数据依据干扰函数改变其取值,同时以数据D为施动数据的受动数据依据双联函数调整其 取值。
[0027] c)删除数据D。在数据关系图中删除数据节点D,并删除数据D与其他数据的关系, 然后参照初始数据关系图,在优化后的数据关系图中,删除以数据D为中间数据的传递关 系。如果存在以数据D为本原数据的依赖关系,则同时删除该关系中的跟随数据。
[0028] 当关系变化导致事务时,依据形式,分为:
[0029] a)添加关系。在添加一个数据关系后,要依据数据关系图中的关系传递约束,参照 初始数据关系图,在优化后的数据关系图中,创建与此关系相关的传递受限关系。
[0030] b)删除关系。在删除一个数据关系后,要依据关系传递约束,参照初始数据关系 图,在优化后的数据关系图中,删除由此关系产生的传递受限关系。
[0031 ] c)修改关系。可以看作是删除原关系和创建新关系。
[0032] 特别的,在实际应用中,在两个数据之间时常存在多个并发事务。为了避免在同一 时刻对相同数据执行多次更新所造成的数据错误,为并发事务的执行设置了时序:拥有较 低传递步长的数据关系所对应的事务应当优先执行。
[0033] 与现有技术相比,本发明提出一种采用数据关系网的关联关系表示方法,定义了 基本数据关系和多阶段数据关系,利用数据关系的传递机制,将传递关系转化为直接关系, 发现了潜在的数据关联,并且降低了数据更新的传播时延,加快了数据关系图对动态变化 的响应速度,从而升了活化数据的工作效率。
【附图说明】
[0034] 图1为数据关联关系优化示例图;
[0035]图2为数据变化导致事务示例图;
[0036]图3为关系变化导致事务不例图;
[0037]图4为事务调度示例图;
[0038]图5为实施本发明方法的一个不例图。
【具体实施方式】
[0039]参考附图1,示例了数据关联关系优化的方法。(a)为原始数据关系图。(b)为2步优 化数据关系图:feAIFuneaV BIFunelB1E得AIF幢顧(2U;由C r,ncU』hCFunei°.C;B,B:IFu' 1cfB-L) Ε· 得 C Ε ;由 c 7置⑴.CF歷 " β , c f Β喊 Β)獅c (Β' 得 D g耐? B ; 由 A lKunc(A"B) b , c CPunc(C,B).CFunc(B,C) ω 为全步长优化数据关系图: Η-, TFunc(A, B) -CFu
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1