一种面向大数据的可信度量方法与流程

文档序号:13766982阅读:来源:国知局
技术特征:1.一种面向大数据的可信度量方法,其特征是,所述方法通过计算数据源之间的可信度、数据源的可信度、数据的可信度,动态地构建含有时间因子和惩罚因子权重参数的层次化的大数据可信性分析网络,最后利用所构建的可信性分析网络计算出数据的可信度,所述方法包括以下步骤:a.利用Hadoop技术对采集到的数据进行预处理,提取关键属性;b.计算数据源之间的本地可信度,动态构建由数据源构成的可信网络:本地可信度的计算公式为:式中,0≤μL(t)≤1,ΔContext(A,B,t)=Context(A,B,t)-Context(A,B,t-1),ΔLocalTrustA(B,t)=LocalTrustA(B,t)-LocalTrustA(B,t-1),式中,LocalTrustA(B,t)表示在t时刻时,本地数据源A对目的数据源B的本地可信度;ΔLocalTrustA(B,t)表示在t时刻时,数据源A对目的数据源B本地可信度是否发生了变化;Random()为随机数;μL(t)为t时刻本地可信度的时间衰减系数;Δt是指两次计算时间的差值;t0是指当前计算的起始时间;t为当前时刻;Context(A,B,t)表示在t时刻时,数据源A对数据源B的上下文交互条件;ΔContext(A,B,t)表示在t时刻时,数据源A和数据源B之间是否有新增的上下文直接交互;DirTrust(A,B,Context(A,B,t),t)表示在t时刻时,数据源A对数据源B在上下文交互条件Context(A,B,t)下的可信值;Accept(A,B,t)表示在t时刻时,数据源A对数据源B的相似程度的认可度;Data(A)为数据源A提供的所有数据集合;dataa表示数据集合中的任何一条数据;Sim(dataa,datab)是指数据dataa与datab的相似程度;Data(A)∩Data(B)是指数据源A所提供的数据集合与数据源B所提供的数据集合有相同的主题的数据的个数;λL(t)表示在t时刻,本模型对本地可信度的惩罚系数;α2+β2=1;c.计算数据源之间的全局可信度:GlobalTrustA(B,t)=Trust(B,t)式中,GlobalTrustA(B,t)表示在t时刻时,本地数据源A对目的数据源B的全局可信度;Trust(B,t)表示在t时刻时,对数据B的可信度;d.计算数据源之间的可信度:TrustA(B,t)=α1·LocalTrustA(B,t)+β1·GlobalTrustA(B,t)式中,TrustA(B,t)表示在t时刻时,本地数据源A对目的数据源B的综合可信度;α1+β1=1;e.计算数据源的可信度:ΔTrust(A,t)=Trust(A,t)-Trust(A,t-1)式中,λS(t)表示在t时刻时,本模型对数据源的可信度的惩罚系数;Trust(A,t)表示在t时刻,数据源A的可信度;ΔTrust(A,t)表示在t时刻时,对于数据源A的信任值在t与t-1时刻的差值;Trust(dataa,t)表示在t时刻时,对数据dataa的信任度;Sum(Data(A))表示求数据源A提供数据的总数量;γn表示在可信网络中,以所求信任值的数据源为圆心,每一层对目标数据源(圆心数据源)信任权重;Recommendn(A,t)表示在t时刻时,每层数据源对目标数据源(圆心数据源)A的推荐可信度;f.计算直接可信度:在t时刻时,数据源A对所提供的数据data的直接可信度值DirTrust(A,data,t)的计算公式为:DirTrust(A,data,t)=Trust(A,t);g.计算间接可信度:在t时刻时,数据源A对数据data的间接可信度InDirTrust(A,data,t)的计算公式为:式中,Neighborn(A)为与A相邻的可信度高的n个数据源;Trust(A,X,t)表示在t时刻时,数据源A对所提供的数据X的真实的可信度;Trust(X,data,t)表示在t时刻时,数据源X对所提供的数据data的真实的可信度;h.计算数据源对数据的可信度:在t时刻时,数据源A对数据data的可信度Trust(A,data,t)的计算公式为:Trust(A,data,t)=α4·DirTrust(A,data,t)+β4·InDirTrust(A,data,t),其中,α4+β4=1;i.计算数据的可信度:在t时刻时,数据data的可信度Trust(data,t)的计算公式为:j.步骤a~i反复迭代计算,某一时刻数据的可信度状态采用数据快照的方式查看。2.根据权利要求1所述的面向大数据的可信度量方法,其特征是,在t时刻时,每层数据源对目标数据源(圆心数据源)A的推荐可信度Recommendn(A,t)为n×1维向量,其第i个元素的值为第i层所有数据源对目标数据源(圆心数据源)A的推荐可信度期望值,每个向量元素为所对应层次的推荐可信度期望值;第i层的某个数据源对目标数据源(圆心数据源)A的推荐可信度Recommend(Xi,A,t)的计算公式为:其中,Xi表示第i层数据源X;Neighbormax(Xi->A)表示朝向A的方向上,第i-1层上与Xi相邻的可信度最大的数据源;第i层的所有数据源对目标数据源(圆心数据源)A的推荐可信度期望值Recommend(A,t)(i)为:其中,Circlei(A)表示在可信网络中,以A为圆心的第i层上的所有数据源,Sum(Circlei(A))表示第i层上的所有数据源的数量。当前第2页1 2 3 
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1