一种基于评分网络的含时信誉评价算法的制作方法

文档序号:12672327阅读:174来源:国知局

本发明属于互联网领域,更具体地,涉及一种基于评分网络的含时信誉评价算法。



背景技术:

现有技术提出了融合主客观要素的动态信誉计算模型,该模型主要通过将数据提供者的行为方式、动机、爱好倾向、态度等建模成信誉计算的主观要素,将数据提供者提供的数据质量建模成信誉计算的客观要素,并在时间域上对主客观要素进行整合。Adali等人根据社交网络中用户的通信行为方式建立了相应的行为信誉计算模型:综合会话信任和传播信任来计算行为可信度,该模型的前提假设是有规律的通信行为比随机通信行为有更高可信度。其中,会话信任用来表示用户之间的会话时间和会话频率,频率越高、时间越长表明他们之间信任度越高;传播信任是指信息的传播度,信息从一个用户传到其他用户的越多说明对信息源用户的信任度越高。

现有技术还提出了一个基于优先级的信誉计算模型,主要从4个方面来构建服务提供者的信誉度:服务请求者、服务提供者的服务经验与服务提供者关于服务质量属性优先级分布的相似度、候选服务对服务需求的适应性以及由第三方提供的评价信息,由这4个属性共同决定了最终的信誉值。

现有技术还提出了基于多Agent系统的网络交易动态信任计算模型与信誉系统。模型包括用户时域的信任度、信誉反馈评分的加权平均计算及社区贡献加权,建立了事前开展防范,事中进行协调,事后给予惩罚三位一体的信誉约束机制。

现有技术还提出了由交互经验计算用户态度,以及利用交互时间序列计算用户行为模式变化的方法,进而利用态度、交互经验、行为模式3种信息综合建立信任评估模型。在当前互联网环境中,高质量和个性化推荐是许多在线系统的一个关键特性。为了帮助用户从大量的产品或者服务中找到正确的产品或服务,避免推荐虚假或失望的服务是网络服务系统设计中的一个基础性研究问题。为了达到这个目的,科研人员提出许多方法。

在现有技术中最具有代表性的一种方法称为迭代细化(简称为IR)算法,在IR算法中,用户的信誉与他的评分向量和对象的估计质量向量的差异是成反比,估计质量的对象和评估用户的信誉是通过迭代进行更新,直到它们变得稳定。在IR算法的基础上,通过给每个单独的评分赋予信誉来优化此迭代算法形成了一种新的算法。一种改进的迭代算法(为CR)主要是通过用户的评分数与对象的估计质量之间的皮尔森相关公式来计算用户的信誉,这种方法据称是对垃圾邮件恶意的行为非常有效。现有技术还提出了一种应对用户恶意行为的迭代算法(称为IAAR),主要是通过采用一个信誉再分配过程来提高知名用户的影响和两个惩罚因子来恶制用户恶意行为。

现有的迭代算法中,无论是新提出的还是基于已有算法进行优化,大部分都是从应用上下文信息来进行挖掘的导致用户信誉评估不准确从而导致相关质量排名算法失效的问题。



技术实现要素:

针对现有技术的缺陷,本发明的目的在于提供一种基于评分网络的含时信誉评价算法,旨在解决社交网络中因不确定因素导致用户信誉评估不准确从而导致相关质量排名算法失效的问题。

本发明提供了一种基于评分网络的含时信誉评价方法,包括下述步骤:

S1:对第一行为权重因子、第二行为权重因子、用户信誉和对象质量分别进行初始化;

S2:判断质量变化量是否小于设定值,若是,则获得对象质量Qi;若否,则进入步骤S3;

S3:依次获得信誉积累值、质量积累值和用户的临时信誉值;

S4:根据所述信誉积累值、质量积累值和用户的临时信誉值对用户信誉值和对象质量进行更新后返回至步骤S2。

更进一步地,在步骤S1中,通过公式对用户行为权重因子进行初始化;通过公式对对象行为权重因子进行初始化;通过公式对用户信誉进行初始化;通过公式对所述对象质量进行初始化;其中,Wuij为某段时间的用户行为权重因子,i为一个序号标识符,t为一个具体时间段标识符,UUj为在某段时间内的用户集合,Tj为总记录数中在某段时间内的对象集合,Vt为单个用户在某段时间内的对象集合,UTix为用户在某个时间段的集合;woij为对象在某段时间内的权重,i为一个序号标识符,t为一个具体时间段标识符,OTix为对象在某段时间内的集合,OOj为在某段时间内的对象集合,Tj为总记录数中在某段时间内的对象集合,Vt为单个用户在某段时间内的对象集合,OTix为对象在某个时间段内的集合;Ri为某个用户的信誉值,x为一个序号标识符,Oij为用户在某个时间段内选择的对象集合,Wuij为用户在某段时间的权重,rix为用户给某个对象的评分,kui为某个用户的度;Qi为某个对象的质量,i为一个序号标识符,Uij为在某个时间段内选择某个对象的用户集合,Woij为对象在某段时间内的权重,Ri为某个用户的信誉值,rix为用户给某个对象的评分。

更进一步地,在步骤S2中,所述质量变化量其中,|Q-Q′|为一个条件变量,用来结束算法运转,Ql为某个对象的质量,Q′l为其他对象的质量,accoi为某个对象的质量积累过程分量值,l为一个序号标识符,Ototal为对象的总数量,o表示对象。

更进一步地,设定值Δ=10-4

更进一步地,在步骤S3中,两个分量积累过程和信誉值;临时信誉值其中,accui为某个用户信誉积累过程的信誉值,kui为某个用户的度,kok为某个对象的度,k为一个序号标识符,Oij为用户在某个时间段内选择的对象集合,rix为用户给某个对象的评分;Qi为某个对象的质量,Ri为某个用户的信誉值;accoi为某个对象质量积累过程的值,kui为某个用户的度,kok为某个对象的度,k为一个序号标识符,Uij为在某个时间段内选择某个对象的用户集合,Qi为某个对象的质量,Ri为某个用户的信誉值;accui为某个用户信誉积累过程的信誉值,Qi为某个对象的质量,x为一个序号标识符,Oij为用户在某个时间段内选择的对象集合,Woij为对象在某段时间内的权重,rix为用户给某个对象的评分,Wuij为用户在某段时间的权重,为某个用户的评分向量的平均值,Dri为某个用户评分向量的标准差,DQi为某个对象质量向量的标准差,为某个对象质量的平均值。

更进一步地,在步骤S4中,通过公式对信誉进行更新;通过公式对所述对象质量进行更行。

通过本发明所构思的以上技术方案,与现有技术相比,由于能有效预测用户的信誉,并对恶意用户行为能够有效的进行制约,并结合两个评分时间因子的迭代算法,能够在一定程度扼制了用户的恶意评分行为,大大增强了鲁棒性。通过时间分段的两个行为权重因子能够在时间的方式上量化用户的权重值,并且多个时间段权重值的综合计算更符合实际情况。通过从度和时间两个角度设计两个积累过程能够有效提升对象的质量和用户的信誉。

附图说明

图1是本发明实施例提供的基于评分网络的含时信誉评价算法的实现流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供的基于评分网络的含时信誉评价算法可以应用于多个领域,比如:应用于科研领域,可以作为对比算法,应用方式是编程实现并导入拟检测数据集运行。应用于互联网领域,可以应用于国家产品、论文系统、电子商务等,应用方式是编程实现并导入拟检测数据集运行。应用于工业领域,可应用于网络入侵检测、信用卡欺诈检测、交通流量检测等,应用方式是编程实现并导入拟检测数据集运行。应用于生活领域,可应用于个人信誉评估、竞赛排名等,应用方式是编程实现并导入拟检测数据集运行。

本发明实施例提供的一种基于评分网络的含时信誉评价算法主要包括:通过时间分段的两个行为权重因子能够在时间的方式上量化用户的权重值,并且多个时间段权重值的综合计算更符合实际情况;从度和时间两个角度设计两个积累过程能够有效提升对象的质量和用户的信誉。

具体如下:

两个不同的行为权重因子:

一个用户在不同的时间会表现不同的行为,为了体现这种行为在时间因素下的权重值,可以用如下公式设定:

一个对象在不同的时间会体现不同的质量,为了体现这种质量在时间因素下的权重值,可以用如下公式设定:

用Ri表示用户i的信誉,每个用户信誉的初始值通过如下公式设定:

用Qa表示对象a的质量,每个对象质量的初始值可通过如下公式设定:

从公式(1)(2)(3)(4)可知,一个用户的行为权重值因子的大小取决于他在一段时间所看对象的数量,在这篇文章里面指所看电影的数量。一个对象的行为权重因子大小取决于它在一段时间被用户所涉及的频率,频率越高则表示在这段时间内的权重值越大。一个用户的信誉值不再是简单的通过平均值来初始化,而是取决于用户信誉、用户行为权重因子、用户的度,这样更能体现多因素的影响,从侧面也与实际情况相符合。

在某一次更新过程中,为了计算用户i的信誉值,我们基于时间和度的角度设计了一个信誉积累过程,如下:

由于一个用户的信誉不是一次建立的,而是逐渐积累的过程,所以我们将与此用户相关的信息作了分析并计算。从公式可以看出一个用户的信誉分量与此用户所看的对象的质量、对象的度、对象的评分、用户总体信誉、用户的度呈现一定的比例关系。另外这个积累过程能够有效应对恶意评分,因为一次的恶意评论对整体的信誉影响不大,随着用户涉及的对象越来越多,其信誉分量值会变得越来越大,也就代表其的信誉越来越好。

同样的,在某一次更新过程中,为了计算对象的质量值,我们也从时间和度的角度设计了一个质量积累过程,如下:

一个对象的质量值也并不是一次就可以测试出来的,而是通过许多的用户行为才会有评价,所以我们综合分析了相关信息并做了计算,从上面公式可以知道一个对象的质量分量与它所涉及的用户信誉、对象质量、对象的度及用户的度呈一定的关系。其实这个质量积累过程也能够有效应对信誉差的用户及质量不好的对象,因为这中一个积累过程,单次的值对整个对象的质量并不会产生很大的影响。随着对象被不同用户产生越来越多的行为时,其对应的质量分量值会越来越高,这也表示它的质量经过了大家的认可,确实是一个高质量的对象。

另外,迭代过程中Ri都会更新,因此在某一次更新过程中,为了计算用户i的信誉值,通过计算融合两个行为权重因子的用户评分向量和相应对象质量向量之间的改进皮尔森相关系数作为用户的临时信誉值,如下:

如果TRi小于或者等于0,那么用户i的临时信誉值就会设定为1因此,临时信誉值TRi的区间为[0,1]。另外,用户的信誉与他的评分向量和相应的对象的加权平均评分向量的平均平方误差是成反比的。基于皮尔森相关分析的信誉被证明是更强大的应对垃圾邮件评分中是比上述方法更有效果,能够更准确地评估物体的质量。

考虑到用户的信誉受到用户度的影响,均衡信誉值,在某一次迭代过程中,通过临时信誉值与用户信誉积累过程分量值的比值作为本次迭代后用户的最终信誉,如下:

通过以上公式我们知道,用户信誉积累过程类似于著名的K近邻算法,完全将噪声消除在用户的度以外,并且这种效果是累积在每一次更新迭代过程中,并最终在评估目标质量准确性中将获得一个大的改善,虽然修改的方法似乎是小的,但改善是巨大的。

此外在迭代过程中,对象Qi也会改变,通过如下公式来更新每一次迭代过程中对象的质量值:

用户的信誉和对象的质量将在每一步更新。当质量变化小到一个最小值Δ时(本文中Δ=10-4),算法停止;

在本发明实施例中,整个算法可以基于大数语言来开发实现,如spark、hadoop等。

本发明从时间和度的角度设计两个行为权重因子和两分量积累过程能够在一定程度上反映具体的事物流程,能够有效扼制恶意行为,并直接细化了每个对象质量和用户信誉的变化过程,对比其他算法,此算法所取得的效果有较大幅度的提高,可以为实际应用带来价值。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1