基于前馈神经网络的可信与不可信用户识别方法

文档序号:6518079阅读:117来源:国知局
基于前馈神经网络的可信与不可信用户识别方法
【专利摘要】本发明公开了一种基于前馈神经网络的可信与不可信用户识别方法,旨在克服现有技术存在精准度不够、识别依据不足、灵活性缺失与社会网络解析粒度较粗等问题,该方法的步骤为:1.获取特殊用户并确定训练集包含的用户;2.分析并量化用户特征,将用户表示为用户特征向量;3.构建前馈神经网络;4.训练前馈神经网络;5.由训练后的前馈神经网络实现可信与不可信用户识别,其步骤为:1)获取社会网络中用户信息;2)量化用户信息并生成用户特征向量;3)将用户特征向量输入到前馈神经网络中,依据输出节点的输出值识别可信与不可信用户。
【专利说明】基于前馈神经网络的可信与不可信用户识别方法
【技术领域】
[0001]本发明涉及一种社会网络领域的可信与不可信用户识别方法,更确切地说,本发明涉及一种基于前馈神经网络的可信与不可信用户识别方法。
【背景技术】
[0002]现如今,社会网络为网络用户提供了一个较为方便、快捷的信息交流和资源共享平台,然而由于社会网络具有开放性和虚拟性,大量不实信息甚至虚假信息充斥网络空间,导致非诚信现象日益严重,对社会造成不良影响,扰乱了社会秩序,因此识别网络虚假信息成为重点和热点研究问题。鉴于网络用户是信息发布和传播的媒介,识别信息真伪的首要工作是对社会网络中可信与不可信用户的识别。
[0003]现有的可信与不可信用户识别工作大多是围绕用户信誉度计算展开的,主要分为三类:基于用户行为、基于社会网络的拓扑结构和基于用户行为及网络拓扑结构。但是计算的依据较为简单:
[0004]1.前两类方法都只考虑了单一的信誉度影响因素。
[0005]基于用户行为:依据视频分享行为和关键字引用行为评估社会网络中用户的信誉度;利用集合理论结合个体和社会认知分组进行信誉度评估;依据在线社会网络中用户最新的好友列表和特定用户的整体态度发现互不相识的用户间的联系;通过标记数目、标记用户的信誉度、文本的时间动态性和术语相关信誉度共同评估用户信誉度;根据关于一次交易的评论、评论发布者信誉度、评论发布时间、交易数目和情境因素设计信誉度评估函数来评估信誉度。
[0006]基于社会网络拓扑结构:利用用户间的关系实现信誉度的评估;针对在线拍卖,建立反映买家和买家间社会联系的S-graph计算评估参数,通过参与者的显示/隐式反馈推断故意遗漏的反馈,以此评估其信誉度;针对信任和影响力的传递性来评估信誉度。
[0007]2.最后一类方法虽然综合考虑了用户行为和拓扑结构,但是并没有全面地引入用户个体因素,更没有涉及用户间的交互行为,忽略了用户的自身特点。
[0008]基于用户行为和社会网络拓扑结构:综合了三种数据元素,社会地位、社会邻近度和社会相似性进行社会信任测量。
[0009]虽然现有工作在一定程度上实现了社会网络中用户信誉度的评估,但是其评估依据具有局限性,不能够全面地利用社会网络所提供的用户信息,评估方法灵活性较低,评估结果缺乏客观性、精确性和可信性。因此,为了解决上述问题提出以社会网络的拓扑结构、用户个体因素和用户间交互行为作为评估依据,利用前馈神经网络识别社会网络中可信与不可信用户,不仅克服了只考虑单一影响因素的不足,还全面地考虑了用户个体因素,提高了识别方法的精准度和客观性。其中,社会网络的拓扑结构和用户个体因素主要是针对用户所在的局部社会网络,已经证明局部信任度量比全局信任度量具有更高的精确度。此外,神经网络在学习的过程中能够发现未定义的评估依据,进一步提高了评估方法的灵活性以及识别的精准度。
【发明内容】

[0010]本发明所要解决的技术问题是克服现有技术存在精准度不够、灵活性不足、智能性缺失等问题,提供了一种基于前馈神经网络的可信与不可信用户识别方法。
[0011]为解决上述技术问题,本发明是采用如下技术方案实现的:所述的基于前馈神经网络的可信与不可信用户识别方法包括如下步骤:
[0012]1.获取特殊用户并确定训练集用户:
[0013](I)依据社会网络中用户的等级构建初始用户集合,初始用户集合定义:
[0014]M= {μ e Ml μ e OSffs, φ μ — Φ?38}
[0015]其中:Μ表示初始用户集合,OSWs表示领域s下的用户集合,μ表示用户集合OSWs中的用户,Φ,表示用户的个人概要,表示等级较高用户所具有的标签;
[0016](2)依据用户时间相关信息对初始用户集合进行删减,滤除不活跃用户,将余下的用户作为特殊用户;
[0017](3)依据特殊用户与社会网络中其他用户间的信任关系构建初始社会网络;
[0018](4)依据特殊用户与社会网络中其他用户间的信任关系获取种子用户并更新初始社会网络,种子用户为训练集所包含的用户,获取条件:
[0019]ProUser = { μ p e ProUser | | μ s — μ ρ ^ 2}
[0020]其中=ProUser表示种子用户集合,ys表示(2)中确定的特殊用户,1^表示集合ProUser中的一个用户,|ys — μ p|表示信任用户μ p的特殊用户数目。
[0021]2.分析并量化用户特征,将用户表示为用户特征向量:
[0022](I)以用户社会网络拓扑结构、用户个体因素和用户间交互行为三个方面信息对用户进行特征分析;
[0023](2)量化用户特征,将用户表示为由多个特征组成的用户特征向量。
[0024]3.构建前馈神经网络:
[0025](I)依据用户特征向量的维度确定前馈神经网络的输入节点个数;
[0026](2)依据可信用户识别的复杂程度确定前馈神经网络的层数以及各层包含的节点数;
[0027](3)依据前馈神经网络的结构和性能要求确定隐藏层和输出层包含节点的类型。
[0028]4.训练前馈神经网络:
[0029]( I)依据k-fold交叉验证算法的k值将训练集划分为k个子集,任意两个子集的交集为空;
[0030](2)对前馈神经网络进行k次训练,每次选取一个不同的子集作为训练集,余下的k-Ι个子集作为测试集;
[0031](3)将k次训练所确定的训练次数依据相应的识别精度赋予不同的权值,依据k个训练次数的相应权值求得加权和作为最终训练次数;
[0032](4)依据步骤(3)确定的最终训练次数在完整的训练集上训练前馈神经网络。
[0033]5.由训练后的前馈神经网络实现可信与不可信用户识别:
[0034](I)获取用户社会网络拓扑结构、用户个体因素和用户间交互行为三个方面信息并量化,将用户表示为用户特征向量;[0035](2)将步骤(1)得到的用户特征向量输入到前馈神经网络进行可信与不可信用户识别,得到被识别用户的输出值;
[0036](3)依据前馈神经网络的输出值识别用户为可信或者不可信。
[0037]技术方案中所述的获取特殊用户包括如下步骤:
[0038](I)将初始用户集合中的用户依据用户时间相关信息按降序排列;
[0039](2)以位于中间位置的用户为分界线将排序后的用户划分为两部分,分别计算两部分用户的时间相关信息均值,得到非特殊用户初始聚类中心和特殊用户初始聚类中心,计算公式:
【权利要求】
1.一种基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的基于前馈神经网络的可信与不可信用户识别方法包括如下步骤: (1)获取特殊用户并确定训练集包含的用户: 1)依据社会网络中用户的等级构建初始用户集合,初始用户集合定义:
M = { μ e M I μ e OSffs, Φ μ — Φ?38} 其中:Μ表示初始用户集合,OSWs表示领域s下的用户集合,μ表示用户集合OSWs中的用户,Φ,表示用户的个人概要,表示等级较高用户所具有的标签; 2)依据用户时间相关信息对初始用户集合进行删减,滤除不活跃用户,将余下的用户作为特殊用户; 3)依据特殊用户与社会网络中其他用户间的信任关系构建初始社会网络; 4)依据特殊用户与社会网络中其他用户间的信任关系获取种子用户并更新初始社会网络,种子用户为训练集所包含的用户,获取条件:
ProUser = { μ p e ProUser | | μ s — μ p ^ 2} 其中:ProUser表示种子用户集合,μ s表示2)中确定的特殊用户,μρ表示集合ProUser中的一个用户,|ys — μ p表示信任用户μ p的特殊用户数目; (2)分析并量化用户特征,将用户表示为用户特征向量: O以用户社会网络拓扑结构、用户个体因素和用户间交互行为三个方面信息对用户进行特征分析; 2)量化用户特征,将用户表示为由多个特征组成的用户特征向量; (3)构建前馈神经网络: O依据用户特征向量的维度确定前馈神经网络的输入节点个数; 2)依据可信用户识别的复杂程度确定前馈神经网络的层数以及各层包含的节点数; 3)依据前馈神经网络的结构和性能要求确定隐藏层和输出层包含节点的类型; (4)训练前馈神经网络: 1)依据k-fold交叉验证算法的k值将训练集划分为k个子集,任意两个子集的交集为空; 2)对前馈神经网络进行k次训练,每次选取一个不同的子集作为训练集,余下的k-Ι个子集作为测试集; 3)将k次训练所确定的训练次数依据相应的识别精度赋予不同的权值,依据k个训练次数的相应权值求得加权和作为最终训练次数; 4)依据步骤3)确定的最终训练次数在完整的训练集上训练前馈神经网络; (5)由训练后的前馈神经网络实现可信与不可信用户识别: 1)获取用户社会网络拓扑结构、用户个体因素和用户间交互行为三个方面信息并量化,将用户表示为用户特征向量; 2)将步骤I)得到的用户特征向量输入到前馈神经网络进行可信与不可信用户识别,得到被识别用户的输出值; 3)依据前馈神经网络的输出值识别用户为可信或者不可信。
2.按照权 利要求1所述的基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的获取特殊用户包括如下步骤:(1)依据用户时间相关信息将初始用户集合中的用户按降序排列; (2)以位于中间位置的用户为分界线将排序后的用户划分为两部分,分别计算两部分用户的时间相关信息均值,得到非特殊用户初始聚类中心和特殊用户初始聚类中心,计算公式:
3.按照权利要求1所述的基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的量化用户特征包括如下步骤: (O量化社会网络的拓扑结构:核心度,用户核心度分为出度(Out-Link)和入度(In-Link)两部分,依据用户在社会网络中的信任关系量化出度和入度,采用如下公式:Out-Link = |Trustee /( Trustee|+|Trustor|)
In-Link = |Trustor /( Trustee|+|Trustor|) 其中=ITrusteeI表示用户所信任用户的数目,ITrustorI表示信任用户的用户数目; (2)量化用户个体因素:活跃度和影响力,以用户发表Review数目与所有选中用户发表Review数目的总和的百分比量化活跃度,采用如下公式:
4.按照权利要求1所述的基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的构建前馈神经网络包括如下步骤: (1)依据用户特征向量的维度确定前馈神经网络的输入节点个数,共有七个输入节点:Out-Link、In-Link、Activity> MVP> TVP> Support-rate 和 Oppose-rate ; (2)依据可信用户识别的复杂程度确定前馈神经网络的层数以及各层包含的节点数。共有三层:输入层,七个输入节点;隐藏层,两个隐藏节点;输出层,一个输出节点; (3)依据前馈神经网络的结构和性能要求确定隐藏层和输出层包含节点的类型为sigmoid阈值单元。
5.按照权利要求1所述的基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的训练前馈神经网络包括如下步骤: (1)依据k-fold交叉验证算法(本方法中k取5)的k值将训练集划分为k个子集,任意两个子集的交集为空; (2)对前馈神经网络进行k次训练,每次选取一个不同的子集作为训练集,余下的k-1个子集作为测试集,训练过程中要注意识别精度的“震荡”,当识别精度稳定时停止训练; (3)记录k次训练的识别精度和训练次数,依据识别精度为相应训练次数赋予权值,计算k个训练次数的加权和作为最终训练次数; (4)依据步骤(3)确定的最终训练次数在完整的训练集上训练前馈神经网络,得到相应节点的阈值和相应边的权值。
6.按照权利要求1所述的基于前馈神经网络的可信与不可信用户识别方法,其特征在于,所述的由训练后的前馈神经网络实现可信与不可信用户识别包括如下步骤: (I)在社会网络中获取待识别用户的社会网络拓扑结构、用户个体因素和用户间交互行为三个方面信息并量化为用户特征向量,用户特征向量的形式如下:(Out-Link,In-Link, Activity, MVP, TVP, Support-rate, Oppose-rate); (2)将待识别用户的特征向量输入到前馈神经网络,得到待识别用户的输出值; (3)若待识别用户的输出值与I的差值小于预定的阈值,则用户被识别为可信用户,反之,为不可信 用户。
【文档编号】G06N3/02GK103577876SQ201310547349
【公开日】2014年2月12日 申请日期:2013年11月7日 优先权日:2013年11月7日
【发明者】王英, 左万利, 田中生, 王鑫, 彭涛, 王萌萌, 赵秋月 申请人:吉林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1