一种基于用户动机倾向性的标签推荐方法及系统的制作方法

文档序号:6425894阅读:158来源:国知局
专利名称:一种基于用户动机倾向性的标签推荐方法及系统的制作方法
技术领域
本发明属于Web信息资源处理及利用领域,具体涉及基于用户动机倾向性为Web 信息资源推荐标签的方法和基于此方法的推荐系统。
背景技术
随着hternet的日益发展,网络信息资源正以人们难以想象的速度增长,Web2. 0 的出现使得这种增长势头更加迅猛。在*吐2.0中,互联网体系由原来自上而下的、少数资源控制者集中控制、主导转变为自下而上的由广大用户集体智慧和力量主导。用户除了是网络信息资源的浏览者之外,同时还是网络信息资源的生产者。Web2. 0用户创造内容的这种特性虽然丰富了信息的来源,加速了信息的扩散,但也同时引发了信息过载、搜寻负荷加重、信息品质降低等问题。那么,用户如何从容地组织和管理铺天盖地海量网络信息资源以及如何快速地、低成本地、有效地获取合适而又高质量的信息就成为了摆在我们前面的不可逾越的重大研究课题。理想的网络信息资源组织应该以用户为中心,充分利用新兴技术和人们积累的经验,组织体系应具备较高的实用性和易用性。在0环境下,社会标签系统作为网络信息资源组织的一种非常有效的方法正发挥着重要的作用。作为组织方式,它与传统的自顶向下的、刚性的受控层次分类体系不同,社会标签系统体系具有以下三个优点(1)社会标签是网络信息资源用户对网络资源标注时产生的,相同的社会标签经过汇集以后形成了新的分类,它是自底向上的;(2)社会标签不受控于专家,用户可以自行使用任意词进行标注,具有极高的灵活性、易用性和主观认知性,网络资源可以“柔性”隶属于多个大众分类。在社会标签系统中,用户可以从多个维度、多个层次对网络资源进行标注。因此,它的结构是非层次的。然而在具备众多优势的同时,标签方式同样存在缺点,主要表现于以下两个方面 (1)大多数社会标签系统允许用户自行输入标签,这种运作模式使用户很容易控制标注行为,但由于标注的随意性也造成了标签中存在较多噪音,错拼、歧义以及无实际意义的用户自定义标签常常充斥其中,这对标签的实用性造成了不小障碍。为此,有些社会标签系统不得不专门为用户给出一些指导原则。(2)数据稀疏问题,由于标签式浏览是一种新兴的信息组织方式,还没有得到十分广泛的应用,尤其在中文资源中,采用这种组织方式的网络资源十分稀少,另一方面,用户尚不习惯于为网络资源添加大量的标签,从而使得网络上现有的标签资源极为稀少。近年来,正是在这种实际需求下,标签推荐技术受到了学术界以及互联网企业的广泛关注。标签推荐就是通过考察、分析、挖掘网络信息资源的内容和用户的标注历史、显式或隐式的关系为待标注网络信息资源提供一系列高质量的标签作为候选。推荐的目的主要是(1)简化标注程序,方便用户使用,从而增加社会标签系统的可用性和粘性。( 提高标签的质量,降低错拼、歧义等情况,提高标签在信息资源组织、检索、利用和发现的作用。 (3)改变标签空间的结构,使得标签空间更快的稳定和收敛,进而涌现语义。
目前,国内外针对各种网络信息资源已经有一些发展较为成熟的社会标签推荐系统,这些系统都在信息资源组织、检索、分享和发现等方面起到了非常重要的作用。这些系统包括对商品进行标签推荐的Amazon,对网页资源进行标签推荐的Delicious,对图片进行标签推荐的Flickr、对学术论文进行标签推荐的Bibsonomy、为图书电影推荐标签的豆瓣网、为提供视频分享推荐标签的土豆网等。业已存在的标签推荐系统主要采用电子商务系统中传统的推荐商品的技术,主要包括基于内容的推荐技术、基于协同过滤的推荐技术、基于关联规则的推荐技术和这些技术的混合技术。在推荐依据上,这些传统推荐技术要么是基于资源本身的内容进行推荐,要么基于用户标注的历史结果进行推荐。在推荐算法上,大多数是采用数据挖掘或机器学习的算法。这些传统的标签推荐技术在一定程度上解决了信息过载和信息资源的组织、分类、检索的问题,但是在效果上还很不理想,尤其是不能推荐满足用户信息需求的标签。

发明内容
为了满足用户的信息需求,从用户使用社会标签系统的动机出发,识别其信息目标,为其推荐更准确的社会标签,本发明提供了一种基于用户动机倾向性的推荐标签方法, 该方法能够推荐给用户一个符合用户意图的多个标签组成的列表。本发明同时还提供了基于该方法的标签推荐系统。本发明是采用如下技术方案实现的本发明提供了一种基于用户动机倾向性的标签推荐方法,包括以下步骤(1)根据用户三元组,计算用户的动机倾向性、每个已标注资源的动机倾向性和待标注资源的动机倾向性;所述用户三元组包括用户的标注历史、已标注资源及对应的标注和待标注资源及对应的标注;(2)在已标注资源中选择与待标注资源的动机倾向性相似的资源,将得到的资源称为非用户依赖相似资源;(3)在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,将得到的资源称为标签推荐候选资源;(4)将标签推荐候选资源中的所有标签合并,得到合并标签集;(5)计算合并标签集中每个标签的推荐重要性;(6)按照每个标签的推荐重要性从大到小,进行标签推荐。本发明还提供了一种基于用户动机倾向性的标签推荐系统,包括动机倾向性计算模块、选择非用户依赖相似资源模块、选择标签推荐候选资源模块、标签合并模块、推荐重要性计算模块和输出模块;动机倾向性计算模块用于计算用户的动机倾向性、每个已标注资源的动机倾向性和待标注资源的动机倾向性;选择非用户依赖相似资源模块用于在已标注资源中选择与待标注资源的动机倾向性相似的资源,得到非用户依赖相似资源;选择标签推荐候选资源模块用于在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,得到标签推荐候选资源;标签合并模块用于将标签推荐候选资源中的所有标签合并,得到合并标签集;
推荐重要性计算模块用于计算合并标签集中每个标签的推荐重要性;输出模块用于按照每个标签的推荐重要性从大到小,进行标签推荐。现有社会标签系统中标签推荐方法的着眼点是资源本身的内容或者标签的同现结构等,而本发明所提出的方法直接从用户相对稳定的标注动机倾向性出发,通过获得用户的标注动机倾向性,并根据该标注动机倾向性进行标签推荐,所推荐的标签更符合用户的意图,推荐的效果更好。本发明能够识别用户标注网络信息资源的动机,这种动机的发现对设计标签推荐系统提供很好的设计参考,并能对标签空间中本体的学习产生指导作用, 更利于社会标签结构的稳定、社会标签的语义涌现。


图1是基于用户动机倾向性的标签推荐流程;图2是本发明特殊标签使用率查询示意图;图3是本发明描述动机倾向性用户的标签云图;图4是本发明所述的标签推荐系统模块图。
具体实施例方式下面结合附图和实例对本发明作进一步详细的说明。本发明中所述的动机倾向性主要有两类,即分类动机倾向和描述动机倾向,它们的特点如表1所示。表1分类动机倾向和描述动机倾向的特点
权利要求
1.一种基于用户动机倾向性的标签推荐方法,包括以下步骤(1)根据用户三元组,计算用户的动机倾向性、每个已标注资源的动机倾向性和待标注资源的动机倾向性;所述用户三元组包括用户的标注历史、已标注资源及对应的标注和待标注资源及对应的标注;(2)在已标注资源中选择与待标注资源的动机倾向性相似的资源,将得到的资源称为非用户依赖相似资源;(3)在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,将得到的资源称为标签推荐候选资源;(4)将标签推荐候选资源中的所有标签合并,得到合并标签集;(5)计算合并标签集中每个标签的推荐重要性;(6)按照每个标签的推荐重要性从大到小,进行标签推荐。
2.根据权利要求1所述的标签推荐方法,其特征在于,步骤(1)中用户u的动机倾向性为 Mu = (TRRu, LFTUu, TRCEu, TSOFu, STRu),TRRu, LFTUu, TRCEu, TSOFu, STRu 为用户 u 的动机倾向性的度量指标,各度量指标按如下公式计算
3.根据权利要求1或2所述的标签推荐方法,其特征在于,步骤( 中采用如下方法得到非用户依赖相似资源(3. 1)分别计算每一个已标注资源的动机倾向性与待标注资源的动机倾向性的相似度;(3.2)选择相似度大于阀值α的已标注资源,即得到非用户依赖相似资源,其中0<α < 1。
4.根据权利要求1或2所述的标签推荐方法,其特征在于,步骤C3)中采用如下方法得到标签推荐候选资源(4. 1)计算非用户依赖相似资源中每个资源的动机倾向性与用户动机倾向性的相似度;(4.2)选择相似度大于阀值β的非用户依赖相似资源,即标签推荐候选资源,其中0<β < 1。
5.根据权利要求1或2所述的标签推荐方法,其特征在于,步骤(5)中采用如下方法计算合并标签集中每个标签的推荐重要性(5.1)计算待标注资源?中的每个词w在待标注资源f中的内容重要性 其中,”、为词w在待标注资源中出现的次 数,为待标注资源卩中所有词的个数,为所有标签推荐候选资源包含的全部词的个数,Rcad(W) ι为所有标签推荐候选资源中包含的词W的资源的个数; (5. 2)计算词W与合并标签集中标签t之间的相关性S (w, t),
6.一种基于用户动机倾向性的标签推荐系统,包括动机倾向性计算模块(100)、选择非用户依赖相似资源模块000)、选择标签推荐候选资源模块(300)、标签合并模块000)、 推荐重要性计算模块(500)和输出模块(600);动机倾向性计算模块(100)用于计算用户的动机倾向性、每个已标注资源的动机倾向性和待标注资源的动机倾向性;选择非用户依赖相似资源模块(200)用于在已标注资源中选择与待标注资源的动机倾向性相似的资源,得到非用户依赖相似资源;选择标签推荐候选资源模块(300)用于在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,得到标签推荐候选资源;标签合并模块(400)用于将标签推荐候选资源中的所有标签合并,得到合并标签集; 推荐重要性计算模块(500)用于计算合并标签集中每个标签的推荐重要性; 输出模块(600)用于按照每个标签的推荐重要性从大到小,进行标签推荐。
全文摘要
本发明提供了一种基于用户动机倾向性的标签推荐方法,该方法根据用户三元组,计算用户的动机倾向性、每个已标注资源的动机倾向性和待标注资源的动机倾向性;在已标注资源中选择与待标注资源的动机倾向性相似的资源,得到非用户依赖相似资源;在非用户依赖相似资源中选择与用户的动机倾向性相似的资源,得到标签推荐候选资源;将标签推荐候选资源中的所有标签合并,得到合并标签集;计算合并标签集中每个标签的推荐重要性;最后按照每个标签的推荐重要性从大到小,进行标签推荐。本发明能够识别用户标注网络信息资源的动机,推荐给用户一个符合用户意图的多个标签组成的列表。本发明同时还提供了基于该方法的标签推荐系统。
文档编号G06F17/30GK102262653SQ20111015435
公开日2011年11月30日 申请日期2011年6月9日 优先权日2011年6月9日
发明者文坤梅, 李玉华, 李瑞轩, 辜希武, 靳延安 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1