一种基于用户兴趣的服务资源检索方法

文档序号:6535679阅读:256来源:国知局
一种基于用户兴趣的服务资源检索方法
【专利摘要】一种基于用户兴趣的服务资源检索方法,具体步骤为:获取用户的兴趣信息并生成用户兴趣剖像、用二元组兴趣向量表征用户兴趣剖像、计算相关文档的兴趣相关因子、提取用户检索请求中的提问向量、分析提问向量和文档向量之间的相似度、计算文档与提问向量的兴趣相似度、根据兴趣相似度的大小对相关文档进行排序。本发明在对服务资源进行检索时,通过对用户兴趣的提取并分析,使得检索更加符合用户的实际需要,实现了基于用户兴趣的个性化服务资源检索,明显改善了检索效果,降低了对海量的网络服务资源检索的时间,效率有明显的提高。
【专利说明】—种基于用户兴趣的服务资源检索方法
【技术领域】
[0001]本发明涉及到互联网服务资源的提供领域,具体的说是一种基于用户兴趣的服务资源检索方法。
【背景技术】
[0002]服务资源分类是指对网络中各种已存在的服务和资源按照其各自的属性和特点进行分析,并划分使其归属于特定的类别。随着互联网技术的高速发展以及计算机技术的不断普及,促使人们对网络服务资源的依赖愈加强烈,而服务资源的分类是一个复杂的加工处理过程,其涉及到服务资源的预处理、特征向量集合的提取和分类等技术环节,服务资源分类则可理解为采用一定的方法与模式,按照一定的规则将网络上的各种资源进行全面的分析、优选、加工、排列组合、整理、分类等加工处理,使其形成一个有序的、便于用户高效获取并利用的服务资源体的系统过程。服务资源的分类使得繁杂零散的资源集合形成了有序化的结构,使之转化为一个有意义的整体,便于服务资源能依据某一特定形式的规则进行更高层次的存取和利用。目前网络上的服务和资源十分丰富,如何将海量的服务资源准确的分类,这已成为资源分类技术要处理的一个关键问题。
[0003]当前服务资源分类方法基本是用户依据一定规则自行手动进行人工分类。在资源量过大的时候,使用这种方法必定将消耗大量人力,并且效率相当低下。当用户定义新类别时,又要对原先未定义种类的服务资源进行再次分类,若再进行人工分类,代价过大。近年来,一些学者使用智能学习的方法来进行分类,取得了一定的成果。现在一些常用的智能分类方法有聚类算法、决策树算法等。聚类算法由于具有无监督的学习能力,但在高维数据空间中,聚类往往只存在于某些子空间中,并且不同的聚类所关联的子空间也存在差异。受“维度效应”的影响,传统的聚类算法一般无法直接对高维数据进行有效的聚类,需要通过一些特殊的处理。决策树分类的直观表示方法较容易转化为标准的数据库查询,其归纳的方法行之有效,尤其适合大型数据集。但其算法的伸缩性太差,随着数据量的增大其运行时间大大增加。
[0004]目前,个性化检索是服务资源检索领域的热点和难点。这一领域的研究范围很广,涉及到的问题也很多。许多学者从不同的角度,提出多种技术方法,主要有:①网络数据库技术(web Database),构建用户等相关数据库;②过程跟踪技术(Process Tracking),如Cookies技术等;③代理技术(Agent),代理指在分布式系统中持续自主的发挥作用的计算实体,他有独立性、自主性和交互性等特性,,借助代理,可以很好地完成用户与系统的交互数据挖掘技术(Data Mining),从海量数据中采掘出隐含的、先前未知的、对决策有潜在价值的知识和规则,并根据这些规则,预测用户即将发生的行为;⑤推送技术(Push),根据用户定义的准则,自动搜索用户感兴趣的服务资源,并主动传递至用户指定“地点”;⑥信息过滤技术(Information Filtering),信息过滤是一种用来过滤大量信息流,为用户提供相关信息子集的技术。信息过滤可以分为:基于规则的过滤、基于协作的过滤、基于内容的过滤,它们的目标都是根据用户兴趣需要将最有价值的服务资源信息自动推荐给用户,并最大限度地节省用户的阅读时间。
[0005]传统的服务资源检索技术满足了人们一定的检索需要,但受通用性限制,无法满足用户一些复杂的查询需求。随着信息爆炸出现,人们对检索系统的功能、智能化程度以及检索效果有了更高的要求,希望能提供更准确、更精炼和更符合个人需要的检索结果。

【发明内容】

[0006]为解决传统的检索技术难以满足人们对检索系统功能、智能化程度以及检索效果的要求的问题,本发明提供了一种基于用户兴趣的服务资源检索方法,来满足用户多样化的实时需求,更加快捷的为用户提供更优质的服务。
[0007]本发明为解决上述技术问题采用的技术方案为:一种基于用户兴趣的服务资源检索方法,首先,定义文档集合D中的文档总数为N,任一属于集合D的文档都可以表示为t维
向量的形式
【权利要求】
1.一种基于用户兴趣的服务资源检索方法,首先,定义文档集合D中的文档总数为N,任一属于集合D的文档都可以表不为t维向量的形式:
2.根据权利要求1所述的一种基于用户兴趣的服务资源检索方法,其特征在于:所述步骤八中更新该用户的兴趣剖像库,其具体步骤如下: ①初始化用户兴趣树,使每个节点均对应一原始权值&(其中,0〈k〈n+l ),该数值表征用户对此节点下所有文档的访问次数; ②叶子节点权值不变,重新计算每一个非叶子节点的权值:
【文档编号】G06F17/30GK103761286SQ201410015693
【公开日】2014年4月30日 申请日期:2014年1月14日 优先权日:2014年1月14日
【发明者】魏汪洋, 张明川, 郑瑞娟, 吴庆涛, 杨春蕾, 娄颖, 崔敏, 汪兴, 蔡晓刚 申请人:河南科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1