一种支持自适应服务的群体兴趣数据获取方法与装置的制作方法

文档序号:6466710阅读:184来源:国知局

专利名称::一种支持自适应服务的群体兴趣数据获取方法与装置的制作方法
技术领域
:本发明涉及一种支持自适应服务的群体兴趣数据获取方法与装置,涉及一种面向自适应服务的数据支持方法与装置,尤其涉及一种群体兴趣数据获取方法与装置。
背景技术
:随着通信技术和电子技术的迅速发展,计算模式已经由传统的以计算机为中心向以人为中心转移,新的计算模式更加强调用户在信息服务中的重要性。自适应服务可以根据用户所处环境或用户兴趣喜好而提供适应用户需求的服务内容;因此,在自适应服务中,获取用户的兴趣数据就成为提供自适应服务的前提,也是自适应服务管理的核心之一。用户分为个体用户和群体用户,在会议室和博物馆等诸多环境中,用于日益以群组的形式出现;因此,如何提供面向群体用户的自适应服务就变得越来越重要,如何有效地获取群体兴趣数据,是对群体进行自适应服务的重要数据支持。专利申请200680002784.5针对其涉及一种获取一个用户群共同兴趣度的方法及装置,其技术手段主要是依据用户对节目内容特征的妥协指数及用户权重,调整喜好程度,以获得用户群对节目的共同兴趣度,通过比较该共同兴趣度值与特定阈值,决定是否向用户群推荐该节目。上述专利所述方法主要是通过计算用户群对待推荐节目的共同兴趣度,把用户群对某节目的共同兴趣度这个一维的值作为衡量用户群整体兴趣的因素,并没有获得群体的整体兴趣数据,而用户的兴趣数据是自适应服务中一个需考虑的重要因素,且群体兴趣数据的描述应该是多维的一系列的关键词。
发明内容要解决的技术问题为了避免现有技术的不足之处,本发明提出一种支持自适应服务的群体兴趣数据获取方法与装置,为自适应服务提供更快速、更有效的数据支持,本发明提供了一种方法及装置,釆集群体成员的个体兴趣数据,经过处理得到一组群体兴趣数据,并存储下来以供自适应服务使用。技术方案一种支持自适应服务的群体兴趣数据获取方法,其特征在于步骤如下步骤1采集个体用户相关的数据和项目相关的数据采集个体用户手持电子器件上用户对所浏览项目的评价值S和关注时间t,得到关注权值W=S+t/tmax;S的取值从l到5,t和tmax的单位为秒,t目x是个体用户当前的最长关注时间;步骤2将项目的关注权值W映射到兴趣关键词上若兴趣关键词出现重叠,则取关注权值的平均值作为新的关注权值,得到集合形式描述的个体兴趣数据{(关键词1,Wl),(关键词2,W2),...};所述的兴趣关键词是从项目数据库中获取用户所浏览项目的特征关键词;步骤3聚合个体兴趣数据,形成群体成员兴趣知识库将个体兴趣数据的集合形式表示进一步抽象为向量表示为个体兴趣数据(Wl,W2,W3,......);将群体中所有成员的个体兴趣数据综合起来,形成二维数组的群体成员兴趣知识库W;W可用矩阵表示,矩阵中的元素Wij代表第i个群体成员在第j个兴趣关键词上的关注权值;步骤4对聚合步骤所产生的群体成员兴趣知识库进行处理,得到群体兴趣数据a)对矩阵W的每一列元素,如果此列中存在某行元素的取值低于3.0,则不考虑此列;否则,计算此列中所有行的元素值之和,提取和值最高2列的下标;b)统计矩阵W每一列元素中值大于5.0的元素个数,取个数最多的一列,若个数超过行数值的一半,则提取此列下标;C)如果在上步中所提取下标对应的列中含值低于3.0的元素,则从此元素所在的行中取最高值元素所属列,如果此列下标已在上两步处理结果中出现过,则取次高值所对应列下标;d)将前面3步所产生的列下标结果所对应的兴趣关键词加入到群体兴趣数据中。一种实现支持自适应服务的群体兴趣数据获取方法的装置,其特征在于包括采集器、转换器、聚合器、处理器和存储器;采集器将采集个体用户相关的数据和项目相关的数据输出至转换器,转换器对采集器得到的数据进行处理,并将处理的数据输出至聚合器,聚合器聚合个体兴趣数据形成群体成员兴趣知识库,将该数据库提供处理器处理得到群体兴趣数据,并输送至存储器进行存储。有益效果本发明所提出的一种支持自适应服务的群体兴趣数据获取方法与装置,是适用于多种结构和组成的群体,快速地采集群体成员的个体兴趣数据,处理生成群体兴趣数据,且方法简单易行,有效地对自适应服务提供了群体兴趣数据的支持。图1:群体兴趣数据获取装置的结构示意图图2:群体兴趣数据获取的方法流程图具体实施例方式现结合实施例、附图对本发明作进一步描述图1是群体兴趣数据获取系统的结构示意图,主要由采集器,转换器、聚合器、处理器、存储器组成,描述为了对群体自适应服务提供数据支持,如何对用户兴趣数据进行收集、处理和存储的过程,以及数据流在各装置之间的传输过程。110为采集器,有两方面的功能一是通过采集个体用户相关的数据,即用户对所关注项目的评价值和关注时间,获得该项目的用户关注权值。二是从项目数据库中获取项目的特征关键词,作为个体用户的兴趣关键词。其中,特征关键词反映用户所浏览项目的内容特点,例如对于博物馆的展品,可以有类型、年代等特征关键词;对于电视节目,可以有文艺、战争、'演员姓名等特征关键词;而这些特征关键词可以用来反映用户的兴趣所在,本发明所述的兴趣关键词,用于指代用户兴趣。120为转换器,其功能是接收到采集器传过来的兴趣关键词、关注权值等数据后,负责将关注权值映射到兴趣关键词上,得到集合形式描述的个体兴趣数据。如果兴趣关键词出现重叠现象,则取它们关注权值的平均值作为新的关注权值。130为聚合器,其功能是聚合所得到的个体兴趣数据,最终形成群体成员兴趣知识库。其操作分为两步,首先,将个体兴趣数据的集合形式表示进一步抽象为向量表示;然后,将群体中所有成员的个体兴趣数据的向量表示综合起来,得到群体成员兴趣知识库。群体成员的兴趣知识库中存储所有群体成员对各个兴趣关键词的关注权值,权值越大,表示对用户对此兴趣关键词的关注程度越大,也即越感兴趣。它的一个实例见表l,以博物馆应用为例,其中Pl到P7指兴趣关键词陶瓷、玉器等,P1到P7上的取值即用户的关注权值,表中每一行代表一个用户的个体兴趣数据。140为处理器,主要功能是对群体成员兴趣知识库进行处理,得到群体兴趣数据。其中,群体兴趣数据是指群体中所有成员可接受的兴趣关键词,描述了群体整体的兴趣所在,具体是一组兴趣关键词。150为存储器,负责存储处理器得到的数据结果,即对群体兴趣数据进行存储,以满足群体自适应服务的数据需要。图2是群体兴趣数据获取的方法流程图,下文结合应用实例与图2对本发明做进一步阐述。第一步,采集用户相关的数据和用户浏览项目相关的数据(步骤S210)。用户相关的数据主要指用户对所关注项目的评价值、关注时间,以及当前最长关注时间;项目相关数据指项目的特征关键词,以用户在博物馆浏览展品为例,展品的特征关键词可能有"陶瓷"、"玉器"、"宋代"等。第二步,根据用户相关数据计算用户对项目的关注权值(步骤S220)。例如,用户的评价值s为4,关注时间t为300秒,当前最长关注时间U^为600秒,计算得到用户的关注权值w=s+t/tmax=4.5。第三步,将项目的特征关键词作为用户的兴趣关键词,将关注权值与兴趣关键词结合得到以集合形式描述的个体兴趣数据(步骤S230)。如果出现兴趣关键词重叠的现象,则取它们关注权值的平均值作为新的关注权值。以用户在博物馆浏览过的某展品1为例,其特征关键词有a)陶瓷,b)宋代。则可以将"陶瓷""宋代"两个特征关键词作为用户的兴趣关键词。假设此展品所对应的关注权值为4.5,那么得到个体兴趣数据{(陶瓷,4.5),(宋代,4.5),...}。如果此时又有用户浏览过的展品2,其特征关键词有a)书画,b)宋代,关注权值为4.9。"宋代"这个关键词上出现了重叠,那么取4.5和4.9的评价值4.7作为新的关注权值。处理后得到的个体兴趣数据为K陶瓷,4.5),(宋代,4.7),(书画,4.9),...}。第四步,将个体兴趣数据的集合形式表示抽象为向量表示(步骤S240)。在特定的应用中,用户的兴趣关键词是特定的,兴趣关键词一旦固定,就可以进一步抽象化个体兴趣数据。以上面所述博物馆应用为例,如果把兴趣关键词固定为(陶瓷,玉器,书画,秦汉时期,宋代),那么对于集合形式描述的个体兴趣数据{(陶瓷,5.1),(书画,3.2),(玉器,2.0),(秦汉时期,4.5),(宋代,3.8)},就可以用向量形式描述来表示用户兴趣(5.1,2.0,3.2,4.5,3.8)。第五步,综合群体中所有成员的个体兴趣数据,形成群体成员兴趣知识库(步骤S250)。群体成员的兴趣知识库的一个实例见表1,其中P1到P7指兴趣关键词陶瓷、玉器等,Pl到P7上的取值即用户的关注权值,表中每一行代表一个用户的个体兴趣数据。第六步,对群体成员兴趣知识库进行处理,得到群体兴趣数据(步骤S260)。以表1为实例,以下详细描述此步骤。该步骤又可由以下4个子步骤实现表l:群体成员兴趣知识库<table>tableseeoriginaldocumentpage9</column></row><table>①对表l中的每一列,若此列中含值小于3.0的元素,则排除此列,这样剩下第3列,第4列,第5歹iJ,第7歹U,计算这4列中各行元素的值之和,分别为13.6,13.7,13.1,11.6。和最高的两列为第4列和第3列,提取下标4和下标3。处理结果下标4,下标3②统计每一列中值大于5.0的元素个数,取个数最多的一列。其中第6列中含2个这样的元素(Userl对P6的关注权值为5.2,User2对P6的关注权值为5.3),是个数最多的一列,且个数值大于行数值的一半,所以取下标6。处理结果下标6③如果上一步中所取下标所对应的列中含值小于3.0的元素,针对此元素所属行,取此行中最高值所对应的列,若此列下标已在操作结果中出现过,则取次高值所对应下标。这样是为了用高权值兴趣关键词来降低上一步中低权值兴趣关键词给某些群体成员带来的不适度/痛苦度,达到一个整体公平的效果。第6列中User3的权值为1.0,User3的最大关注权值出现在第1列Pl上,为5.4,且下标1尚未在处理结果中出现过,因此取下标l。处理结果下标l将产生的列下标结果所对应的兴趣关键词,即P4,P3,P6,Pl,加入到群体兴趣数据中。第七步,存储群体兴趣数据(步骤S270)。存储S260得到的数据,即对群体兴趣数据(P4,P3,P6,Pl)进行存储,以满足群体自适应服务的数据需要。本方法在实际应用中有以下几个特点首先,对群体成员的结构和数量没有严格限制。其次,方法简单易行,可以简单快速地获取群体成员的个体兴趣数据,并进行融合加工进而获得群体兴趣,以有效地对群体自适应服务进行数据支持。权利要求1.一种支持自适应服务的群体兴趣数据获取方法,其特征在于步骤如下步骤1采集个体用户相关的数据和项目相关的数据采集个体用户手持电子器件上用户对所浏览项目的评价值s和关注时间t,得到关注权值w=s+t/tmax;s的取值从1到5,t和tmax的单位为秒,tmax是个体用户当前的最长关注时间;步骤2将项目的关注权值w映射到兴趣关键词上若兴趣关键词出现重叠,则取关注权值的平均值作为新的关注权值,得到集合形式描述的个体兴趣数据{(关键词1,w1),(关键词2,w2),...};所述的兴趣关键词是从项目数据库中获取用户所浏览项目的特征关键词;步骤3聚合个体兴趣数据,形成群体成员兴趣知识库将个体兴趣数据的集合形式表示进一步抽象为向量表示为个体兴趣数据(w1,w2,w3,......);将群体中所有成员的个体兴趣数据综合起来,形成二维数组的群体成员兴趣知识库W;W可用矩阵表示,矩阵中的元素wij代表第i个群体成员在第j个兴趣关键词上的关注权值;步骤4对聚合步骤所产生的群体成员兴趣知识库进行处理,得到群体兴趣数据a)对矩阵W的每一列元素,如果此列中存在某行元素的取值低于3.0,则不考虑此列;否则,计算此列中所有行的元素值之和,提取和值最高2列的下标;b)统计矩阵W每一列元素中值大于5.0的元素个数,取个数最多的一列,若个数超过行数值的一半,则提取此列下标;c)如果在上步中所提取下标对应的列中含值低于3.0的元素,则从此元素所在的行中取最高值元素所属列,如果此列下标已在上两步处理结果中出现过,则取次高值所对应列下标;d)将前面3步所产生的列下标结果所对应的兴趣关键词加入到群体兴趣数据中。2.—种实现权利要求1所述的支持自适应服务的群体兴趣数据获取方法的装置,其特征在于包括采集器、转换器、聚合器、处理器和存储器;采集器将采集个体用户相关的数据和项目相关的数据输出至转换器,转换器对采集器得到的数据进行处理,并将处理的数据输出至聚合器,聚合器聚合个体兴趣数据形成群体成员兴趣知识库,将该数据库提供处理器处理得到群体兴趣数据,并输送至存储器进行存储。全文摘要本发明涉及一种支持自适应服务的群体兴趣数据获取方法与装置,其特征在于步骤如下采集个体用户相关的数据和项目相关的数据,将项目的关注权值w映射到兴趣关键词上,聚合个体兴趣数据,形成群体成员兴趣知识库,对聚合步骤所产生的群体成员兴趣知识库进行处理,得到群体兴趣数据。实现本方法的装置,由采集器、转换器、聚合器、处理器和存储器组成。本发明所提出的一种支持自适应服务的群体兴趣数据获取方法与装置,是适用于多种结构和组成的群体,快速地采集群体成员的个体兴趣数据,处理生成群体兴趣数据,且方法简单易行,有效地对自适应服务提供了群体兴趣数据的支持。文档编号G06F17/30GK101625687SQ20081015031公开日2010年1月13日申请日期2008年7月11日优先权日2008年7月11日发明者倪红波,周兴社,武瑞娟,柱王,王海鹏申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1