一种用于推荐技术的用户配置文件更新方法_2

文档序号:9619198阅读:来源:国知局
述步骤⑤中的非线性函数f(x)为以下所列函数: C〇〇3〇] f (X)二4. 47*e-( 16.47 )。
[0031] 本发明可以利用EPG的资源内容或者其他内容提供商提供节目内容数据,并提供 一个用户交互接口,通过该接口用户可以进行注册,在注册时需要用户提供显式的兴趣偏 好,该兴趣偏好将以用户配置文件的形式存储在User Profile数据库,该用户接口还能为 具体的电视节目提供显式评分,评分数据会储存在User Rating数据库中,在用户每次为一 个节目评分之后,会根据节目内容提供商提供的节目内容信息,对用户配置文件进行更新; 这些数据都将会被作为推荐技术的输入数据。
[0032] 电视节目不同于基于网页的领域,比如新闻网站的内容一般为文本类型,能够通 过关键词和信息分类等内容来获取自己想要的内容,并且还能通过鼠标和键盘简单的操作 来获取信息。电视节目的内容则为视频内容,并且视频内容不能非常有效获取视频的所有 内容,包括每一帧的画面等。在这种背景下,目前,一般利用电视节目的元数据(演员,类 型,导演等)来描述电视节目。
[0033] 通过网络进行注册时需要显式提供用户的兴趣偏好,所有偏好内容被分为三类特 征值,分别是类型,演员,导演。每一类特征值都允许有1个或多个关键词,每个关键词都 有代表该关键词相对重要程度的权值,以及该关键词在当前用户的被评节目中的出现次数 和。在注册时每类特征值的每个关键词的权值被赋予初值,物品的表示被分为三类特征值, 分别为类型,演员,导演,类型的初值被设定为〇. 4,演员的初值为0. 3,导演的初值为0. 35。
[0034] 用户配置文件并不是静态不变的,而是随着用户的兴趣变化而动态变化的。如果 把电视节目被分为的3种类型特征的每一类特征的值域看成是相关类型的k个关键词,那 么每种类型就可以由k个关键词来描述。比如,类型(动作,科幻,喜剧,恐怖,.....),演 员(成龙,李小龙,李连杰,--)。用户配置文件被定义为(key, w, times),其中key代表 某类特征值的关键词,w代表相应权值,times代表次数。如果某用户演员类的配置文件形 如,演员(成龙,1,2),代表某一个具体的演员"成龙"的权重值为1,出现次数和为2。当用 户评价某个电视节目后,若该节目的演员为"成龙"和"刘德华",匹配该节目与用户配置文 件中相关类型特征值中的关键词,若节目中的关键词存在于配置文件中,则该关键词只需 设一个布尔类型的值Xi = 1,Xi表示某类特征值的第i个关键词的布尔值,否则添加该关 键词并赋值w = 0. 3, times = 1,再把布尔特征值设置为Xi = 1。在此例中,"刘德华"这 个关键词将被添加到用户配置文件,并设w = 0. 3, times = 1,"刘德华"这个关键词中, times = 1,并且"成龙" "刘德华"的布尔类型值都被设为1。
[0035] 如果一个用户越喜欢(评分越高)一个节目、在此节目描述中抽取的关键词的权 值之和越小、目标关键词的出现次数越多,则相应关键词的权值将增加得越多,否则越少。
[0036] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种用于推荐技术的用户配置文件更新方法,其特征在于,包括W下步骤: 步骤①:在用户注册后,提取注册信息中的用户兴趣偏好; 步骤②:将所述步骤①中的用户兴趣偏好分为n类特征值TYPE,每一类特征值都包含1个或多个关键词key,每个关键词都有代表该关键词相对重要程度的权值W,W及该关键词 在当前用户的被评节目中出现的次数总和times,并将用户配置文件中的数据格式定义为 TYPE(key,w,times); 步骤③:给所述步骤②中的每一类特征值TYPE的每个关键词key的权值W赋予一个初 始值,并将该关键词key的次数总和times的值设为1,最终生成用户配置文件; 步骤④:当用户评价节目之后,基于所述步骤③中生成的用户配置文件,匹配被评价的 节目与用户配置文件中相关类型特征值TYPE的关键词key;如果被评价节目中的关键词存 在于用户配置文件中,则给该关键词设一个布尔类型的值Xi= 1,表示某类特征值的第i个 关键词存在;如果被评价节目中的关键词在用户配置文件中不存在,则给用户配置文件中 添加该关键词并赋一个初始值给对应的权值W,该关键词对应的次数总和times的值设为 1,再给该关键词设一个布尔类型的值Xi= 1 ; 步骤⑥:将所述步骤④中被评价节目的关键词作为更新的目标关键词,用W下公式更 新用户配置文件中的关键词的权值: Wn=Wp*rating/E(X) 其中,Wn代表目标关键词更新之后的权值;Wp代表目标关键词更新之前的权值;rating代表用户对当前节目的评分值;EWiXi代表从此节目描述中抽取的关键词的权值 之和,其中i代表该类特征值中的第i个关键词;f (X)是一个关于自变量X的非线性函数, X代表目标关键词出现的次数。2. 如权利要求1所述的一种用于推荐技术的用户配置文件更新方法,其特征在于,所 述步骤⑥中的非线性函数f (X)为W下所列函数:
【专利摘要】本发明提供了一种用于推荐技术的用户配置文件更新方法,用户的配置文件不是静态不变的,而是随着用户的兴趣变化而动态变化的。把电视节目被分为的n种类型特征的每一类特征的值域看成是相关类型的k个关键词,那么每种类型就可以由k个关键词来描述。用户配置文件被定义为(key,w,times),key代表某类特征值的关键词,w代表相应权值,times代表次数。
【IPC分类】H04N21/45, H04N21/458, H04N21/466
【公开号】CN105376648
【申请号】CN201510772537
【发明人】李 浩, 夏欢
【申请人】云南大学
【公开日】2016年3月2日
【申请日】2015年11月13日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1