一种电视平台上基于语义链接的异构资源推荐方法和装置制造方法

文档序号:6635750阅读:185来源:国知局
一种电视平台上基于语义链接的异构资源推荐方法和装置制造方法
【专利摘要】本发明公开了一种电视平台上基于语义链接的资源推荐方法和装置,该方法包括:提取后台媒体资源库所有媒体资源的文本信息;根据每个媒体资源的文本信息提取该媒体资源的候选特征词,计算所述候选特征词的权值,根据所述权值对所述候选特征词进行过滤得到特征词,生成后台媒体资源库的特征词权值矩阵T;如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源,则采用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源的聚类相似度,选取聚类相似度最高的L个媒体资源生成媒体资源推荐列表。
【专利说明】一种电视平台上基于语义链接的异构资源推荐方法和装置

【技术领域】
[0001] 本发明涉及多媒体【技术领域】,特别是一种电视平台上基于语义链接的异构资源 推荐方法和装置。

【背景技术】
[0002] 用户在电视平台上观看电视节目的时候,通常会对当前节目的某些信息感兴趣, 想要进一步观看跟当前节目相关的其它媒体资源。针对用户的这一心理,目前出现了一些 媒体资源间的推荐方法,一般为根据用户观看的当前资源,获取当前资源的关键词来表征 用户特征,使用获得的关键词作为表征用户特征的向量,将与当前资源相似度高的资源推 荐给用户。
[0003] 然而目前存在的这些媒体资源间的推荐方法存在很多弊端,例如:多为同类资源 间的推荐,异构资源间的推荐应用较少;为数不多的异构资源推荐多为单向推荐,即某种资 源到另一种资源,如与电视节目关联的视频源推荐方法、与电视节目关联的产品推荐方法 等,多种资源间相互推荐的方法较少;资源推荐方法中起到重要作用的词,部分可识别,部 分不能识别需要手工构造,操作起来较为繁琐;局限于词形信息,缺少语义信息;依赖于人 工标注,缺少对用户反馈的利用,其推荐结果对用户来说并不十分理想。


【发明内容】

[0004] 有鉴于此,本发明提出了一种电视平台上基于语义链接的异构资源推荐方法和装 置,能够根据用户当前观看的资源,无需用户额外操作从而自动、智能推荐异构资源。
[0005] 本发明提出的技术方案是:
[0006] -种电视平台上基于语义链接的异构资源推荐方法,包括:
[0007] 提取后台媒体资源库所有媒体资源的文本信息;
[0008] 根据每个媒体资源的文本信息提取该媒体资源的候选特征词,计算所述候选特征 词的权值,根据所述权值对所述候选特征词进行过滤得到特征词,生成后台媒体资源库的 特征词权值矩阵T ;
[0009] 如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源,则采用聚类 的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体 资源的聚类相似度,选取聚类相似度最高的L个媒体资源生成媒体资源推荐列表,所述L为 大于0的整数。
[0010] 一种电视平台上基于语义链接的异构资源推荐装置,包括:
[0011] 文本信息提取模块,用于提取后台媒体资源库所有媒体资源的文本信息;
[0012] 特征词提取模块,根据每个媒体资源的文本信息提取该媒体资源的候选特征词, 计算所述候选特征词的权值,根据所述权值对所述候选特征词进行过滤得到特征词,生成 后台媒体资源库的特征词权值矩阵T ;
[0013] 媒体资源推荐列表生成模块,如果用户观看的当前媒体资源是所述后台媒体资源 库中的媒体资源,则采用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库 中每个媒体资源与当前媒体资源的聚类相似度,选取聚类相似度最高的L个媒体资源生成 媒体资源推荐列表,所述L为大于O的整数。
[0014] 综上,本发明提出的电视平台上基于语义链接的异构资源推荐方法和装置,依托 于海量数据资源,将各类异构资源映射到同一语义空间中,自动构建异构资源间语义关系, 生成文本到视频、视频到文本等异构资源之间的语义链接关系,从而产生异构资源推荐列 表,该方法有效避免了传统推荐中仅仅局限于词形信息的现象,满足用户对相关性和多样 性的要求。

【专利附图】

【附图说明】
[0015] 图1为本发明方法实施例一的流程图;
[0016] 图2为本发明方法实施例二的流程图;
[0017] 图3为本发明实施例中的装置结构图。

【具体实施方式】
[0018] 为使本发明的目的、技术方案和优点表达的更加清楚明白,下面结合附图及具体 实施例对本发明再作进一步详细的说明。
[0019] 用户在电视平台上观看当前媒体资源时,本发明提出的电视平台上基于语义链接 的异构资源推荐方法,可以根据后台媒体资源库中的各类异构资源与用户观看的当前媒体 资源的聚类相似度,为用户提供与当前媒体资源相关度较高的L个后台媒体资源,便于用 户观看与当前媒体资源相关的后台媒体资源。
[0020] 方法实施例一
[0021] 图1为本发明实施例的流程图,如图1所示,包括以下步骤:
[0022] 步骤101 :提取后台媒体资源库所有媒体资源的文本信息。
[0023] 本步骤中,首先对后台媒体资源库的所有媒体资源进行文本信息的提取。将后台 媒体资源库中每个媒体资源用Di表示,其中i为正整数,且I < i < N,N为后台媒体资源 库包含的媒体资源的个数。
[0024] 后台媒体资源库的所有媒体资源可以分为两大类:新闻文本和视频资源。对于新 闻文本,直接提取文本信息;对于视频资源,文本信息位于视频标题和字幕内容,视频标题 相对容易获取,字幕内容的识别方法有两种:一种是播放流中自带字幕,可以从播放流中提 取字幕;另一种是通过对图像进行处理,通过定位字幕在图像中的位置完成字幕提取,并整 合成相应的视频描述文本。
[0025] 经过对后台媒体资源库中所有媒体资源的文本信息提取,将每个媒体资源用文本 的形式表示出来。
[0026] 步骤102 :提取后台媒体资源库每个媒体资源的候选特征词。
[0027] 步骤101中获得了后台媒体资源库中每个媒体资源的文本信息,本步骤对步骤 101中获取的文本信息进行进一步处理,得到每个媒体资源的候选特征词,媒体资源的候选 特征词从一定程度上能够有代表性的表示该媒体资源的内容。
[0028] 首先利用词法分析工具根据词性的不同,将每个媒体资源的文本信息切分为若干 个分词,得到每个媒体资源的分词序列。由于词法分析工具仅是根据词性的判断对文本信 息进行切分,并没有考虑切分后的分词对表征该媒体资源的重要程度、以及各分词在该媒 体资源的文本信息中上下文之间的语义关系,因此这一切分过程可能会得到一些没有实际 意义的分词,例如"在"、"把"等,还可能将原本是一个整体的词串切分成两个甚至多个分 词,例如将"搜狐视频"切分为"搜"、"狐"、"视频"三个分词,而原本"搜狐视频"应该作为一 个整体词串来表征媒体资源的。
[0029] 针对词法分析工具的这一弊端,不能直接将上述得到的分词作为每个媒体资源的 候选特征词,需要将上述得到的分词和热词词典进行匹配,用热词词典对上述得到的分词 进行修正,将热词词典中包含关系的多个分词按照最长词串进行合并,合并后的分词作为 该媒体资源的候选特征词。例如,某媒体资源的分词序列包括"搜"、"狐"、"视频"三个分词, 热词词典中包含"搜"、"狐"、"视频"以及"搜狐视频"四个热词,则将该媒体资源中的"搜"、 "狐"、"视频"三个分词按照热词词典中的最长词串"搜狐视频"进行合并,得到该媒体资源 的一个候选特征词"搜狐视频"。具体实施时可以采用字典树的方法将每个媒体资源的分词 序列与热词词典进行匹配。用热词词典对上述得到的分词进行修正后,能够使修正后的分 词更加符合人们的阅读习惯。
[0030] 这里的热词词典是一个热词的集合,热词词典里的热词能够有代表性的表征后台 媒体资源库的语义信息,其构建方法为:
[0031] (1)根据后台媒体资源库中所有媒体资源的文本信息的语言类型,选用特定语言 类型中的分隔符将后台媒体资源库中所有媒体资源的文本信息拆分成子句,例如中文中的 "。"、" !"、"? "等中文标点符号,或者英文中的""等英文标点符号。
[0032] (2)计算后台媒体资源库中各个重复词串的词频,重复词串的词频定义为该重复 词串在后台媒体资源库多少个子句中出现,将每个词频大于词频阈值的重复词串作为候选 词串,构建候选词串集合。
[0033] (3)对候选词串进行过滤,过滤后保留下的候选词串作为热词,构建热词词典。
[0034] 具体过滤方法可以通过下面三个步骤实现:
[0035] a.收集停用词表,并利用停用词表对候选词串进行过滤,即将出现在停用词表中 的候选词串从候选词串集合中删除。
[0036] b.计算每个候选词串的权值,该权值用词频(TF,Term Frequency)-逆文档频率 (IDF, Inverse Document Frequency)表示,将权值低于权值阈值的候选词串从候选词串集 合中删除,TF-IDF的计算方法为现有技术,在此不再赘述。
[0037] c.根据候选词串中噪声数据的类型制定先验知识,如文本信息中常会出现时间信 息、数字与量词等构成的噪声串,将该类噪声串从候选词串集合中删除。
[0038] 步骤103 :进一步提取后台媒体资源库每个媒体资源的特征词。
[0039] 本步骤通过提取后台媒体资源库每个媒体资源的特征词,将每个媒体资源用至少 一个特征词表示。提取媒体资源特征词的方法为:
[0040] 计算步骤102中得到的后台媒体资源库每个媒体资源的候选特征词的权值,仍以 候选特征词的TF-IDF值表示权值,将权值小于权值阈值的候选特征词删除,将权值不小于 权值阈值的候选特征词进一步通过停用表进行过滤,最终保留下来的媒体资源的候选特征 词作为该媒体资源的特征词。
[0041] 将后台媒体资源库所有媒体资源的特征词定义为后台媒体资源库的特征词,后台 媒体资源库的特征词向量表示为C= [C1,…,h,,…,cM],其中,h为后台媒体资源库的第 j个特征词,M为后台媒体资源库的特征词数量,后台媒体资源库的特征词包含了每个媒体 资源的特征词,且后台媒体资源库的任意两个特征词不相同。
[0042] 设定MXN的特征词权值矩阵T,该矩阵的行数M表示后台媒体资源库的特征词Cj的数量,列数N表示后台媒体资源库的媒体资源Di的数量,特征词权值矩阵T的元素^表 示特征词h在媒体资源Di中的权值,当特征词是媒体资源Di的特征词时,为特征词 Cj在媒体资源Di中的TF-IDF值;当特征词Cj不是媒体资源Di的特征词时,tji = 0。
[0043] 步骤104 :将特征词权值矩阵T进行奇异值分解。
[0044] 为了挖掘后台媒体资源库各个特征词之间的语义关系,将特征词权值矩阵T进行 奇异值分解,奇异值分解后得到包含语义关系的三个矩阵S、V、UT,且T = SVUT。其中,Ut为 特征词权值矩阵T经过奇异值分解降维后的特征词权值矩阵,奇异值分解能够实现主题抽 取,相同主题的词的权重会在一定范围内较一致,由此奇异值分解可以发现特征词权值矩 阵T中特征词与特征词之间隐含的语义关系。
[0045] 步骤105 :判断用户观看的当前媒体资源是否为后台媒体资源库的媒体资源,如 果不是,执行步骤106,如果是,执行步骤107。
[0046] 步骤106 :计算当前媒体资源的权值向量。
[0047] 本步骤中,首先获取用户观看的当前媒体资源的文本信息,获取方法与步骤101 中获取后台媒体资源库每个媒体资源文本信息的方法相同,在此不再赘述。获取当前媒体 资源的文本信息后,提取当前媒体资源的候选特征词(提取方法与步骤102中获取后台媒 体资源库的候选特征词的方法相同),之后,将当前媒体资源的候选特征词与特征词向量C 进行匹配,如果当前媒体资源的某个候选特征词不是特征词向量C的元素,则将当前媒体 资源的该候选特征词删除,保留下来的候选特征词进一步进行权值计算,仍以TF-IDF值表 示权值,将权值小于权值阈值的候选特征词删除,将权值不小于权值阈值的候选特征词进 一步通过停用表进行过滤,最终保留下来的候选特征词作为当前媒体资源的特征词。
[0048] 构建当前媒体资源的权值向量Y,Y为MXl矩阵,矩阵元素 yj(l彡j彡M)为特征 词Cj在当前媒体资源中的权值,当特征词Cj是当前媒体资源的特征词时,yj为特征词C j在 当前媒体资源中的TF-IDF值;当特征词Cj不是当前媒体资源的特征词时,yj = 0。
[0049] 将矩阵Y进行如下变换:Yl = YtSV'其中Yt为Y的转置矩阵,W1为V的逆矩阵。
[0050] 步骤107 :采用聚类的方法生成媒体资源推荐列表。
[0051] 为了使得媒体推荐列表更加准确的捕捉用户的兴趣,本发明采用聚类的方法生成 媒体资源推荐列表,满足用户对多样性和相关性的要求。
[0052] 本步骤中,将当前媒体资源的特征词定义为特定特征词,将后台媒体资源库中在 所有特定特征词上权值均不为〇的媒体资源构成后台媒体资源集合#D)。
[0053] 采用K-means算法对后台媒体资源集合炉(D)进行聚类,其中K-means 算法中的K取特定特征词的个数,将后台媒体资源集合MD)划分为K个类 仏.》_..(〇>|,外-% (D)i,…,外 _WA(D)A-,
[0054] 遍历Ibmms(D)i中每个后台媒体资源与当前媒体资源的聚类相似度, 中后台媒体资源与当前媒体资源D'之间的聚类相似度通过如下公式进行计算:
[0055]

【权利要求】
1. 一种电视平台上基于语义链接的资源推荐方法,其特征在于,该方法包括: 提取后台媒体资源库所有媒体资源的文本信息; 根据每个媒体资源的文本信息提取该媒体资源的候选特征词,计算所述候选特征词的 权值,根据所述权值对所述候选特征词进行过滤得到特征词,生成后台媒体资源库的特征 词权值矩阵T; 如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源,则采用聚类的方 法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源 的聚类相似度,选取聚类相似度最高的L个媒体资源生成媒体资源推荐列表,所述L为大于 0的整数。
2. 根据权利要求1所述的方法,其特征在于,所述根据每个媒体资源的文本信息提取 该媒体资源的候选特征词,计算所述候选特征词的权值,对所述候选特征词进行过滤得到 特征词,生成后台媒体资源库的特征词权值矩阵T,进一步包括: 针对所述后台媒体资源库的每个媒体资源,利用词法分析工具根据词性的不同,将所 述每个媒体资源的文本信息切分为分词序列; 将每个媒体资源的分词序列和热词词典进行匹配,将热词词典中包含关系的多个分词 按照最长词串进行合并,合并后的分词作为该媒体资源的候选特征词; 计算所述候选特征词的权值,所述权值为所述候选特征词的词频-逆文档频率值,将 权值不小于权值阈值的候选特征词通过停用表进行过滤,过滤通过的候选特征词为该媒体 资源的特征词; 利用后台媒体资源库所有媒体资源的特征词构建后台媒体资源库的特征词,用向量C=[Cl,…,h,…,cM]表示,其中,M为后台媒体资源库的特征词数量,后台媒体资源库的特 征词包含了后台媒体资源库中每个媒体资源的特征词,且任意两个后台媒体资源库的特征 词不相同; 设定MXN的特征词权值矩阵T,该矩阵的行数M表示后台媒体资源库的特征词的数 量,列数N表示后台媒体资源库的媒体资源Di的数量,特征词权值矩阵T的元素^表示特 征词h在媒体资源Di中的权值,当特征词是媒体资源Di的特征词时,为特征词Cj在 媒体资源Di中的TF-IDF值;当特征词Cj不是媒体资源Di的特征词时,tji= 0。
3. 根据权利要求2所述的方法,其特征在于,该方法进一步包括: 将特征词权值矩阵T进行奇异值分解,奇异值分解后得到包含语义关系的三个矩阵S、V、UT,且T=SVUT,其中,UT为特征词权值矩阵T经过奇异值分解降维后的特征词权值矩阵。
4. 根据权利要求1所述的方法,其特征在于,如果用户观看的当前媒体资源不是所述 后台媒体资源库中的媒体资源,所述采用聚类的方法计算所述后台媒体资源库中每个媒体 资源与当前媒体资源的聚类相似度之前,该方法进一步包括: 获取用户观看的当前媒体资源的文本信息,根据所述当前媒体的文本信息提取所述当 前媒体资源的特征词,计算每一特征词的权值,构建当前媒体资源的权值向量Y,Y为MX1 矩阵,矩阵元素h(l<j<M)为特征词在当前媒体资源中的权值,当特征词是当前 媒体资源的特征词时,y」为特征词Cj在当前媒体资源中的TF-IDF值;当特征词Cj不是当 前媒体资源的特征词时,yj= 〇。
5. 根据权利要求3或4所述的方法,其特征在于,该方法进一步包括: 将矩阵Y进行如下变换:Y1 =YTSV_S其中YT为Y的转置矩阵,V_i为V的逆矩阵。
6. 根据权利要求1所述的方法,其特征在于,所述采用聚类的方法利用所述特征词权 值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源的聚类相似度,进一步 包括: 将当前媒体资源的特征词定义为特定特征词,将后台媒体资源库中在所有特定特征词 上权值均不为〇的媒体资源构成后台媒体资源集合巧; 采用K-means算法对后台媒体资源集合f?(D)进行聚类,其中K-means算 法中的K取特定特征词的个数,将后台媒体资源集合#(D)划分为K个类
遍历& ?_(D),中每个后台媒体资源与当前媒体资源的聚类相似度,色_JD),中后 台媒体资源h与当前媒体资源D'之间的聚类相似度通过如下公式进行计算:
其中,后台媒体资源h与当前媒体资源D'之间的相似度Sim(~D')用余弦相似度进 行计算:
其中,ujk为Dj在UT中对应的第j行第k列元素,yk为D'在Y1中对应的第k列元素。
7. 根据权利要求1所述的方法,其特征在于,该方法进一步包括: 针对用户点击媒体资源推荐列表中的媒体资源的点击顺序和点击量,对后台媒体资源 库的特征词权值矩阵T进行权值调整,具体包括: 根据
计算单个用户对媒体资源&的评分,其 中札为媒体资源推荐列表中被用户当前点击观看的媒体资源,rank(&)为用户对媒体资源 札的点击顺序,且1彡rankd)彡L,Score_max为限定单个用户对媒体资源评分的最大值 的常数; 根据
计算媒体资源&当前的总评分,其中P为当前点击媒体资源&的用 户数量; 如果媒体资源&当前的总评分不大于评分阈值
,根据公式f(tp= tjX(l+ScoreO^VU+1))对媒体资源札的每个特征词权值进行调整; 如果媒体资源&当前的总评分大于评分阈值
,将媒体资源&的所有特 征词加入高频特征词集合'#(0中,根据公式f(tj) =tjX(l+ScoredVW+1))对媒体资 源札的每个特征词权值进行调整; 其中,h为媒体资源Ri的第j个特征词的权值,即特征词权值矩阵T中媒体资源札 对应的元素,f(tp为媒体资源&的第j个特征词调整后的权值;a为权值调整参数,且
1中的特征词存在互异性,即不包含重复的特征词; 3为权值调整参数,且,
中包含的特征词数量。
8. -种电视平台上基于语义链接的资源推荐装置,其特征在于,该装置包括: 文本信息提取模块,用于提取后台媒体资源库所有媒体资源的文本信息; 特征词提取模块,根据每个媒体资源的文本信息提取该媒体资源的候选特征词,计算 所述候选特征词的权值,根据所述权值对所述候选特征词进行过滤得到特征词,生成后台 媒体资源库的特征词权值矩阵T; 媒体资源推荐列表生成模块,如果用户观看的当前媒体资源是所述后台媒体资源库中 的媒体资源,则采用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每 个媒体资源与当前媒体资源的聚类相似度,选取聚类相似度最高的L个媒体资源生成媒体 资源推荐列表,所述L为大于0的整数。
9. 根据权利要求8所述的装置,其特征在于,所述特征词提取模块进一步包括: 分词序列子模块,用于针对所述后台媒体资源库的每个媒体资源,利用词法分析工具 根据词性的不同,将所述每个媒体资源的文本信息切分为分词序列; 候选特征词提取子模块,用于将每个媒体资源的分词序列和热词词典进行匹配,将热 词词典中包含关系的多个分词按照最长词串进行合并,合并后的分词作为该媒体资源的候 选特征词; 特征词权值矩阵生成子模块,用于计算所述候选特征词的权值,所述权值为所述候选 特征词的词频-逆文档频率值,将权值不小于权值阈值的候选特征词通过停用表进行过 滤,过滤通过的候选特征词为该媒体资源的特征词; 利用后台媒体资源库所有媒体资源的特征词构建后台媒体资源库的特征词,用向量C=[Cl,…,h,…,cM]表示,其中,M为后台媒体资源库的特征词数量,后台媒体资源库的特 征词包含了后台媒体资源库中每个媒体资源的特征词,且任意两个后台媒体资源库的特征 词不相同; 设定MXN的特征词权值矩阵T,该矩阵的行数M表示后台媒体资源库的特征词q,列 数N表示后台媒体资源库的媒体资源Dy特征词权值矩阵T的元素表示特征词在媒 体资源Di中的权值,当特征词是媒体资源Di的特征词时,^为特征词在媒体资源Di 中的TF-IDF值;当特征词Cj不是媒体资源Di的特征词时,tji= 0。
10. 根据权利要求9所述的装置,其特征在于,所述特征词权值矩阵生成子模块进一步 用于: 将特征词权值矩阵T进行奇异值分解,奇异值分解后得到包含语义关系的三个矩阵S、V、UT,且T=SVUT,其中,UT为特征词权值矩阵T经过奇异值分解降维后的特征词权值矩阵。
11. 根据权利要求8所述的装置,其特征在于,如果用户观看的当前媒体资源不是所述 后台媒体资源库中的媒体资源,该装置还包括: 当前媒体资源特征词权值计算模块,用于获取用户观看的当前媒体资源的文本信息, 根据所述当前媒体的文本信息提取所述当前媒体资源的特征词,计算每一特征词的权值, 构建当前媒体资源的权值向量Y,Y为MX1矩阵,矩阵元素h(l<j<M)为特征词q在当 前媒体资源中的权值,当特征词Cj是当前媒体资源的特征词时,yj为特征词Cj在当前媒体 资源中的TF-IDF值;当特征词Cj不是当前媒体资源的特征词时,yj= 0。
12. 根据权利要求10或11所述的装置,其特征在于,所述当前媒体资源特征词权值计 算模块还用于: 将矩阵Y进行如下变换:Y1 =YTSV_S其中YT为Y的转置矩阵,V4为V的逆矩阵。
13. 根据权利要求8所述的装置,其特征在于,所述媒体资源推荐列表生成模块进一步 包括: 后台媒体资源集合生成子模块,用于将当前媒体资源的特征词定义为特定特征词,将 后台媒体资源库中在所有特定特征词上权值均不为〇的媒体资源构成后台媒体资源集合 ,(D); 相似度计算子模块,用于采用K-means算法对后台媒体资源集合舛D)进行聚类,其 中K-means算法中的K取特定特征词的个数,将后台媒体资源集合臀(D)划分为K个类
遍历P),中每个后台媒体资源与当前媒体资源的聚类相似度,外中后 台媒体资源h与当前媒体资源D'之间的聚类相似度通过如下公式进行计算:
其中,后台媒体资源h与当前媒体资源D'之间的相似度Sim(~D')用余弦相似度进 行计算:
其中,ujk为Dj在UT中对应的第j行第k列元素,yk为D'在Y1中对应的第k列元素。
14. 根据权利要求8所述的装置,其特征在于,该装置进一步包括权值学习模块,用于 针对用户点击媒体资源推荐列表中的媒体资源的点击顺序和点击量,对后台媒体资源库的 特征词权值矩阵T进行权值调整,所述权值学习模块还包括: 媒体资源评分计算模块,用于根据
计算单个 用户对媒体资源&的评分,其中&为媒体资源推荐列表中被用户当前点击观看的媒体资 源,rankd)为用户对媒体资源的点击顺序,且1 <rankd) <L,Score_max为限定单 个用户对媒体资源评分的最大值得常数; 媒体资源总评分计算模块,用于根据
计算媒体资源&当前的总评分,其中 P为当前点击媒体资源&的用户数量; 权值调整模块,用于如果媒体资源Ri当前的总评分不大于评分阈值
根据公式f(tp=(l+ScoreO^VU+l))对媒体资源札的每个特征词权值进行调整; 如果媒体资源&当前的总评分大于评分阈值
,将媒体资源&的所有特 征词加入高频特征词集合识W中,根据公式f(tj) =tjX(1+Score(Ri) / (P+1))对媒体资 源札的每个特征词权值进行调整; 其中,\为媒体资源&的第j个特征词的权值,即特征词权值矩阵T中媒体资源札 对应的元素,f(tp为媒体资源&的第j个特征词调整后的权值;a为权值调整参数,且
中的特征词存在互异性,即舛t)不包含重复的特征词;3为权值调整参数,且,
,X为舛I)中包含的特征词数量。
【文档编号】G06F17/30GK104408115SQ201410687895
【公开日】2015年3月11日 申请日期:2014年11月25日 优先权日:2014年11月25日
【发明者】郑玄, 陈洁 申请人:三星电子(中国)研发中心, 三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1