本发明涉及信息技术领域,尤其涉及一种确定多媒体资源的标题的方法及装置。
背景技术:
在互联网时代,尤其是移动互联网时代,如何为用户提供及时且有价值的信息是众多互联网公司研究的热点。例如,用户在浏览视频网站时,视频标题是吸引用户观看视频的一个重要因素,因此,视频网站往往有大量的运营人员对视频标题进行编辑。视频上传者也可以对视频标题进行编辑,以达到吸引用户观看的目的。
目前,视频等多媒体资源的标题的编辑依赖于网站的运营人员和上传者,耗费大量的人力资源,且网站的运营人员和上传者所编辑的多媒体资源的标题是针对大众喜好的,不能满足单个用户的个性化需求。
技术实现要素:
技术问题
有鉴于此,本发明要解决的技术问题是,现有的确定多媒体资源的标题的方式耗费大量的人力资源,且不能满足用户的个性化需求。
解决方案
为了解决上述技术问题,根据本发明的一实施例,提供了一种确定多媒体资源的标题的方法,包括:
采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;
对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;
对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;
将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;
根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
对于上述方法,在一种可能的实现方式中,将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,包括:
计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;
在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;
根据所有替换的成分得到更新后的第二成分列表。
对于上述方法,在一种可能的实现方式中,计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度,包括:
确定所述第二成分列表中的各个成分对应的向量;
分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。
对于上述方法,在一种可能的实现方式中,分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度,包括:
采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度
对于上述方法,在一种可能的实现方式中,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题,包括:
计算所述更新后的第二成分列表的得分;
在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
对于上述方法,在一种可能的实现方式中,计算所述更新后的第二成分列表的得分,包括:
根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。
对于上述方法,在一种可能的实现方式中,根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分,包括:
采用式2计算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出现的概率,p(wj-i)表示所述第j-i个成分在所述指定样本集合中出现的概率。
对于上述方法,在一种可能的实现方式中,在计算所述更新后的第二成分列表的得分之后,所述方法还包括:
在所述更新后的第二成分列表的得分小于或等于所述第二预设值的情况下,保留所述待推荐多媒体资源的原标题。
对于上述方法,在一种可能的实现方式中,对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表,包括:
对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与所述目标用户相关的成分;
将与所述目标用户相关的成分中出现次数大于第三预设值的成分作为所述目标用户对应的成分;
根据所述目标用户对应的成分生成所述目标用户对应的第一成分列表。
对于上述方法,在一种可能的实现方式中,采集目标用户的用户行为数据,根据所述用户行为数据生成第一多媒体资源列表,包括:
采集指定时间段内的所述目标用户的所有用户行为数据;
从所采集的用户行为数据中筛选出有效的用户行为数据;
按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一多媒体资源列表。
为了解决上述技术问题,根据本发明的另一实施例,提供了一种确定多媒体资源的标题的装置,包括:
采集模块,用于采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;
第一解析模块,用于对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;
第二解析模块,用于对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;
比较模块,用于将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;
确定模块,用于根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
对于上述装置,在一种可能的实现方式中,所述比较模块包括:
相似度计算子模块,用于计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;
替换子模块,用于在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;
更新子模块,用于根据所有替换的成分得到更新后的第二成分列表。
对于上述装置,在一种可能的实现方式中,所述相似度计算子模块包括:
向量确定单元,用于确定所述第二成分列表中的各个成分对应的向量;
相似度计算单元,用于分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。
对于上述装置,在一种可能的实现方式中,所述相似度计算单元用于:
采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度
对于上述装置,在一种可能的实现方式中,所述确定模块包括:
得分计算子模块,用于计算所述更新后的第二成分列表的得分;
确定子模块,用于在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
对于上述装置,在一种可能的实现方式中,所述得分计算子模块用于:
根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。
对于上述装置,在一种可能的实现方式中,所述得分计算子模块用于:
采用式2计算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出现的概率,p(wj-i)表示所述第j-i个成分在所述指定样本集合中出现的概率。
对于上述装置,在一种可能的实现方式中,所述装置还包括:
保留模块,用于在所述更新后的第二成分列表的得分小于或等于所述第二预设值的情况下,保留所述待推荐多媒体资源的原标题。
对于上述装置,在一种可能的实现方式中,所述第一解析模块包括:
解析子模块,用于对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与所述目标用户相关的成分;
成分确定子模块,用于将与所述目标用户相关的成分中出现次数大于第三预设值的成分作为所述目标用户对应的成分;
第一成分列表生成子模块,用于根据所述目标用户对应的成分生成所述目标用户对应的第一成分列表。
对于上述装置,在一种可能的实现方式中,所述采集模块包括:
采集子模块,用于采集指定时间段内的所述目标用户的所有用户行为数据;
筛选子模块,用于从所采集的用户行为数据中筛选出有效的用户行为数据;
排序子模块,用于按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一多媒体资源列表。
有益效果
通过将待推荐多媒体资源的原标题对应的第二成分列表中的各个成分与目标用户对应的第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,从而确定待推荐多媒体资源的新标题,根据本发明实施例的确定多媒体资源的标题的方法及装置能够针对目标用户确定个性化的标题,能够更好地吸引用户,从而能够提高所推荐的多媒体资源被点击的概率。
根据下面参考附图对示例性实施例的详细说明,本发明的其它特征及方面将变得清楚。
附图说明
包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本发明的示例性实施例、特征和方面,并且用于解释本发明的原理。
图1示出根据本发明一实施例的确定多媒体资源的标题的方法的实现流程图;
图2示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S104的一示例性的实现流程图;
图3示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S301的一示例性的实现流程图;
图4示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S105的一示例性的实现流程图;
图5示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S102的一示例性的实现流程图;
图6示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S101的一示例性的实现流程图;
图7示出根据本发明另一实施例的确定多媒体资源的标题的装置的结构框图;
图8示出根据本发明另一实施例的确定多媒体资源的标题的装置的结构框图的一示例性的实现流程图;
图9示出了本发明的另一个实施例的一种确定多媒体资源的标题的设备的结构框图。
具体实施方式
以下将参考附图详细说明本发明的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。
在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。
另外,为了更好的说明本发明,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本发明同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本发明的主旨。
实施例1
图1示出根据本发明一实施例的确定多媒体资源的标题的方法的实现流程图。该实施例的执行主体可以为服务器,也可以为其他确定多媒体资源的标题的装置,在此不作限定。如图1所示,该方法主要包括:
在步骤S101中,采集目标用户的用户行为数据,并根据用户行为数据生成第一多媒体资源列表。
其中,多媒体可以是多种媒体的综合,例如可以包括文字、声音和图像等多种媒体形式。例如,多媒体资源可以为视频,在此不作限定。目标用户的用户行为数据可以包括但不限于以下至少一项:目标用户观看多媒体资源的数据、目标用户评论多媒体资源的数据、目标用户订阅多媒体资源的数据和目标用户顶踩多媒体资源的数据。在本实施例中,可以根据目标用户的用户行为数据对应的多媒体资源生成第一多媒体资源列表。例如,目标用户对应的第一多媒体资源列表可以表示为LU={v1,v2,…,vn}。
在步骤S102中,对第一多媒体资源列表中各个多媒体资源的标题进行解析,得到目标用户对应的第一成分列表。
作为本实施例的一个示例,可以采用NER(Named Entity Recognition,命名实体识别)技术对第一多媒体资源列表中各个多媒体资源的标题进行解析,以得到目标用户对应的第一成分列表。
在步骤S103中,对待推荐多媒体资源的原标题进行解析,得到原标题对应的第二成分列表。
作为本实施例的一个示例,可以分别对待推荐多媒体资源列表中的各个待推荐多媒体资源的原标题进行解析,得到各个原标题对应的第二成分列表。例如,可以采用NER技术对待推荐多媒体资源的原标题进行解析,得到原标题对应的第二成分列表。
在步骤S104中,将第二成分列表中的各个成分与第一成分列表中的各个成分进行比较,得到更新后的第二成分列表。
作为本实施例的一个示例,可以分别将第二成分列表中的各个成分与第一成分列表中的各个成分进行比较,以采用第一成分列表中的成分替换第二成分列表中的成分。
在步骤S105中,根据更新后的第二成分列表确定待推荐多媒体资源的新标题。
例如,待推荐多媒体资源的原标题为“乌龟啃一只睡觉的小猫咪的脚趾头”,新标题为“乌龟啃一只睡觉的喵星人的脚趾头!”。
本实施例通过将待推荐多媒体资源的原标题对应的第二成分列表中的各个成分与目标用户对应的第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,从而确定待推荐多媒体资源的新标题,能够针对目标用户确定个性化的标题,能够更好地吸引用户,从而能够提高所推荐的多媒体资源被点击的概率;无需人工修改多媒体资源的标题,大大节省了人力成本。
图2示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S104的一示例性的实现流程图。如图2所示,将第二成分列表中的各个成分与第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,包括:
在步骤S201中,计算第二成分列表中的各个成分与第一成分列表中的各个成分的相似度。
例如,可以通过计算成分对应的向量之间的相似度来确定成分之间的相似度。本领域技术人员应理解,也可以通过成分的其他参量来衡量成分之间的相似度,在此不作限定。
在步骤S202中,在第二成分列表中的一成分与第一成分列表中的一成分的相似度大于第一预设值的情况下,将第二成分列表中的一成分替换为第一成分列表中的一成分。
例如,第一预设值可以为0.9。例如,第二成分列表中的一成分为“小猫咪”,第一成分列表中的一成分为“喵星人”,“小猫咪”与“喵星人”的相似度为0.95,则可以将第二成分列表中的“小猫咪”替换为第一成分列表中的“喵星人”。
在本示例中,在第二成分列表中的一成分与第一成分列表中的一成分的相似度大于第一预设值的情况下,才将第二成分列表中的一成分替换为第一成分列表中的一成分,由此能够保证语义的一致性。
在步骤S203中,根据所有替换的成分得到更新后的第二成分列表。
图3示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S201的一示例性的实现流程图。如图3所示,计算第二成分列表中的各个成分与第一成分列表中的各个成分的相似度,包括:
在步骤S301中,确定第二成分列表中的各个成分对应的向量。
作为本实施例的一个示例,可以采用word2vec确定第二成分列表中的各个成分对应的向量以及第一成分列表中的各个成分对应的向量。
在步骤S302中,分别计算第二成分列表中的各个成分对应的向量与第一成分列表中的各个成分对应的向量的相似度。
例如,可以将两个成分对应的向量之间的余弦距离确定为两个成分的相似度。
在一种可能的实现方式中,分别计算第二成分列表中的各个成分对应的向量与第一成分列表中的各个成分对应的向量的相似度,包括:采用式1计算第二成分列表中的第l个成分对应的向量与第一成分列表中的第m个成分对应的向量的相似度
图4示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S105的一示例性的实现流程图。如图4所示,根据更新后的第二成分列表确定待推荐多媒体资源的新标题,包括:
在步骤S401中,计算更新后的第二成分列表的得分。
在步骤S402中,在更新后的第二成分列表的得分大于第二预设值的情况下,根据更新后的第二成分列表确定待推荐多媒体资源的新标题。
在该示例中,在更新后的第二成分列表的得分大于第二预设值的情况下,根据更新后的第二成分列表确定待推荐多媒体资源的新标题,以保证新标题的前后成分之间的语言关联性。其中,第二预设值可以依据本领域技术人员的经验设定,在此不作限定。
在一种可能的实现方式中,在计算更新后的第二成分列表的得分之后,该方法还包括:在更新后的第二成分列表的得分小于或等于第二预设值的情况下,保留待推荐多媒体资源的原标题。在该实现方式中,在更新后的第二成分列表的得分小于或等于第二预设值的情况下,保留待推荐多媒体资源的原标题,以保证标题的前后成分之间的语言关联性。
在一种可能的实现方式中,计算更新后的第二成分列表的得分,包括:根据更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算更新后的第二成分列表的得分。
例如,可以根据待推荐的多媒体资源列表中所有多媒体资源的标题确定指定样本集合,或者可以根据其他指定的多媒体资源列表中所有多媒体资源的标题确定指定样本集合,在此不作限定。
在一种可能的实现方式中,根据更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算更新后的第二成分列表的得分,包括:
采用式2计算更新后的第二成分列表的得分s;
其中,n表示更新后的第二成分列表中成分的个数,wj表示更新后的第二成分列表中的第j个成分,wj-i表示更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示第j个成分与第j-i个成分在指定样本集合中共同出现的概率,p(wj-i)表示第j-i个成分在指定样本集合中出现的概率。
图5示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S102的一示例性的实现流程图。如图5所示,对第一多媒体资源列表中各个多媒体资源的标题进行解析,得到目标用户对应的第一成分列表,包括:
在步骤S501中,对第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与目标用户相关的成分。
作为本实施例的一个示例,可以采用NER技术分别对第一多媒体资源列表中各个多媒体资源的标题进行解析,得到各个多媒体资源的标题对应的成分。其中,成分可以包括实体词(例如“狗”“火星情报局”)、情绪词(例如“好看”“笑死人不偿命”)和情绪标点(例如“!”)中的一项或多项。其中,实体词可以包括人名、地名、机构名和专有名词中的一项或多项。
在步骤S502中,将与目标用户相关的成分中出现次数大于第三预设值的成分作为目标用户对应的成分。
例如,第三预设值可以为2。在该示例中,通过设置第三预设值,将与目标用户相关的成分中出现次数大于第三预设值的成分作为目标用户对应的成分,并过滤与目标用户相关的成分中出现次数小于或等于第三预设值的成分,由此能够降低噪声对目标用户对应的成分的影响。
在步骤S503中,根据目标用户对应的成分生成目标用户对应的第一成分列表。
例如,目标用户对应的第一成分列表可以表示为{NE1,NE2,…,NEn},其中,NE1,NE2,…,NEn表示目标用户对应的各个成分。
图6示出根据本发明一实施例的确定多媒体资源的标题的方法步骤S101的一示例性的实现流程图。如图6所示,采集目标用户的用户行为数据,根据用户行为数据生成第一多媒体资源列表,包括:
在步骤S601中,采集指定时间段内的目标用户的所有用户行为数据。
例如,可以采集1个月、3个月或者半年内的目标用户的所有用户行为数据。
在步骤S602中,从所采集的用户行为数据中筛选出有效的用户行为数据。
例如,可以将重复观看多媒体资源的用户行为数据确定为无效的用户行为数据,也可以将观看多媒体资源的完成比例很小的用户行为数据确定为无效的用户行为数据,在此不作限定。
在步骤S603中,按照有效的用户行为数据对应的时间对有效的用户行为数据进行排序,得到第一多媒体资源列表。
其中,有效的用户行为数据对应的时间可以为该有效的用户行为数据的发生时间。按照有效的用户行为数据对应的时间对有效的用户行为数据进行排序可以为:按照有效的用户行为数据由近到远的时间顺序对有效的用户行为数据进行排序。
在一种可能的实现方式中,可以对待推荐多媒体资源列表进行筛选,以使待推荐多媒体资源具备多样性:待推荐多媒体资源的上传者信息、待推荐多媒体资源所属的频道信息、目标用户观看多媒体资源的数据和目标用户的兴趣标签。例如,若待推荐多媒体资源列表中包括四个以上同一上传者上传的多媒体资源,则可以保留该上传者上传的多媒体资源中点击量排名前三的多媒体资源作为待推荐多媒体资源。再例如,若待推荐多媒体资源列表中包括四个以上同一二级频道的多媒体资源,则可以保留该二级频道的多媒体资源中点击量排名前三的多媒体资源作为待推荐多媒体资源。例如,综艺频道为某一一级频道,湖南综艺频道为该一级频道下的二级频道。再例如,若待推荐多媒体资源列表中包括四个以上同一三级兴趣标签下的多媒体资源,则可以保留该三级兴趣标签下的多媒体资源中点击量排名前三的多媒体资源作为待推荐多媒体资源。例如,一级兴趣标签为娱乐,娱乐明星为该一级兴趣标签下的二级兴趣标签,Beyond为该二级兴趣标签下的三级兴趣标签。再例如,若待推荐多媒体资源列表中包括目标用户近期观看过的多媒体资源,则不将该多媒体资源作为待推荐多媒体资源。
这样,通过将待推荐多媒体资源的原标题对应的第二成分列表中的各个成分与目标用户对应的第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,从而确定待推荐多媒体资源的新标题,根据本发明实施例的确定多媒体资源的标题的方法能够针对目标用户确定个性化的标题,能够更好地吸引用户,从而能够提高所推荐的多媒体资源被点击的概率。
实施例2
图7示出根据本发明另一实施例的确定多媒体资源的标题的装置的结构框图。图7所示的装置可以用于运行图1至图6所示的确定多媒体资源的标题的方法。为了便于说明,在图7中仅示出了与本实施例相关的部分。
如图7所示,该装置包括:采集模块71,用于采集目标用户的用户行为数据,并根据所述用户行为数据生成第一多媒体资源列表;第一解析模块72,用于对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到所述目标用户对应的第一成分列表;第二解析模块73,用于对待推荐多媒体资源的原标题进行解析,得到所述原标题对应的第二成分列表;比较模块74,用于将所述第二成分列表中的各个成分与所述第一成分列表中的各个成分进行比较,得到更新后的第二成分列表;确定模块75,用于根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
图8示出根据本发明另一实施例的确定多媒体资源的标题的装置的结构框图的一示例性的实现流程图。图8所示的装置可以用于运行图1至图6所示的确定多媒体资源的标题的方法。为了便于说明,在图8中仅示出了与本实施例相关的部分。图8中标号与图7相同的组件具有相同的功能,为简明起见,省略对这些组件的详细说明。
在一种可能的实现方式中,所述比较模块74包括:相似度计算子模块741,用于计算所述第二成分列表中的各个成分与所述第一成分列表中的各个成分的相似度;替换子模块742,用于在所述第二成分列表中的一成分与所述第一成分列表中的一成分的相似度大于第一预设值的情况下,将所述第二成分列表中的一成分替换为所述第一成分列表中的一成分;更新子模块743,用于根据所有替换的成分得到更新后的第二成分列表。
在一种可能的实现方式中,所述相似度计算子模块741包括:向量确定单元,用于确定所述第二成分列表中的各个成分对应的向量;相似度计算单元,用于分别计算所述第二成分列表中的各个成分对应的向量与所述第一成分列表中的各个成分对应的向量的相似度。
在一种可能的实现方式中,所述相似度计算单元用于:采用式1计算所述第二成分列表中的第l个成分对应的向量与所述第一成分列表中的第m个成分对应的向量的相似度
在一种可能的实现方式中,所述确定模块75包括:得分计算子模块751,用于计算所述更新后的第二成分列表的得分;确定子模块752,用于在所述更新后的第二成分列表的得分大于第二预设值的情况下,根据所述更新后的第二成分列表确定所述待推荐多媒体资源的新标题。
在一种可能的实现方式中,所述得分计算子模块751用于:根据所述更新后的第二成分列表中的各个成分在指定样本集合中出现的概率计算所述更新后的第二成分列表的得分。
在一种可能的实现方式中,所述得分计算子模块751用于:采用式2计算所述更新后的第二成分列表的得分s;
其中,n表示所述更新后的第二成分列表中成分的个数,wj表示所述更新后的第二成分列表中的第j个成分,wj-i表示所述更新后的第二成分列表中的第j-i个成分,p(wjwj-i)表示所述第j个成分与所述第j-i个成分在所述指定样本集合中共同出现的概率,p(wj-i)表示所述第j-i个成分在所述指定样本集合中出现的概率。
在一种可能的实现方式中,所述装置还包括:保留模块76,用于在所述更新后的第二成分列表的得分小于或等于所述第二预设值的情况下,保留所述待推荐多媒体资源的原标题。
在一种可能的实现方式中,所述第一解析模块72包括:解析子模块721,用于对所述第一多媒体资源列表中各个多媒体资源的标题进行解析,得到与所述目标用户相关的成分;成分确定子模块722,用于将与所述目标用户相关的成分中出现次数大于第三预设值的成分作为所述目标用户对应的成分;第一成分列表生成子模块723,用于根据所述目标用户对应的成分生成所述目标用户对应的第一成分列表。
在一种可能的实现方式中,所述采集模块71包括:采集子模块711,用于采集指定时间段内的所述目标用户的所有用户行为数据;筛选子模块712,用于从所采集的用户行为数据中筛选出有效的用户行为数据;排序子模块713,用于按照所述有效的用户行为数据对应的时间对所述有效的用户行为数据进行排序,得到所述第一多媒体资源列表。
需要说明的是,这样,通过将待推荐多媒体资源的原标题对应的第二成分列表中的各个成分与目标用户对应的第一成分列表中的各个成分进行比较,得到更新后的第二成分列表,从而确定待推荐多媒体资源的新标题,根据本发明实施例的确定多媒体资源的标题的装置能够针对目标用户确定个性化的标题,能够更好地吸引用户,从而能够提高所推荐的多媒体资源被点击的概率。
实施例3
图9示出了本发明的另一个实施例的一种确定多媒体资源的标题的设备的结构框图。所述确定多媒体资源的标题的设备1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对计算节点的具体实现做限定。
所述确定多媒体资源的标题的设备1100包括处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory)1130和总线1140。其中,处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。
通信接口1120用于与网络设备通信,其中网络设备包括例如虚拟机管理中心、共享存储等。
处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU,或者是专用集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器1130用于存放文件。存储器1130可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块,并且所述块可按一定的规则组合成虚拟卷。
在一种可能的实施方式中,上述程序可为包括计算机操作指令的程序代码。该程序具体可用于:实现实施例1中各步骤的操作。
本领域普通技术人员可以意识到,本文所描述的实施例中的各示例性单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件形式来实现,取决于技术方案的特定应用和设计约束条件。专业技术人员可以针对特定的应用选择不同的方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
如果以计算机软件的形式来实现所述功能并作为独立的产品销售或使用时,则在一定程度上可认为本发明的技术方案的全部或部分(例如对现有技术做出贡献的部分)是以计算机软件产品的形式体现的。该计算机软件产品通常存储在计算机可读取的非易失性存储介质中,包括若干指令用以使得计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各实施例方法的全部或部分步骤。而前述的存储介质包括U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。