本技术涉及计算机领域,具体而言,涉及一种特征向量生成方法及装置、信息推荐方法及装置。
背景技术:
1、随着网络技术的发展,各种多媒体资源相关的应用软件应运而生。一般情况下,应用软件均支持多媒体资源的推荐。
2、目前,主要采用模型的方式对多媒体资源进行推荐,即先将用户信息和多媒体资源转化为对应的向量,其中,用户信息可为用对多媒体资源进行分享、评论等信息。然后将向量输入模型中,再基于模型输出的多媒体资源的概率值的大小进行推荐。
3、但是,上述方法中的向量未建立多媒体资源和用户信息的关联,导致推荐的多媒体资源无法满足用户需求的问题。
技术实现思路
1、本技术的主要目的在于提供一种特征向量生成方法及装置、信息推荐方法及装置,以解决相关技术中推荐的多媒体资源无法满足用户需求的问题。
2、为了实现上述目的,第一方面,本技术提供了一种特征向量生成方法,包括:
3、获取目标多媒体资源的有效评论;
4、对有效评论进行分词和关键词选取;
5、计算任一关键词和目标多媒体资源之间的共现得分;
6、计算任一关键词和目标多媒体资源之间的相似度;
7、基于在所有关键词下的所有相似度和所有共现得分,确定目标损失函数;
8、对目标损失函数迭代训练,达到收敛条件,则获得任一关键词的第一特征向量和目标多媒体资源的第二特征向量。
9、在一种可能的实现方式中,计算任一关键词和目标多媒体资源之间的共现得分,包括:
10、统计任一关键词和目标多媒体资源的共现次数;
11、基于共现次数,计算任一关键词和目标多媒体资源之间的共现得分。
12、在一种可能的实现方式中,计算任一关键词和目标多媒体资源之间的相似度,包括:
13、基于任一关键词的初始化的第一特征向量和目标多媒体资源的初始化的第二特征向量,计算第一特征向量和第二特征向量之间的相似度。
14、在一种可能的实现方式中,统计任一关键词和目标多媒体资源的共现次数,包括:
15、分别计算目标多媒体资源、任一关键词的共现概率,得到目标多媒体资源对应的第一共现概率和任一关键词对应的第二共现概率;
16、将第一共现概率和第二共现概率输入预设的pmi算法中,得到目标多媒体资源与任一关键词的共现次次数。
17、在一种可能的实现方式中,基于共现次数,计算任一关键词和目标多媒体资源之间的共现得分,包括:
18、将共现次数与零作比较,取共现次数与零中最大的值作为任一关键词和目标多媒体资源之间的共现得分。
19、在一种可能的实现方式中,基于任一关键词的初始化的第一特征向量和目标多媒体资源的初始化的第二特征向量,计算第一特征向量和第二特征向量之间的相似度,包括:
20、计算第一特征向量和第二特征向量的余弦距离;
21、利用余弦距离和共现得分进行拟合,得到第一特征向量和第二特征向量之间的相似度。
22、在一种可能的实现方式中,对有效评论进行分词和关键词选取,包括:
23、基于样本库中的词对有效评论进行分词处理,得到分词后的有效评论;
24、从分词后的有效评论中筛选出满足预设条件的词作为目标关键词。
25、在一种可能的实现方式中,获取目标多媒体资源的有效评论之前,还包括:
26、对目标多媒体资源的评论进行归一化、筛选处理,得到有效评论。
27、第二方面,本发明实施例提供了一种信息推荐方法,包括:
28、接收搜索信息;
29、对搜索信息进行本文处理,得到至少一个关键词;
30、计算所有关键词和任一待推荐多媒体资源之间的共现得分总和;
31、计算搜索信息和任一待推荐多媒体资源之间的相似度;
32、基于对相似度和共现得分总和加权求和结果,对任一待推荐多媒体资源进行召回推荐。
33、在一种可能的实现方式中,计算所有关键词和任一待推荐多媒体资源之间的共现得分总和,包括:
34、计算任一待推荐多媒体资源与所有关键词中的任一关键词的共现得分;
35、将所有关键词的共现得分进行和计算,得到所有关键词和任一待推荐多媒体资源之间的共现得分总和。
36、在一种可能的实现方式中,计算任一待推荐多媒体资源与所有关键词中的任一关键词的共现得分,包括:
37、统计任一待推荐多媒体资源和任一关键词的共现次数;
38、基于共现次数,计算任一待推荐多媒体资源和任一关键词之间的共现得分。
39、在一种可能的实现方式中,计算搜索信息和任一待推荐多媒体资源之间的相似度,包括:
40、获取拼接所有关键词的第一特征向量后的拼接向量;
41、计算拼接向量和任一待推荐多媒体资源的第二特征向量之间的相似度。
42、在一种可能的实现方式中,对任一待推荐多媒体资源进行召回推荐,包括:
43、将加权求和结果进行排序,选取预设数量的准推荐多媒体资源;
44、将准推荐多媒体资源的特征向量和当前用户特征向量输入精排模型后,输出匹配分;
45、根据匹配分,从准推荐多媒体资源中输出最终推荐的多媒体资源。
46、第三方面,本发明实施例提供了一种特征向量生成装置,包括:
47、获取模块,用于获取目标多媒体资源的有效评论;
48、筛选模块,用于对有效评论进行分词和关键词选取;
49、第一计算模块,用于计算任一关键词和目标多媒体资源之间的共现得分;
50、第二计算模块,用于计算任一关键词和目标多媒体资源之间的相似度;
51、函数确定模块,用于基于在所有关键词下的所有相似度和所有共现得分,确定目标损失函数;
52、特征向量生成模块,用于对目标损失函数迭代训练,达到收敛条件,则获得任一关键词的第一特征向量和目标多媒体资源的第二特征向量。
53、第四方面,本发明实施例提供了一种信息推荐装置,包括:
54、接收模块,用于接收搜索信息;
55、处理模块,用于用于对搜索信息进行本文处理,得到至少一个关键词;
56、第一计算模块,用于计算所有关键词和任一待推荐多媒体资源之间的共现得分总和;
57、第二计算模块,用于计算搜索信息和任一待推荐多媒体资源之间的相似度;
58、信息推荐模块,用于基于对相似度和共现得分总和加权求和结果,对任一待推荐多媒体资源进行召回推荐。
59、第五方面,本发明实施例提供了一种终端,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上任一种特征向量生成方法或信息推荐方法的步骤。
60、第六方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现如上任一种特征向量生成方法或信息推荐方法的步骤。
61、本发明实施例提供了一种特征向量生成方法及装置、信息推荐方法及装置,包括:获取目标多媒体资源的有效评论,对有效评论进行分词和关键词选取,然后计算任一关键词和目标多媒体资源之间的共现得分,以及计算任一关键词和目标多媒体资源之间的相似度,再基于在所有关键词下的所有相似度和所有共现得分,确定目标损失函数,最后对目标损失函数迭代训练,达到收敛条件,则获得任一关键词的第一特征向量和目标多媒体资源的第二特征向量。本发明通过计算的有效评论中的关键词与目标多媒体资源的共现得分和相似度设计目标损失函数,以获得具有强关联的第一特征向量和第二特征向量,使有效评论中的关键词与目标多媒体资源形成强关联,从而提高信息推荐的准确性和有效性。此外,本发明中的有效评论为开放文本,可随时进行添加、更新,以满足用户的多样化需求。