一种查找产品的方法、终端和计算机可读存储介质与流程

文档序号:17358811发布日期:2019-04-09 21:55阅读:186来源:国知局
一种查找产品的方法、终端和计算机可读存储介质与流程

本发明涉及但不限于计算机领域中的查找产品的技术,尤其涉及一种查找产品的方法、终端和计算机可读存储介质。



背景技术:

目前随着信息技术和互联网技术的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。电子设备的用户规模在不断增加,基于电子设备展示的产品如多媒体信息的传播越来越广泛,如何精准推荐用户感兴趣的产品,提升用户的体验,已成为亟待解决的问题。



技术实现要素:

有鉴于此,本发明实施例期望提供一种查找产品的方法、终端和计算机可读存储介质,解决了相关技术中无法精准推荐用户感兴趣的产品的问题,实现精准推荐用户感兴趣的产品,提升了用户体验。

为达到上述目的,本发明的技术方案是这样实现的:

一种查找产品的方法,所述方法包括:

获取第一产品的第一标签和第一产品的描述信息;

基于所述第一产品的描述信息,生成所述第一产品的第二标签;其中,所述第一产品的描述信息不包含所述第二标签;

获取至少两个第二产品的至少两个第三标签;

基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,并确定所述第三产品属于待推荐产品;其中,所述至少两个第二产品与所述第一产品不同。

可选的,所述基于所述第一产品的描述信息,生成所述第一产品的第二标签,包括:

从所述第一产品的描述信息中提取第一关键词;

生成与所述第一关键词具有关联关系的第二关键词,并确定所述第二关键词为所述第二标签。

可选的,所述基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,并确定所述第三产品属于待推荐产品之前,所述方法还包括:

分析所述第一产品的描述信息,得到分析结果;

若所述分析结果表征所述第一产品的描述信息包含标识符,从所述第一产品的描述信息中提取与所述标识符关联的第三关键词,并确定所述第三关键词为第四标签;或者,

若所述分析结果表征所述第一产品的描述信息包含标识符,从所述第一产品的描述信息中提取所述第三关键词以及除了所述第三关键词以外的第四关键词,并确定所述第三关键词和所述第四关键词为所述第四标签;或者,

若所述分析结果表征所述第一产品的描述信息不包含标识符,从所述第一产品的描述信息中提取所述第四关键词,并确定所述第四关键词为所述第四标签;

相应的,所述基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,包括:

基于所述第一标签、所述第二标签、所述至少两个第三标签和所述第四标签,从所述至少两个第二产品中查找第三产品。

可选的,所述基于所述第一标签、所述第二标签、所述至少两个第三标签和所述第四标签,从所述至少两个第二产品中查找第三产品,包括:

基于所述第一标签、所述第二标签和所述第四标签,生成所述第一产品的标签权重;

基于所述至少两个第三标签,生成所述至少两个第二产品的标签权重;

基于所述第一产品的标签权重和所述至少两个第二产品的标签权重,从所述至少两个第二产品中查找第三产品。

可选的,所述基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,包括:

基于所述第一标签和所述第二标签,生成所述第一产品的标签权重;

基于所述至少两个第三标签,生成所述至少两个第二产品的标签权重;

基于所述第一产品的标签权重和所述至少两个第二产品的标签权重,从所述至少两个第二产品中查找第三产品。

可选的,所述基于所述第一产品的标签权重和所述至少两个第二产品的标签权重,从所述至少两个第二产品中查找第三产品,包括:

确定所述第一产品的标签权重为第一产品的向量的第一坐标;

确定所述至少两个第二产品的标签权重为所述至少两个第二产品的向量的至少两个第二坐标;

基于所述第一坐标和所述至少两个第二坐标之间的关系,从所述至少两个第二产品中查找所述第三产品。

可选的,所述基于所述第一坐标和所述至少两个第二坐标之间的关系,从所述至少两个第二产品中查找所述第三产品,包括:

基于所述第一坐标和所述至少两个第二坐标,计算所述第一产品的向量和所述至少两个第二产品的向量的至少两个点积;

从所述至少两个第二产品中确定点积的值大于预设阈值的第二产品为所述第三产品。

可选的,所述方法还包括:

获取服务器发送的第四产品;

相应的,所述确定所述第三产品属于待推荐产品之后,所述方法还包括:

获取所述第三产品的第一优先级和所述第四产品的第二优先级;

基于所述第一优先级和所述第二优先级,对所述第三产品和所述第四产品进行排序,生成产品推荐列表。

一种终端,所述终端包括:处理器、存储器和通信总线;

所述通信总线用于实现处理器和存储器之间的通信连接;

所述处理器用于执行存储器中存储的查找产品的程序,以实现以下步骤:

获取第一产品的第一标签和第一产品的描述信息;

基于所述第一产品的描述信息,生成所述第一产品的第二标签;其中,所述第一产品的描述信息不包含所述第二标签;

获取至少两个第二产品的至少两个第三标签;

基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,并确定所述第三产品属于待推荐产品;其中,所述至少两个第二产品与所述第一产品不同。

一种查找产品的装置,所述装置包括:

第一获取单元,用于获取第一产品的第一标签和第一产品的描述信息;

生成单元,用于基于所述第一产品的描述信息,生成所述第一产品的第二标签;其中,所述第一产品的描述信息不包含所述第二标签;

第二获取单元,还用于获取至少两个第二产品的至少两个第三标签;

第一处理单元,用于基于所述第一标签、所述第二标签和所述至少两个第三标签,从所述至少两个第二产品中查找第三产品,并确定所述第三产品属于待推荐产品;其中,所述至少两个第二产品与所述第一产品不同。

一种计算机可读存储介质,述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上述查找产品的方法的步骤。

本发明的实施例所提供的查找产品的方法、终端和计算机可读存储介质,获取第一产品的第一标签和第一产品的描述信息;基于第一产品的描述信息,生成第一产品的第二标签;其中,第一产品的描述信息不包含第二标签;获取至少两个第二产品的至少两个第三标签;基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品;其中,至少两个第二产品与第一产品不同;也就是说,本发明实施例中在进行产品推荐时可以基于第一产品的描述信息对第一产品的标签进行扩展,并得到描述信息中不包含但与描述信息关联的信息作为扩展标签,然后基于第一产品的自带标签和扩展标签从多个第二产品中精确地查找到与第一产品的相似度较高的产品作为待推荐产品;解决了相关技术中无法精准推荐用户感兴趣的产品的问题,实现精准推荐用户感兴趣的产品,提升了用户体验。

附图说明

图1为本发明实施例提供的一种查找产品的方法的流程示意图;

图2为本发明实施例提供的另一种查找产品的方法的流程示意图;

图3为本发明实施例提供的又一种查找产品的方法的流程示意图;

图4为本发明另一实施例提供的一种查找产品的方法的流程示意图;

图5为本发明的实施例提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

本发明的实施例提供一种查找产品的方法,应用于终端,参照图1所示,该方法包括以下步骤:

步骤101、获取第一产品的第一标签和第一产品的描述信息。

其中,第一产品是用户关注的产品,用户关注的产品可以包括终端上已打开的产品、已播放的产品或已下载的产品等。

本发明实施例中,第一标签是第一产品自带的产品标签。第一产品的描述信息是用于对第一产品进行简要描述以便于用户了解第一产品的信息。

在实际应用中,第一产品可以是视频,可以是文档,当然,第一产品还可以是其他产品如音频等,本发明实施例中对第一产品并不做具体地限定。

步骤102、基于第一产品的描述信息,生成第一产品的第二标签。

其中,第一产品的描述信息不包含第二标签。

本发明实施例中,终端获取第一产品的第一标签和第一产品的描述信息之后,可以基于第一产品的描述信息,生成第一产品的第二标签,这里,第二标签可以称为第一标签的扩展标签。也就是说,本发明实施例中,可以基于第一产品的描述信息对第一产品的标签进行扩展,而且,该扩展的标签可以是不包含在第一产品的描述信息中的信息。这样,可以基于第一产品的描述信息对第一标签进行更加全面,甚至更加精确的扩展。

步骤103、获取至少两个第二产品的至少两个第三标签。

其中,至少两个第二产品与上述第一产品的产品类型可以相同,如第一产品是视频,至少两个第二产品也是视频。本发明实施例中,至少两个第三标签可以是至少两个第二产品的自带标签,也可以是至少两个第二产品的扩展标签,还可以是至少两个第二产品的自带标签和扩展标签的组合。

本发明实施例中,终端获取至少两个第二产品的至少两个第三标签,作为从至少两个第二产品中确定待推荐产品的一个重要因素。

步骤104、基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品。

其中,至少两个第二产品与第一产品不同。

本发明实施例中,终端获取第一标签、第二标签和至少两个第三标签之后,可以基于第一标签、第二标签和至少两个第三标签从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品。这里,待推荐产品是多个第二产品中与第一产品的相似度较高的产品,如从多个第二产品中查找到与第一产品的相似度在相似度排序中排在前五的产品。

本发明实施例所提供的查找产品的方法,获取第一产品的第一标签和第一产品的描述信息;基于第一产品的描述信息,生成第一产品的第二标签;其中,第一产品的描述信息不包含第二标签;获取至少两个第二产品的至少两个第三标签;基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品;其中,至少两个第二产品与第一产品不同;也就是说,本发明实施例中在进行产品推荐时可以基于第一产品的描述信息对第一产品的标签进行扩展,并得到描述信息中不包含但与描述信息关联的信息作为扩展标签,然后基于第一产品的自带标签和扩展标签从多个第二产品中精确地查找到与第一产品的相似度较高的产品作为待推荐产品;解决了相关技术中无法精准推荐用户感兴趣的产品的问题,实现精准推荐用户感兴趣的产品,提升了用户体验。

基于前述实施例,本发明的实施例提供一种查找产品的方法,该方法应用于终端,参照图2所示,该方法包括以下步骤:

步骤201、获取第一产品的第一标签和第一产品的描述信息。

步骤202、从第一产品的描述信息中提取第一关键词。

本发明实施例中,终端在获取第一产品的描述信息之后,可以从第一产品的描述信息中提取第一关键词,该第一关键词是对第一产品的自带标签即第一标签进行标签扩展的一个因素。

步骤203、生成与第一关键词具有关联关系的第二关键词,并确定第二关键词为第二标签。

其中,第一产品的描述信息不包含第二标签。

本发明实施例中,终端从第一产品的描述信息中提取出第一关键词之后,生成与第一关键词具有关联关系的第二关键词,并确定第二关键词为第二标签。

步骤204、获取至少两个第二产品的至少两个第三标签。

步骤205、分析第一产品的描述信息,得到分析结果。

本发明实施例中,终端基于第一产品的描述信息生成第一产品的第二标签,实现对第一产品的标签进行扩展的情况下,为了更进全面,更进一步地对自带标签进行进一步地扩展,可以对第一产品的描述信息进行分析,得到分析结果。这里,对第一产品的描述信息进行分析,可以包括对第一产品中的标识信息进行分析,例如分析第一产品的描述信息中是否包含标识信息,再例如分析第一产品的描述信息中包含标识信息的情况下,进一步分析该标识信息的属性以及该标识信息所标识的信息内容。

步骤206、若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取与标识符关联的第三关键词,并确定第三关键词为第四标签。

本发明实施例中,终端确定分析结果表征第一产品的描述信息包含标识符时,可以从第一产品的描述信息中提取与标识符关联的第三关键词,并确定第三关键词为第四标签,这里,与标识符关联的第三关键词可以是标识符标识的信息。第四标签也是对第一产品的自带标签进行扩展得到的标签。

在实际应用中,标识符可以是描述信息中的标点符号中的标号,如书名号,括号等;相应的,当标识符是书名号时,第三关键词可以是书名号内的词。需要说明的是,仅针对描述信息进行关键词的提取或分词时,无法识别标识符如书名号,进而也无法获取到标识符标识的信息;因此,本发明实施例中,为了更加全面的对自带标签进行扩展,将标识符关联的信息作为扩展标签,避免扩展标签时可能造成的主要信息的遗漏。

步骤207、若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取第三关键词以及除了第三关键词以外的第四关键词,并确定第三关键词和第四关键词为第四标签。

本发明实施例中,终端确定分析结果表征第一产品的描述信息包含标识符时,可以从第一产品的描述信息中提取与标识符关联的第三关键词,以及除了第三关键词以外的第四关键词,并确定第三关键词和第四关键词为第四标签;也就是说,为了实现更加全面地针对自带标签进行扩展,本发明实施例中不仅考虑了描述信息中的关键词,还考虑了标识符标识的信息,实现更加全面、更加精准地扩展标签。

步骤208、若分析结果表征第一产品的描述信息不包含标识符,从第一产品的描述信息中提取第四关键词,并确定第四关键词为第四标签。

本发明实施例中,终端确定分析结果表征第一产品的描述信息不包含标识符时,可以从第一产品的描述信息中提取第四关键词,并确定第四关键词为第四标签;也就是说,为了实现更加全面地针对自带标签进行扩展,本发明实施例中在描述信息中不包含标识符的情况下,可以利用描述信息中的关键词实现更加全面、更加精准地扩展标签。

步骤209、基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品。

其中,至少两个第二产品与第一产品不同。

本发明实施例中,步骤209基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品,可以通过如下步骤实现:

步骤209a1、基于第一标签、第二标签和第四标签,生成第一产品的标签权重。

这里,终端基于第一标签、第二标签和第四标签,生成第一产品的标签权重可以包括:先基于第一标签、第二标签和第四标签执行冗余操作;即去掉第一标签、第二标签和第四标签中重复的标签,得到标签集合,该标签集合中每种标签仅出现一次;再基于标签集合生成第一产品的标签权重。

步骤209a2、基于至少两个第三标签,生成至少两个第二产品的标签权重。

在本发明实施例中,终端可以基于每一产品的标签集合生成该产品的标签权重,示例性的,每一产品可以是视频:

第一步,获取终端上所有产品中每一产品的所有标签,每一产品的所有标签包括自带标签和扩展标签,并建立正向索引,这里,正向索引包括键值对,该键值对可以是如下形式<key,value>,其中,可以规定key值为视频的视频标识(identification,id),value值为标签值。所有产品包括第一产品和至少两个第二产品。

示例性的,如果一个视频id1的标签为:喜剧,动作,剧情,那么它的正索引的key为id1,value值为喜剧,动作,剧情。

进一步地,建立正向索引,数据结构为字典,其中的key值为标签值,value值为视频id。

示例性的,如果一个视频id1的标签为:喜剧,动作,剧情;那么它的负索引的key、value值如下:

<喜剧,id1>,<动作,id1>,<剧情,id1>,<喜剧动作,id1>,<喜剧剧情,id1>,<动作喜剧,id1>,<动作剧情,id1>,<剧情喜剧,id1>,<剧情动作,id1>,<喜剧动作剧情,id1>,<喜剧剧情动作,id1>,<动作喜剧剧情,id1>,<动作剧情喜剧,id1>,<剧情喜剧动作,id1>,<剧情动作喜剧,id1>;需要说明的是,负索引的key是标签值的全排列的结果。

第二步,针对待推荐产品,遍历正向索引,根据第一产品的标签集合从至少两个第二产品中找出与第一产品topn相似的视频id,得到待推荐产品。其中,topn指的是相似度较高的前n个产品,n大于等于1且小于第一预设阈值。

这里,遍历正索引,取每一个key值和value值,根据value值,进行全组合,比如视频id1的标签值为喜剧、动作、剧情,共3个标签值,首先我们从三个标签中取出三个,并从负索引里找出对应的视频id,如果这些视频id的数量大于第二预设阈值,则结束;否则从三个标签中取出二个,合并去重后,如果仍旧大于第二预设阈值,则结束;否则从三个标签中取出一个继续寻找。

第三步,针对待推荐产品,利用成词频-逆文档词频(termfrequency-inversedocumentfrequency,tf-idf)计算每一待推荐产品的标签权重。

步骤209a3、基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

这里,基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品,即基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找与第一产品的相似度较高的产品作为第三产品即待推荐产品。

本发明另一实施例中,若仅基于第一产品的描述信息,生成描述信息中不包含的第二标签,那么,步骤209基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品,可以通过如下步骤实现:

步骤209b1、基于第一标签和第二标签,生成第一产品的标签权重。

本发明实施例中,第一产品的标签集合包括第一标签和第二标签,那么,终端可以基于第一标签和第二标签,生成第一产品的标签权重。

本发明实施例中,针对第一产品如第一视频,可以利用tf-idf计算第一产品的标签权重。

步骤209b2、基于至少两个第三标签,生成至少两个第二产品的标签权重。

本发明实施例中,针对每一第二产品如每一第二视频,可以利用tf-idf计算每一第二产品的标签权重。

步骤209b3、基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

本发明实施例中,步骤209a3或步骤209b3基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品,可以通过如下步骤实现:

步骤20901、确定第一产品的标签权重为第一产品的向量的第一坐标。

本发明实施例中,终端直接将第一产品的标签权重确定为第一产品的向量的第一坐标。

步骤20902、确定至少两个第二产品的标签权重为至少两个第二产品的向量的至少两个第二坐标。

本发明实施例中,终端直接将至少两个第二产品的标签权重确定为至少两个第二产品的向量的至少两个第二坐标。

步骤20903、基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品。

本发明实施例中,步骤20903基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品,可以通过如下步骤实现:

步骤一、基于第一坐标和至少两个第二坐标,计算第一产品的向量和至少两个第二产品的向量的至少两个点积。

步骤二、从至少两个第二产品中确定点积的值大于预设阈值的第二产品为第三产品。需要说明的是,本发明实施例中,点积的值大于预设阈值的第二产品也就是相似度满足预设相似度的产品。

示例性的,产品id1各个标签权重分别为0.1,0.2,0.3,那么用向量直接表示为[0.1,0.2,0.3],产品id2各个标签权重分别为0.2,0.2,0.3,那么用向量直接表示为[0.2,0.2,0.3],产品id3各个标签权重分别为0.3,0.2,0.3,那么用向量直接表示为[0.3,0.2,0.3],通过计算id1和id2标签权重的相似度,以及id1和id3标签权重的相似度,显然,id1和id2之间更为相似。

本发明实施例中,通过扩充标签,获得视频的扩展标签,增强了扩展性,能够获得产品隐藏的标签,使得到的推荐更加精准。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本发明的实施例提供一种查找产品的方法,该方法应用于终端,参照图3所示,该方法包括以下步骤:

步骤301、获取第一产品的第一标签和第一产品的描述信息。

其中,第一产品是用户关注的产品,用户关注的产品表征终端上已播放的产品和/或已下载的产品。

步骤302、基于第一产品的描述信息,生成第一产品的第二标签。

其中,第一产品的描述信息不包含第二标签。

步骤303、获取至少两个第二产品的至少两个第三标签。

其中,至少两个第二产品与第一产品不同。

步骤304、基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,确定第三产品属于待推荐产品。

步骤305、获取服务器发送的第四产品。

本发明实施例中,第四产品可以是服务器发送的第四产品,该第四产品可以是热门推荐产品。

在本发明另一实施例中,第四产品还可以是终端接收的其他终端发送的产品,例如朋友通过其操作的终端分享给用户操作的本申请的终端的产品。

步骤306、获取第三产品的第一优先级和第四产品的第二优先级。

本发明实施例中,第三产品的数量可以是多个,第四产品的数量也可以是多个,终端在获取第四产品之后,还可以计算每一第三产品的每一第一优先级和每一第四产品的每一第二优先级;这里,每一第一优先级表征每一第三产品与第一产品的相似度的高低,每一第二优先级表征每一第四产品与第一产品的相似度的高低。

步骤307、基于第一优先级和第二优先级,对第三产品和第四产品进行排序,生成产品推荐列表。

本发明实施例中,终端在获取到每一第三产品的第一优先级和每一第四产品的第二优先级之后,可以基于第一优先级和第二优先级,对第三产品和第四产品进行排序,生成产品推荐列表。

在实际应用中,终端可以基于第一优先级和第二优先级从高到底的顺序,对第三产品和第四产品进行排序,生成产品推荐列表,如此,可以将相似度较高的待推荐产品优先地推荐给用户。

需要说明的是,本实施例中与其它实施例中相同步骤和相同内容的说明,可以参照其它实施例中的描述,此处不再赘述。

基于前述实施例,本发明的实施例提供一种查找产品的方法,该方法应用于终端,示例性的,产品可以是视频,参照图4所示,该方法包括以下步骤:

步骤401、获取终端上所有产品中每一产品的所有标签,每一产品的所有标签包括自带标签和扩展标签,并建立正向索引;这里,正向索引包括键值对,该键值对可以是如下形式<key,value>,其中,可以规定key值为视频的视频标识(identification,id),value值为标签值。所有产品包括第一产品和至少两个第二产品。

这里,建立正向索引,数据结构为字典,其中的key值为标签值,value值为视频id。

举例说明:如果一个视频id1的标签为:喜剧,动作,剧情,那么它的正索引的key为id1,value值为喜剧,动作,剧情。

步骤402、建立负向索引。

举例说明:如果一个视频id1的标签为:喜剧,动作,剧情;那么它的负索引的key、value值如下:<喜剧,id1>,<动作,id1>,<剧情,id1>,<喜剧动作,id1>,<喜剧剧情,id1>,<动作喜剧,id1>,<动作剧情,id1>,<剧情喜剧,id1>,<剧情动作,id1>,<喜剧动作剧情,id1>,<喜剧剧情动作,id1>,<动作喜剧剧情,id1>,<动作剧情喜剧,id1>,<剧情喜剧动作,id1>,<剧情动作喜剧,id1>;需要说明的是,负索引的key是标签值的全排列的结果。

步骤403、针对待推荐产品,遍历正向索引,根据第一产品的标签集合从至少两个第二产品中找出与第一产品topn相似的视频id,得到待推荐产品。其中,topn指的是相似度较高的前n个产品,n大于等于1且小于第一预设阈值。

这里,遍历正索引,取每一个key值和value值,根据value值,进行全组合,比如视频id1的标签值为喜剧、动作、剧情,共3个标签值,首先我们从三个标签中取出三个,并从负索引里找出对应的视频id,如果这些视频id的数量大于第二预设阈值,则结束;否则从三个标签中取出二个,合并去重后,如果仍旧大于第二预设阈值,则结束;否则从三个标签中取出一个继续寻找。

步骤404、针对待推荐产品,利用成词频-逆文档词频(termfrequency-inversedocumentfrequency,tf-idf)计算每一待推荐产品的标签权重,对于与第一产品的标签相同的待推荐产品,通过进一步计算第一产品与各待推荐产品的标签权重的相似度,进一步确定第一产品与待推荐产品之间的相似度。

通过该步骤,即得到了标签相同的产品之间的相似度差异,进一步细化了产品的相似度。在标签相同的产品数量较多的情况下,该方法能够很好地获得与第一产品更为相似的产品,提高推荐的精准度。

对于标签不同的产品通过后续的标签相似度公式计算获得。

步骤405、爬取文本信息构建字典库。

步骤406、判断视频的描述信息是否含有标识符如书名号。

步骤407、如果是,提取书名号中的内容作为该视频的一个特征词。

步骤408、如果没有,则根据字典树采用规则分词里面的正向最大匹配法来检索词,获取视频的特征词。

步骤409、针对步骤407得到的视频特征词里面的强词进行扩展,比如视频特征有江苏这个词,对江苏这个词进行扩展得到江苏、南京、苏州等多个扩展词。

步骤410、利用word2vec方法将一个视频的标签信息表示成向量,通过计算向量之间的相似度,得到两个产品之间的相似度。

本发明实施例中,终端还可以获取服务器推荐的热门产品id,加入到热门产品id列表中。

步骤411、将步骤404,步骤410和热门推荐的结果做一个融合,最终得到一个产品的相似度推荐列表。

针对标签相同的产品,通过步骤404的相似度排名进行排序。

针对标签不同的产品,通过步骤410的相似度排名进行排序。

对于热门产品,在排序时提高其排名的权重,来提高其排名,热门产品排序相对靠前。这样就得到了完整的相似度推荐列表。

需要说明的是,本发明实施例所提供的查找产品的方法,针对没有导演、演员等信息的短视频/小视频的视频推荐时能够实现精准推荐的效果。

需要说明的是,本发明实施例所提供的查找产品的方法,能够实现如下技术效果:对标签建立索引时进行全排列组合,提高检索准确性和检索效率;对标签相同的产品,通过进一步计算第一产品与各待推荐产品的标签权重的相似度,进一步确定第一产品与待推荐产品之间的相似度;扩充标签值,提取视频的描述信息进行分词后,对其进行强词扩展。并对不同的标签利用tf-idf计算权重;针对视频信息描述的内容,通过《》先将一些专有名词获得,然后通过规则分词,获得视频的扩展标签值,并对这些或得到的扩展标签里面的强词进行扩展;将热点产品引入,对应相似度低但是热点的内容加入到推荐的列表中。

基于前述实施例,本发明的实施例提供一种终端,该终端可以应用于图1~3对应的实施例提供的查找产品的方法中,参照图5所示,该终端5可以包括:处理器501、存储器502和通信总线503,其中:

通信总线503用于实现处理器501和存储器502之间的通信连接;

处理器501用于执行存储器502中存储的查找产品的程序,以实现以下步骤:

获取第一产品的第一标签和第一产品的描述信息;

基于第一产品的描述信息,生成第一产品的第二标签;其中,第一产品的描述信息不包含第二标签;

获取至少两个第二产品的至少两个第三标签;

基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品;其中,至少两个第二产品与第一产品不同。

在本发明的其他实施例中,处理器501用于执行存储器502中基于第一产品的描述信息,生成第一产品的第二标签时,可以通过以下步骤实现:

从第一产品的描述信息中提取第一关键词;

生成与第一关键词具有关联关系的第二关键词,并确定第二关键词为第二标签。

在本发明的其他实施例中,处理器501用于执行存储器502中存储的查找产品的程序,可以通过以下步骤实现:

分析第一产品的描述信息,得到分析结果;

若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取与标识符关联的第三关键词,并确定第三关键词为第四标签;或者,

若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取第三关键词以及除了第三关键词以外的第四关键词,并确定第三关键词和第四关键词为第四标签;或者,

若分析结果表征第一产品的描述信息不包含标识符,从第一产品的描述信息中提取第四关键词,并确定第四关键词为第四标签;

相应的,基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,包括:

基于第一标签、第二标签、至少两个第三标签和第四标签,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,处理器501用于执行存储器502中基于第一标签、第二标签、至少两个第三标签和第四标签,从至少两个第二产品中查找第三产品时,可以通过以下步骤实现:

基于第一标签、第二标签和第四标签,生成第一产品的标签权重;

基于至少两个第三标签,生成至少两个第二产品的标签权重;

基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,处理器501用于执行存储器502中基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品时,可以通过以下步骤实现:

基于第一标签和第二标签,生成第一产品的标签权重;

基于至少两个第三标签,生成至少两个第二产品的标签权重;

基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,处理器501用于执行存储器502中基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品时,可以通过以下步骤实现:

确定第一产品的标签权重为第一产品的向量的第一坐标;

确定至少两个第二产品的标签权重为至少两个第二产品的向量的至少两个第二坐标;

基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,处理器501用于执行存储器502中基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品时,可以通过以下步骤实现:

基于第一坐标和至少两个第二坐标,计算第一产品的向量和至少两个第二产品的向量的至少两个点积;

从至少两个第二产品中确定点积的值大于预设阈值的第二产品为第三产品。

在本发明的其他实施例中,处理器501用于执行存储器502中存储的查找产品的程序,可以通过以下步骤实现:

获取服务器发送的第四产品;

相应的,确定第三产品属于待推荐产品之后,方法还包括:

获取第三产品的第一优先级和第四产品的第二优先级;

基于第一优先级和第二优先级,对第三产品和第四产品进行排序,生成产品推荐列表。

需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的查找产品的方法中的实现过程,此处不再赘述。

基于前述实施例,本发明的实施例提供一种查找产品的装置,该查找产品的装置与上述终端对应,可以应用于图1~3对应的实施例提供的查找产品的方法中,该装置包括:

第一获取单元,用于获取第一产品的第一标签和第一产品的描述信息;

生成单元,用于基于第一产品的描述信息,生成第一产品的第二标签;其中,第一产品的描述信息不包含第二标签;

第二获取单元,还用于获取至少两个第二产品的至少两个第三标签;

第一处理单元,用于基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品;其中,至少两个第二产品与第一产品不同。

在本发明的其他实施例中,生成单元,用于从第一产品的描述信息中提取第一关键词;生成与第一关键词具有关联关系的第二关键词,并确定第二关键词为第二标签。

在本发明的其他实施例中,上述装置还包括:

第二处理单元,用于分析第一产品的描述信息,得到分析结果;若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取与标识符关联的第三关键词,并确定第三关键词为第四标签;或者,

第二处理单元,用于若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取第三关键词以及除了第三关键词以外的第四关键词,并确定第三关键词和第四关键词为第四标签;或者,

第二处理单元,用于若分析结果表征第一产品的描述信息不包含标识符,从第一产品的描述信息中提取第四关键词,并确定第四关键词为第四标签;

第一处理单元,用于基于第一标签、第二标签、至少两个第三标签和第四标签,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,第一处理单元,用于基于第一标签、第二标签和第四标签,生成第一产品的标签权重;基于至少两个第三标签,生成至少两个第二产品的标签权重;基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,第一处理单元,用于基于第一标签和第二标签,生成第一产品的标签权重;基于至少两个第三标签,生成至少两个第二产品的标签权重;基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,第一处理单元,用于确定第一产品的标签权重为第一产品的向量的第一坐标;确定至少两个第二产品的标签权重为至少两个第二产品的向量的至少两个第二坐标;基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,第一处理单元,用于基于第一坐标和至少两个第二坐标,计算第一产品的向量和至少两个第二产品的向量的至少两个点积;从至少两个第二产品中确定点积的值大于预设阈值的第二产品为第三产品。

在本发明的其他实施例中,上述装置还包括:

第三获取单元,用于获取服务器发送的第四产品;

第四获取单元,用于获取第三产品的第一优先级和第四产品的第二优先级;

第三处理单元,用于基于第一优先级和第二优先级,对第三产品和第四产品进行排序,生成产品推荐列表。

需要说明的是,本实施例中查找产品的装置所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的查找产品的方法中的实现过程,此处不再赘述。

基于前述实施例,本发明的实施例提供一种存储介质,该存储介质存储有一个或者多个程序,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:

获取第一产品的第一标签和第一产品的描述信息;

基于第一产品的描述信息,生成第一产品的第二标签;其中,第一产品的描述信息不包含第二标签;

获取至少两个第二产品的至少两个第三标签;

基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,并确定第三产品属于待推荐产品;其中,至少两个第二产品与第一产品不同。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行基于第一产品的描述信息,生成第一产品的第二标签,以实现如下步骤:

从第一产品的描述信息中提取第一关键词;

生成与第一关键词具有关联关系的第二关键词,并确定第二关键词为第二标签。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:

分析第一产品的描述信息,得到分析结果;

若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取与标识符关联的第三关键词,并确定第三关键词为第四标签;或者,

若分析结果表征第一产品的描述信息包含标识符,从第一产品的描述信息中提取第三关键词以及除了第三关键词以外的第四关键词,并确定第三关键词和第四关键词为第四标签;或者,

若分析结果表征第一产品的描述信息不包含标识符,从第一产品的描述信息中提取第四关键词,并确定第四关键词为第四标签;

相应的,基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,包括:

基于第一标签、第二标签、至少两个第三标签和第四标签,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行基于第一标签、第二标签、至少两个第三标签和第四标签,从至少两个第二产品中查找第三产品,以实现如下步骤:

基于第一标签、第二标签和第四标签,生成第一产品的标签权重;

基于至少两个第三标签,生成至少两个第二产品的标签权重;

基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行基于第一标签、第二标签和至少两个第三标签,从至少两个第二产品中查找第三产品,以实现如下步骤:

基于第一标签和第二标签,生成第一产品的标签权重;

基于至少两个第三标签,生成至少两个第二产品的标签权重;

基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行基于第一产品的标签权重和至少两个第二产品的标签权重,从至少两个第二产品中查找第三产品,以实现如下步骤:

确定第一产品的标签权重为第一产品的向量的第一坐标;

确定至少两个第二产品的标签权重为至少两个第二产品的向量的至少两个第二坐标;

基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行基于第一坐标和至少两个第二坐标之间的关系,从至少两个第二产品中查找第三产品,以实现如下步骤:

基于第一坐标和至少两个第二坐标,计算第一产品的向量和至少两个第二产品的向量的至少两个点积;

从至少两个第二产品中确定点积的值大于预设阈值的第二产品为第三产品。

在本发明的其他实施例中,该一个或者多个程序可被一个或者多个处理器执行,以实现如下步骤:

获取服务器发送的第四产品;

相应的,确定第三产品属于待推荐产品之后,方法还包括:

获取第三产品的第一优先级和第四产品的第二优先级;

基于第一优先级和第二优先级,对第三产品和第四产品进行排序,生成产品推荐列表。

需要说明的是,本实施例中处理器所执行的步骤的具体实现过程,可以参照图1~3对应的实施例提供的查找产品的方法中的实现过程,此处不再赘述。

需要说明的是,上述计算机可读存储介质可以是只读存储器(readonlymemory,rom)、可编程只读存储器(programmableread-onlymemory,prom)、可擦除可编程只读存储器(erasableprogrammableread-onlymemory,eprom)、电可擦除可编程只读存储器(electricallyerasableprogrammableread-onlymemory,eeprom)、磁性随机存取存储器(ferromagneticrandomaccessmemory,fram)、快闪存储器(flashmemory)、磁表面存储器、光盘、或只读光盘(compactdiscread-onlymemory,cd-rom)等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备,如移动电话、计算机、平板设备、个人数字助理等。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所描述的方法。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1