商品簇标题生成方法、装置、计算机系统及可读存储介质与流程

文档序号:23629284发布日期:2021-01-12 10:43阅读:244来源:国知局
商品簇标题生成方法、装置、计算机系统及可读存储介质与流程

本公开涉及计算机技术领域,具体涉及一种商品簇标题生成方法、装置、计算机系统及可读存储介质。



背景技术:

商品簇标题生成旨在给多个商品生成一个具有吸引力的标题。当前商品簇标题生成方法主要依赖于人工编辑及规则生成。但是,人工编辑工作量大,成本较高,难以实现海量商品簇标题的及时生成和更新。另一方面,由于商品簇中的多商品存在一定的差异性,规则生成的标题难以与商品灵活地匹配。同时,规则产出的标题比较单一,缺乏多样性及吸引力。例如,传统的单商品标题有“2018秋冬女装潮牌字母印花oversize宽松连帽丝绒卫衣女套头”、“2019秋装新款时尚纯色宽松套头毛衣女韩版短款针织毛衫潮牌”等,而多商品的商品簇标题通常是“连衣裙集合”、“各种样式的裙子集合”等,标题缺乏多样性和吸引力。



技术实现要素:

为了解决相关技术中的问题,本公开实施例提供一种商品簇标题生成方法、装置、计算机系统及可读存储介质。

第一方面,本公开实施例中提供了一种商品簇标题生成方法。

具体地,所述商品簇标题生成方法,包括:

从第一数据库获取所述商品的标题;

从第二数据库获取与所述商品相关的文本的特定内容;

基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题。

结合第一方面,本公开在第一方面的第一种实现方式中,所述m个商品具有类似属性或具有相关属性或具有相同属性;和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

结合第一方面,本公开在第一方面的第二种实现方式中,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或

所述获取与所述商品相关的文本的特定内容包括:根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,

其中,p≤m,q≤m。

结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:

按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;

使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

结合第一方面的第二种实现方式,本公开在第一方面的第五种实现方式中,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:

按照第二预设规则从所述至少一个文本中选择一个或多个文本;

将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

结合第一方面的第五种实现方式,本公开在第一方面的第六种实现方式中,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

结合第一方面,本公开在第一方面的第七种实现方式中,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

结合第一方面的第七种实现方式,本公开在第一方面的第八种实现方式中,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:

从与所述q个商品相关的文本的特定内容获得候选文本特定内容;

基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

结合第一方面的第八种实现方式,本公开在第一方面的第九种实现方式中,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

结合第一方面的第八种实现方式,本公开在第一方面的第十种实现方式中,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:

使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

结合第一方面的第十种实现方式,本公开在第一方面的第十一种实现方式中,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:

对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;

对所述候选文本特定内容应用第二特征表示方法,得到第二向量;

将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

结合第一方面的第十一种实现方式,本公开在第一方面的第十二种实现方式中,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或

所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或

所述融合包括拼接。

结合第一方面的第二种实现方式到第一方面的第十二种实现方式,本公开在第一方面的第十三种实现方式中,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或

所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

第二方面,本公开实施例中提供了一种视频簇标题生成方法,所述视频簇包含m个视频,m≥1,其特征在于,所述方法包括:

从第一数据库获取所述视频的标题;

从第二数据库获取与所述视频相关的文本的特定内容;

基于所述视频的标题和所述文本的特定内容,自动生成所述视频簇的视频簇标题。

第三方面,本公开实施例中提供了一种商品簇标题生成装置。

具体地,所述商品簇标题生成装置,包括:商品标题获取模块,用于从第一数据库获取所述商品的标题;

文本特定内容获取模块,用于从第二数据库获取与所述商品相关的文本的特定内容;

簇标题生成模块,用于基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,

其中,所述商品簇包含m个商品,m≥1。

结合第三方面,本公开在第三方面的第一种实现方式中,所述m个商品具有类似属性或具有相关属性或具有相同属性;和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

结合第三方面,本公开在第三方面的第二种实现方式中,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或

所述获取与所述商品相关的文本的特定内容包括:根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,

其中,p≤m,q≤m。

结合第三方面的第二种实现方式,本公开在第三方面的第三种实现方式中,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:

按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;

使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

结合第三方面的第三种实现方式,本公开在第三方面的第四种实现方式中,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

结合第三方面的第二种实现方式,本公开在第三方面的第五种实现方式中,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:

按照第二预设规则从所述至少一个文本中选择一个或多个文本;

将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

结合第三方面的第五种实现方式,本公开在第三方面的第六种实现方式中,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

结合第三方面,本公开在第二方面的第七种实现方式中,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

结合第三方面的第七种实现方式,本公开在第三方面的第八种实现方式中,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:

从与所述q个商品相关的文本的特定内容获得候选文本特定内容;

基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

结合第三方面的第八种实现方式,本公开在第三方面的第九种实现方式中,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

结合第三方面的第八种实现方式,本公开在第三方面的第十种实现方式中,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:

使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

结合第三方面的第十种实现方式,本公开在第三方面的第十一种实现方式中,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:

对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;

对所述候选文本特定内容应用第二特征表示方法,得到第二向量;

将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

结合第三方面的第十一种实现方式,本公开在第三方面的第十二种实现方式中,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或

所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或

所述融合包括拼接。

结合第三方面的第二种实现方式到第三方面的第十二种实现方式,本公开在第三方面的第十三种实现方式中,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或

所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

第四方面,本公开实施例中提供了一种计算机系统。具体地,所述计算机系统,包括:处理器;存储器,存储有可执行指令,当所述可执行指令被处理器执行时,实现以下方法步骤:

从第一数据库获取所述商品的标题;

从第二数据库获取与所述商品相关的文本的特定内容;

基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题。

结合第四方面,本公开在第四方面的第一种实现方式中,所述m个商品具有类似属性或具有相关属性或具有相同属性;和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

结合第四方面,本公开在第四方面的第二种实现方式中,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或

所述获取与所述商品相关的文本的特定内容包括:根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,

其中,p≤m,q≤m。

结合第四方面的第二种实现方式,本公开在第四方面的第三种实现方式中,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:

按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;

使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

结合第四方面的第三种实现方式,本公开在第四方面的第四种实现方式中,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

结合第四方面的第二种实现方式,本公开在第四方面的第五种实现方式中,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:

按照第二预设规则从所述至少一个文本中选择一个或多个文本;

将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

结合第四方面的第五种实现方式,本公开在第四方面的第六种实现方式中,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

结合第四方面,本公开在第四方面的第七种实现方式中,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

结合第四方面的第七种实现方式,本公开在第四方面的第八种实现方式中,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:

从与所述q个商品相关的文本的特定内容获得候选文本特定内容;

基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

结合第四方面的第八种实现方式,本公开在第四方面的第九种实现方式中,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

结合第四方面的第八种实现方式,本公开在第四方面的第十种实现方式中,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:

使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

结合第四方面的第十种实现方式,本公开在第四方面的第十一种实现方式中,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:

对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;

对所述候选文本特定内容应用第二特征表示方法,得到第二向量;

将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

结合第四方面的第十一种实现方式,本公开在第四方面的第十二种实现方式中,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或

所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或

所述融合包括拼接。

结合第四方面的第二种实现方式到第四方面的第十二种实现方式,本公开在第四方面的第十三种实现方式中,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或

所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

第五方面,本公开实施例中提供了一种计算机可读存储介质。

具体地,所述计算机可读存储介质,存储有可执行指令,当所述可执行指令被处理器执行时,实现如第一方面、第一方面的第一种实现方式到第一方面的第十三种实现方式中任一项所述的方法。

附图说明

结合附图,通过以下非限制性实施方式的详细描述,本公开的其它目的和优点将变得更加明显。在附图中:

图1示出了根据本公开实施例的应用场景的示意图;

图2示出了根据本公开实施例的生成模型的示意图;

图3a示出了根据本公开实施例的商品簇标题生成方法的流程图;

图3b示出了根据本公开实施例的视频簇标题生成方法的流程图;

图4示出了根据本公开实施例的商品簇标题生成装置的框图;

图5示出根据本公开实施例的计算机系统的结构框图;

图6示出根据本公开实施例适于商品簇生成方法的计算机体系架构的结构框图。

具体实施方式

下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。

在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

在提出本公开的过程中,发明人发现,用现有方法生成商品簇标题,人工编辑工作量大,成本较高,难以实现海量商品簇标题的及时生成和更新,而通过规则生成的标题则较为单一,缺乏灵活性、多样性和吸引力。为至少部分解决上述问题而提出本公开。

图1示出了根据本公开实施例的应用场景的示意图。可以理解,图1所示应用场景仅为了说明本公开的概念和原理,而并非意味着本公开仅适用于这样的应用场景。

在图1中,商品簇100包括商品1、商品2、商品……、商品n,例如跑鞋簇可以包括各种品牌、各种颜色和款式的跑鞋。

在步骤s101中,使用检索关键词检索,得到数据400的相关文章标题。具体地,步骤s101使用商品簇100中各商品的检索关键词,使用内容检索模型200,从文章数据库300中检索出商品簇100的相关文章,并得到相关文章标题400,例如“跑出你的明天”、“炫酷的跑步好伴侣”等。内容检索模型200是基于检索关键词对内容进行检索的搜索引擎,能够针对给定检索关键词输出与该检索关键词相关的文章。文章数据库300可以是网购达人文章数据库,也可以是其它文章数据库,其中的文章可以是与商品簇中的商品有关的描述、评价或推荐文章。步骤s102,排序与过滤,得到候选文章标题600。具体地,步骤s102根据预设指标和/或规则500对相关文章标题400进行排序与过滤,得到候选文章标题600。预设指标和/或规则500可以包括以下任意一项或多项的组合:标题的tf-idf得分、语言模型得分、相关性得分、强制性排除规则等。对相关文章标题400计算例如tf-idf得分、语言模型得分、或相关性得分等得分,根据得分并进行排序,可以选择出和商品簇相关性更好、语言表达方式更好的标题。使用例如无明显性别取向、无年龄取向等的强制性排除规则,可以排除掉不符合强制性排除规定的相关文章标题。在步骤s103中,获取商品标题,例如获取商品簇中各商品的标题。在步骤s104中,用生成模型生成新标题,例如根据候选文章标题600和步骤s103获取的商品标题,用生成模型生成新标题。生成模型可以是训练好的文本生成模型,其基于输入文本生成新的文本。步骤s105进行后处理,例如修复步骤s104生成的新标题文本中出现的未知字符、删除重复字符等,得到最终标题700,例如“跑出明天的跑鞋”。最终标题是结合优选后的候选文章标题和商品标题,通过计算机程序生成的,和人工生成标题相比效率更高,而且具有良好的多样性和吸引力。

图2示出了根据本公开实施例的生成模型的示意图。

根据本公开的实施例,图1中的步骤s104所使用的生成模型的示例性结构如图2所示。

在图2中,候选文章标题经过步骤s201的注意力机制处理,得到向量a210,向量a210表征了候选文章标题的特征。步骤s201也可以采用其他特征表示方法,例如使用卷积神经网络或循环神经网络等实现候选文章标题的特征表示。步骤s202对商品标题进行循环神经网络处理,得到向量b220,向量b220表征了商品标题的特征。步骤s203进行向量拼接,例如对向量a和向量c进行拼接,得到向量c230。步骤s203中的向量拼接可以是将长度为m的向量a和长度为n的向量b拼接,得到长度为m+n的向量c,向量c同时具有候选文章标题的特征和商品标题的特征。在步骤s204对向量c230进行向量解码,得到新标题。这样生成的新标题同时具备商品标题的特征和候选文章标题的特征,因此能贴切地表述出商品标题,而且具有候选文章标题的多样性和吸引力。

图3a示出了根据本公开实施例的商品簇标题生成方法的流程图。

根据本公开的实施例,所述商品簇标题生成方法中的商品簇包含m个商品,m≥1。

在步骤s301中,从第一数据库获取所述商品的标题;

在步骤s302中,从第二数据库获取与所述商品相关的文本的特定内容;

在步骤s303中,基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述m个商品具有类似属性或具有相关属性或具有相同属性和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

根据本公开的实施例,商品簇例如可以包括多个商品,例如,跑鞋簇可以包括各种颜色、款式、品牌的跑鞋。商品簇中的商品的相关信息,例如商品的标题,可以保存在第一数据库中。第二数据库可以是网购达人文章数据库,也可以是其它文章数据库,其中的文章可以是与商品簇中的商品有关的描述、评价或推荐文章。一般而言,这种文章的内容比较具有多样性和吸引力。根据本公开的实施例,可以基于跑鞋簇中跑鞋的标题和与跑鞋相关的文章的特定内容,自动生成跑鞋的商品簇标题。这样生成的商品簇标题能够良好地匹配跑鞋的标题,同时具有文章标题的多样性和吸引力,优于人工编辑或基于规则生成的商品簇标题。

根据本公开实施例,所述m个商品具有类似属性或具有相关属性或具有相同属性。例如,所述m个商品都是跑鞋,在跑步时使用,具有类似的属性,或者所述m个商品都是野营户外场景中使用的帐篷、登山杖、防潮垫等商品,具有相关属性。再例如,m个商品都是碳素纤维鱼竿,都是碳素纤维制成,具有相同属性。当商品簇中的m个商品具有类似属性或具有相关属性或具有相同属性时,可以使得获取的文章标题更加有针对性,进而提高最后生成的商品簇标题的质量。

根据本公开实施例,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或所述获取与所述商品相关的文本的特定内容包括根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,其中,p≤m,q≤m。根据本公开的实施例,可以获取所有商品的标题,也可以在商品簇中的商品数量较多时,选择性地获取部分商品(例如p个商品)的标题。例如,假设跑鞋簇有1000个跑鞋,则可以选择性地获取10个销量最高或浏览量最大的跑鞋的标题。在获取与商品相关的文章的特定内容时,可以根据所有商品的检索关键词来检索文章,也可以选择性地根据部分商品(例如q个商品)的检索关键词来检索文章。例如,在获取与1000个跑鞋相关的文章的特定内容时,可以使用与其中点评数最多的20个跑鞋相关的检索关键词“跑步”、“鞋”、“轻便”、“透气”等获取相关文章的特定内容。根据本公开的实施例,所述p个商品和所述q个商品可以是相同的商品,也可以是不同的商品,或者可以有一些商品相同而一些商品不同。通过有针对性地选择获取商品的标题和选择商品的关键词来检索文章,可以使得最终获得的标题更加有针对性,更加贴合大众的需求和关注点。

根据本公开实施例,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

根据本公开实施例,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

例如,在检索关键词“跑步”、“鞋”、“轻便”、“透气”、“耐用”、“防水”中,根据用户使用这些检索关键词的频率、检索关键词与跑鞋间的匹配程度、用户使用检索关键词检索到当年流行跑鞋的概率等第一预设规则,选取“跑步”、“鞋”、“轻便”、“透气”进行检索,获取400篇文章。通过使用第一预设规则对检索关键词进行筛选,可以使得检索关键词更加符合用户对商品的期待和认知,更有利于检索到能够吸引用户的文章。

根据本公开实施例,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:根据与所述q个商品相关的检索关键词获取至少一个文本;按照第二预设规则从所述至少一个文本中选择一个或多个文本;将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

根据本公开实施例,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

例如,使用检索关键词“跑步”、“鞋”、“轻便”、“透气”检索到400篇文章,再根据例如文章点击率、文章发布时间、文章作者排名等第二预设规则,选取其中200篇综合排名靠前的文章,以这200篇文章的特定内容作为与跑鞋相关的文章的特定内容。在用检索关键词检索出来的文章中,进一步使用第二预设规则进行筛选,可以获得时效性更好、关注度更高的文章。

根据本公开实施例,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

例如,可以从1000个跑鞋中选取10个销量最高的跑鞋,选取与50个点评数最高的跑鞋相关的200篇文章,基于这10个销量最高的跑鞋的标题和200篇文章的标题,自动生成跑鞋簇标题。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:从与所述q个商品相关的文本的特定内容获得候选文本特定内容;基于所述m个商品中的q个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

例如,在200篇文章的特定内容中,可以根据以下一项或者多项的组合获取100篇候选文章的特定内容:

计算200篇文章在不同鞋类下的概率分布,计算检索关键词“跑步”、“鞋”、“轻便”、“透气”在不同鞋类下的概率分布,得到两种概率分布的相似度,选择相似度高的检索关键词检索到的文章特定内容;

计算200篇文章特定内容的tf-idf得分,tf-idf是词频-逆文本频率指数,用于衡量文章特定内容与文章内容的相关度,选择相关度高的文章特定内容;

计算200篇文章特定内容的语言模型得分,用于衡量特定内容使用的语言是否规范,选择规范程度高的文章特定内容;

计算200篇文章特定内容和检索关键词“跑步”、“鞋”、“轻便”、“透气”的相关性得分,用于衡量文章与检索关键词的相关度,选择相关度高的文章特定内容;

强制性排除规则,例如强制性排除有明显性别取向、年龄取向的特定内容。

通过上述方式,从200篇文章中选出100篇候选文章的特定内容,作为用于生成商品簇标题的候选文章特定内容。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

例如,使用训练好的文本生成器,使用10个销量最高的跑鞋的标题和100篇候选文章的特定内容,生成跑鞋簇的标题,该标题结合了跑鞋的标题的特征和优选后的候选文章的特定内容的特征,具有较高的用户认可度,具有良好的多样性和吸引力。

根据本公开实施例,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;对所述候选文本特定内容应用第二特征表示方法,得到第二向量;将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

例如,在文本生成器中,对10个销量最高的跑鞋的标题进行融合,并用第一特征表示方法得到第一向量。对100个候选文章的特定内容应用第二特征表示法,得到第二向量。将第一向量和第二向量融合并解码,得到跑鞋簇的标题,该标题不但反映了跑鞋簇中跑鞋的标题,而且具有文章特定内容的多样性、有吸引力等特点。

根据本公开实施例,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或所述融合包括拼接。

根据本公开实施例,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

根据本公开实施例,所述p个商品和所述q个商品可以是商品簇中的全部商品,或者,所述p个商品和所述q个商品也可以是商品簇中的部分商品。当商品簇中商品较多时,可以选择最受欢迎的或当前主推的商品,或根据其他标准选择部分商品来生成商品簇标题。这样生成的标题更加有针对性,能够满足不同应用场景的需要。例如,对于纸巾簇而言,可以选择销量最大的几种纸巾来生成纸巾簇标题。销量大的纸巾一般具有柔软、韧性好、价格适中等特质,利用这样的纸巾生成的商品簇标题,更加贴合用户的需求和期待,对用户更有吸引力。再例如,化妆品簇中当前主推的是口红,针对口红的特质生成商品簇标题,能够更有效地吸引目标用户,提高浏览和购买率。

图3b示出了根据本公开实施例的视频簇标题生成方法的流程图。

根据本公开的实施例,所述视频簇标题生成方法中的视频簇包含m个视频,m≥1。

在步骤s304中,从第一数据库获取所述视频的标题;

在步骤s305中,从第二数据库获取与所述视频相关的文本的特定内容;

在步骤s306中,基于所述视频的标题和所述文本的特定内容,自动生成所述视频簇的视频簇标题。

根据本公开实施例,视频簇可以包括多个视频,例如,萌宠视频簇可以包括多个宠物题材的视频。视频簇中的视频的相关信息,例如视频的标题,可以保存在第一数据库中。第二数据库可以是宠物博主文章数据库,也可以是其它文章数据库,其中的文章可以是与视频簇中的视频内容有关的描述、评价或推荐文章。一般而言,这种文章的内容比较具有多样性和吸引力。根据本公开的实施例,可以基于萌宠视频簇中视频的标题和与萌宠视频相关的文章的特定内容,自动生成萌宠视频簇标题。这样生成的萌宠视频簇标题能够良好地匹配萌宠视频的标题,同时具有文章标题的多样性和吸引力,优于人工编辑或基于规则生成的视频簇标题。

图4示出了根据本公开实施例的商品簇标题生成装置的框图。

在图4中,商品簇标题生成装置400包括:

商品标题获取模块401,用于从第一数据库获取所述商品的标题;

文本特定内容获取模块402,用于从第二数据库获取与所述商品相关的文本的特定内容;

簇标题生成模块403,用于基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题。

其中,所述商品簇包含m个商品,m≥1。

根据本公开实施例,所述m个商品具有类似属性或具有相关属性或具有相同属性;和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

根据本公开实施例,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或所述获取与所述商品相关的文本的特定内容包括:根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,其中,p≤m,q≤m。

根据本公开实施例,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

根据本公开实施例,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

根据本公开实施例,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:按照第二预设规则从所述至少一个文本中选择一个或多个文本;将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

根据本公开实施例,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

根据本公开实施例,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:从与所述q个商品相关的文本的特定内容获得候选文本特定内容;基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

根据本公开实施例,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;对所述候选文本特定内容应用第二特征表示方法,得到第二向量;将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

根据本公开实施例,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或所述融合包括拼接。

根据本公开实施例,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

图5示出根据本公开实施例的计算机系统的结构框图。

如图5中所示,该计算机系统500可以包括一个或多个处理器501以及一个或多个存储器502。所述一个或多个存储器502用于存储一条或多条可执行指令,当所述可执行指令被所述一个或多个处理器501执行时,可以实现以下步骤:

一种商品簇标题生成方法,所述商品簇包含m个商品,m≥1,其特征在于,所述方法包括:从第一数据库获取所述商品的标题;从第二数据库获取与所述商品相关的文本的特定内容;基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述m个商品具有类似属性或具有相关属性或具有相同属性;和/或所述特定内容包括以下任意一项或多项的组合:标题、摘要、突出显示的内容、全部内容。

根据本公开实施例,所述获取所述商品的标题包括获取所述m个商品中的p个商品的标题;和/或所述获取与所述商品相关的文本的特定内容包括:根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本;基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,其中,p≤m,q≤m。

根据本公开实施例,所述根据与所述m个商品中的q个商品相关的检索关键词获取至少一个文本,包括:按照第一预设规则从与所述q个商品相关的检索关键词中选择检索关键词集合;使用所述检索关键词集合中的检索关键词获取所述至少一个文本。

根据本公开实施例,所述第一预设规则包括根据以下一项或多项的组合选择所述检索关键词集合:用户使用所述检索关键词的频率;所述检索关键词与对应商品的匹配度;用户查看和/或收藏和/或购买所述检索关键词检索到的商品的概率。

根据本公开实施例,所述基于所述至少一个文本获取与所述q个商品相关的文本的特定内容,包括:按照第二预设规则从所述至少一个文本中选择一个或多个文本;将所述一个或多个文本的特定内容作为与所述q个商品相关的文本的特定内容。

根据本公开实施例,所述第二预设规则包括根据以下一项或多项的组合选择所述一个或多个文本:所述文本的点击率排名;所述文本的发布时间;所述文本的作者排名。

根据本公开实施例,所述基于所述商品的标题和所述文本的特定内容,自动生成所述商品簇的商品簇标题,包括:基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和与所述q个商品相关的文本的特定内容,自动生成所述商品簇的商品簇标题,包括:从与所述q个商品相关的文本的特定内容获得候选文本特定内容;基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题。

根据本公开实施例,所述从与所述q个商品相关的文本的特定内容获得候选文本特定内容,包括根据以下一项或多项的组合选择所述候选文本特定内容:所述文本在不同商品分类下的概率分布与检索得到所述文本的检索关键词在所述不同商品分类下的概率分布的相似度;所述文本的特定内容的tf-idf得分;所述文本的特定内容的语言模型得分;所述文本的特定内容与检索得到所述文本的检索关键词的相关性得分;强制性排除规则。

根据本公开实施例,所述基于所述m个商品中的p个商品的标题和所述候选文本特定内容,自动生成所述商品簇的商品簇标题,包括:使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题。

根据本公开实施例,所述使用所述p个商品的标题和所述候选文本特定内容,通过训练好的文本生成器生成所述商品簇标题,包括:对所述p个商品的标题进行融合并应用第一特征表示方法,得到第一向量;对所述候选文本特定内容应用第二特征表示方法,得到第二向量;将所述第一向量和所述第二向量融合后进行解码,得到所述商品簇标题。

根据本公开实施例,所述对所述p个商品的标题进行融合并应用第一特征表示方法使用循环神经网络处理对所述p个商品的标题的融合结果;和/或所述对所述候选文本特定内容应用第二特征表示方法包括使用注意力机制或卷积神经网络或循环神经网络处理所述候选文本特定内容;和/或所述融合包括拼接。

根据本公开实施例,所述p个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品;和/或所述q个商品是所述m个商品中销量较高的商品或浏览量较大的商品或当前主推的商品。

当所述可执行指令被所述一个或多个处理器501执行时,可以实现以下步骤:

一种视频簇标题生成方法,所述视频簇包含m个视频,m≥1,其特征在于,所述方法包括:从第一数据库获取所述视频的标题;从第二数据库获取与所述视频相关的文本的特定内容;基于所述视频的标题和所述文本的特定内容,自动生成所述视频簇的视频簇标题。

图6示出根据本公开实施例适于商品簇生成方法的计算机体系架构的结构框图。

如图6所示,计算机系统600包括处理器(cpu)601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行上述方法。在ram603中,还存储有系统600操作所需的各种程序和数据。cpu601、rom602以及ram603通过总线604彼此相连。输入/输出(i/o)接口605也连接至总线604。

以下部件连接至i/o接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lam卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

另外,根据本公开的实施方式,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行上述方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。

根据本公开的实施例,可以采用一个如上文描述的计算机体系架构来实现根据本公开实施例的方法,也可以采用多个如上文描述的计算机体系架构彼此协作来实现根据本公开实施例的方法。

附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过可编程硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施方式中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1