信息推荐模型训练方法和装置、信息推荐方法和装置与流程

文档序号:20192178发布日期:2020-03-27 19:46阅读:102来源:国知局
信息推荐模型训练方法和装置、信息推荐方法和装置与流程

本公开涉及信息处理领域,特别涉及一种信息推荐模型训练方法和装置、信息推荐方法和装置。



背景技术:

广告推荐从推荐内容的产生方法上,可以分为基于规则和基于机器学习的广告推荐方法。基于规则的方法需要在投放广告前人工定义一系列的投放规则,如投放给男性用户、学生等。这类方法由于根据预定的投放规则进行投放,因此缺乏灵活性和准确性。基于机器学习的广告推荐方法主要选择用户画像、历史行为等特征作为学习模型的输入,以选择与用户匹配度最高的广告。这类方法由于忽略了用户看广告时所处的场景,即忽略了用户看广告的时间和地点等信息,而用户通常在不同的时间和地点对广告内容的需求也会有所不同。因此在忽略用户场景信息的情况下,无法实现精准的广告投放。



技术实现要素:

本公开提供一种信息推荐模型训练方案和相应的信息推荐方案。通过利用用户的场景特征,以便实现信息的精准投放。

根据本公开实施例的第一方面,提供一种信息推荐模型训练方法,包括:提取用户历史行为特征信息和用户属性信息,其中所述用户历史行为特征信息包括与用户行为相关联的历史场景特征信息;利用嵌入层分别对所述历史场景特征信息和用户属性信息进行转换处理,以得到对应的历史场景特征向量和用户属性特征向量;利用所述历史场景特征向量和用户属性特征向量对深度学习模型进行训练,以得到信息推荐模型。

在一些实施例中,所述历史场景特征信息包括用户行为的发生时段、行为发生所在地、行为发生所在兴趣点类型、以及行为发生地与用户常驻地距离中的至少一项。

在一些实施例中,所述用户属性信息包括用户画像和用户统计信息中的至少一项。

在一些实施例中,上述方法还包括:根据所述用户属性信息与所述用户属性特征向量之间的映射关系,生成用户特征索引表。

在一些实施例中,上述方法还包括:根据所述历史场景特征信息与所述历史场景特征向量之间的映射关系,生成向量嵌入索引表。

根据本公开实施例的第二方面,提供一种信息推荐模型训练装置,包括:提取模块,被配置为提取用户历史行为特征信息和用户属性信息,其中所述用户历史行为特征信息包括与用户行为相关联的历史场景特征信息;转换处理模块,被配置为利用嵌入层分别对所述历史场景特征信息和用户属性信息进行转换处理,以得到对应的历史场景特征向量和用户属性特征向量;训练模块,被配置为利用所述历史场景特征向量和用户属性特征向量对深度学习模型进行训练,以得到信息推荐模型。

根据本公开实施例的第三方面,提供一种信息推荐模型训练装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的信息推荐模型训练方法。

根据本公开实施例的第四方面,提供一种信息推荐方法,包括:从用户发送的信息推荐请求中提取出用户标识和当前场景特征信息;获取与所述用户标识相关联的用户属性特征向量;将所述当前场景特征信息转换为对应的当前场景特征向量;利用经上述任一实施例所述的信息推荐模型对所述用户属性特征向量和所述当前场景特征向量进行处理,以得到与所述用户的当前场景相匹配的推荐信息。

在一些实施例中,获取与所述用户标识相关联的用户属性特征向量包括:根据上述任一实施例所述的用户特征索引表,获取与所述用户标识相关联的用户属性特征向量。

在一些实施例中,将所述当前场景特征信息转换为对应的当前场景特征向量包括:根据上述任一实施例所述的向量嵌入索引表,获取与所述用户的当前场景特征信息相对应的当前场景特征向量。

根据本公开实施例的第五方面,提供一种信息推荐装置,包括:提取模块,被配置为从用户发送的信息推荐请求中提取出用户标识和当前场景特征信息;第一特征向量获取模块,被配置为获取与所述用户标识相关联的用户属性特征向量;第二特征向量获取模块,被配置为将所述当前场景特征信息转换为对应的当前场景特征向量;信息处理模块,被配置为利用经上述任一实施例所述的信息推荐模型对所述用户属性特征向量和所述当前场景特征向量进行处理,以得到与所述用户的当前场景相匹配的推荐信息。

根据本公开实施例的第六方面,提供一种信息推荐装置,包括:存储器,被配置为存储指令;处理器,耦合到存储器,处理器被配置为基于存储器存储的指令执行实现如上述任一实施例所述的信息推荐方法。

根据本公开实施例的第七方面,提供一种计算机可读存储介质,其中,计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如上述任一实施例涉及的方法。

通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本公开一个实施例的信息推荐模型训练方法的流程示意图;

图2为本公开一个实施例的信息推荐模型训练装置的结构示意图;

图3为本公开另一个实施例的信息推荐模型训练装置的结构示意图;

图4为本公开一个实施例的信息推荐方法的流程示意图;

图5为本公开一个实施例的信息推荐装置的结构示意图;

图6为本公开另一个实施例的信息推荐装置的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

图1为本公开一个实施例的信息推荐模型训练方法的流程示意图。在一些实施例中,下列的信息推荐模型训练方法步骤由信息推荐模型训练装置执行。

在步骤101,提取用户历史行为特征信息和用户属性信息,其中所述用户历史行为特征信息包括与用户行为相关联的历史场景特征信息。

在一些实施例中,历史场景特征信息包括用户行为的发生时段、行为发生所在地、行为发生所在兴趣点类型、以及行为发生地与用户常驻地距离中的至少一项。

例如,某个用户在周六晚上11点对某个物品进行浏览、收藏、搜索、购买等操作,则将周六晚上10-12点作为用户行为的发生时段。

此外,行为发生所在地可为用户当前所在地的编码,如邮政编码。

行为发生所在兴趣点(poi,pointofinterest)类型为行为发生所在区域的类型,如住宅、办公场所、商场、学校等。

用户常驻地可设置为用户晚上最常出现的地理位置。行为发生地与用户常驻地的距离为一个浮点数。可将距离按预定长度进行分桶处理,例如距离可分为单位为公里的[0,10)、[10,30)、[30,100)、[100,¥)4个桶。由此将距离转换为一个类型变量,根据实际距离落在哪个分桶中以确定该类型变量的取值。

在一些实施例中,用户属性信息包括用户画像和用户统计信息中的至少一项。

例如,用户画像包括用户的性别、年龄、职业、收入等。统计特征信息包括用户的一些历史统计数据,例如过去一年的总消费、浏览过多少次不同类型的物品等。

在步骤102,利用嵌入层分别对历史场景特征信息和用户属性信息进行转换处理,以得到对应的历史场景特征向量和用户属性特征向量。

这里需要说明的是,由于历史场景特征信息和用户属性信息的特点是维度高且非常稀疏。为了降低数据维度以减小存储空间,并提高计算速度,以提升模型的泛化能力,需要利用嵌入(embedding)层进行转换处理。由于嵌入层本身与本公开的发明点无关,因此这里不展开描述。

例如,历史场景特征信息包括用户行为的发生时段time、行为发生所在地city、行为发生所在兴趣点类型poi、以及行为发生地与用户常驻地距离dist。经过嵌入层处理后,得到发生时段向量etime、行为发生所在地向量ecity、行为发生所在兴趣点类型epoi、以及行为发生地与用户常驻地距离edist。则场景特征由scene=(time,city,poi,dist)变换为escene=(etime,ecity,epoi,edist)。

此外,将用户画像profile经过嵌入层处理后得到用户画像向量eprofile。将物品标识item经过嵌入层处理后得到物品标识向量eitem。则用户请求信息u=([],profile,stat)变换为。其中[]为包括场景信息的用户行为列表。

这里需要说明的是,由于用户统计信息的稀疏情况并不严重,因此可不利用嵌入层对用户统计信息stat进行处理。

在步骤103,利用历史场景特征向量和用户属性特征向量对深度学习模型进行训练,以得到信息推荐模型。

在一些实施例中,根据用户属性信息与用户属性特征向量之间的映射关系,生成用户特征索引表。还可根据历史场景特征信息与场景特征向量之间的映射关系,生成向量嵌入索引表。

通过生成用户特征索引表和向量嵌入索引表,以便在使用信息推荐模型给用户在线推荐信息时,通过查询相应索引表就能够得到用户属性特征向量和用户当前场景的特征向量,以提高在线处理的速度。

例如,可在索引表中以键值对(key:value)的方式存储相关信息。例如:

time索引:(时间段id:etime)

city索引:(城市id:ecity)

poi索引:(poi类型id:epoi)

dist索引:(dist分桶:edist)

profile索引:(profileid:eprofile)

物品id索引:(物品id:eitem)

用户索引:(用户id:eu)

图2为本公开一个实施例的信息推荐模型训练装置的结构示意图。如图2所示,信息推荐模型训练装置包括提取模块21、转换处理模块22和训练模块23。

提取模块21被配置为提取用户历史行为特征信息和用户属性信息,其中用户历史行为特征信息包括与用户行为相关联的历史场景特征信息。

在一些实施例中,历史场景特征信息包括用户行为的发生时段、行为发生所在地、行为发生所在兴趣点类型、以及行为发生地与用户常驻地距离中的至少一项。

在一些实施例中,用户属性信息包括用户画像和用户统计信息中的至少一项。

转换处理模块22被配置为利用嵌入层分别对历史场景特征信息和用户属性信息进行转换处理,以得到对应的历史场景特征向量和用户属性特征向量。

这里需要说明的是,由于历史场景特征信息和用户属性信息的特点是维度高且非常稀疏。为了降低数据维度以减小存储空间,并提高计算速度,以提升模型的泛化能力,需要利用嵌入(embedding)层进行转换处理。

训练模块23被配置为利用历史场景特征向量和用户属性特征向量对深度学习模型进行训练,以得到信息推荐模型。

在一些实施例中,转换处理模块22还被配置为组训练结束后,根据用户属性信息与用户属性特征向量之间的映射关系,生成用户特征索引表。还可根据场景特征信息与场景特征向量之间的映射关系,生成向量嵌入索引表。

图3为本公开另一个实施例的信息推荐模型训练装置的结构示意图。如图3所示,信息推荐模型训练装置包括存储器31和处理器32。

存储器31用于存储指令,处理器32耦合到存储器31,处理器32被配置为基于存储器存储的指令执行实现如图1中任一实施例涉及的方法。

如图3所示,该装置还包括通信接口33,用于与其它设备进行信息交互。同时,该装置还包括总线34,处理器32、通信接口33、以及存储器31通过总线34完成相互间的通信。

存储器31可以包含高速ram存储器,也可还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。存储器31也可以是存储器阵列。存储器31还可能被分块,并且块可按一定的规则组合成虚拟卷。

此外处理器32可以是一个中央处理器cpu,或者可以是专用集成电路asic,或是被配置成实施本公开实施例的一个或多个集成电路。

本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图1中任一实施例涉及的方法。

图4为本公开一个实施例的信息推荐方法的流程示意图。在一些实施例中,下列的信息推荐方法步骤由信息推荐装置执行。

在步骤401,从用户发送的信息推荐请求中提取出用户标识和当前场景特征信息。

在一些实施例中,当前场景特征信息包括用户行为的发生时段、行为发生所在地、行为发生所在兴趣点类型、以及行为发生地与用户常驻地距离中的至少一项。

在步骤402,获取与用户标识相关联的用户属性特征向量。

例如,可根据用户标识查询该用户的用户属性信息,再将用户属性信息进行转换处理,以生成用户属性特征向量。此外,还可利用上述实施例所生成的用户特征索引表查询出该用户的用户属性特征向量,以有效减小在线服务的计算量,提高响应速度。

在步骤403,将当前场景特征信息转换为对应的当前场景特征向量。

例如,可对当前场景特征信息进行转换处理,以生成对应的场景特征向量。此外,还可利用上述实施例所生成的向量嵌入索引表,以生成对应的场景特征向量,以有效减小在线服务的计算量,提高响应速度。

在步骤404,利用经过训练的信息推荐模型对用户属性特征向量和当前场景特征向量进行处理,以得到与用户的当前场景相匹配的推荐信息。

这里采用图1所训练的信息推荐模型进行处理。例如,信息推荐模型根据输入的用户属性特征向量和当前场景特征向量,以计算出在用户的当前场景下,每个物品的推荐概率。进而通过对推荐概率按照从大到小的顺序进行排列,以便将推荐概率最大的一个或多个物品信息推荐给用户。

例如,信息推荐模型包括cnn(convolutionalneuralnetwork,卷积神经网络),用于对输入的用户属性特征向量和当前场景特征向量进行处理。此外,信息推荐模型还包括softmax层,用于对cnn的输出进行相应的分类处理,以得到在用户的当前场景下,每个物品的推荐概率。

图5为本公开一个实施例的信息推荐装置的结构示意图。如图5所示,信息推荐装置包括提取模块51、第一特征向量获取模块52、第二特征向量获取模块53和信息处理模块54。

提取模块51被配置为从用户发送的信息推荐请求中提取出用户标识和当前场景特征信息。

在一些实施例中,场景特征信息包括用户行为的发生时段、行为发生所在地、行为发生所在兴趣点类型、以及行为发生地与用户常驻地距离中的至少一项。

第一特征向量获取模块52被配置为获取与用户标识相关联的用户属性特征向量。

例如,可根据用户标识查询该用户的用户属性信息,再将用户属性信息进行转换处理,以生成用户属性特征向量。此外,还可利用上述实施例所生成的用户特征索引表查询出该用户的用户属性特征向量,以有效减小在线服务的计算量,提高响应速度。

第二特征向量获取模块53被配置为将当前场景特征信息转换为对应的当前场景特征向量。

例如,可对当前场景特征信息进行转换处理,以生成对应的场景特征向量。此外,还可利用上述实施例所生成的向量嵌入索引表,以生成对应的场景特征向量,以有效减小在线服务的计算量,提高响应速度。

信息处理模块54被配置为利用经训练的信息推荐模型对用户属性特征向量和当前场景特征向量进行处理,以得到与用户的当前场景相匹配的推荐信息。

这里采用图1所训练的信息推荐模型进行处理。例如,信息推荐模型根据输入的用户属性特征向量和当前场景特征向量,以计算出在用户的当前场景下,每个物品的推荐概率。进而通过对推荐概率按照从大到小的顺序进行排列,以便将推荐概率最大的一个或多个物品信息推荐给用户。

图6为本公开另一个实施例的信息推荐装置的结构示意图。如图6所示,信息推荐装置包括存储器61、处理器62、通信接口63和总线64。图6与图3的不同之处在于,在图6所示实施例中,处理器62被配置为基于存储器存储的指令执行实现如图4中任一实施例涉及的方法。

本公开同时还涉及一种计算机可读存储介质,其中计算机可读存储介质存储有计算机指令,指令被处理器执行时实现如图4中任一实施例涉及的方法。

在一些实施例中,在上面所描述的功能单元模块可以实现为用于执行本公开所描述功能的通用处理器、可编程逻辑控制器(programmablelogiccontroller,简称:plc)、数字信号处理器(digitalsignalprocessor,简称:dsp)、专用集成电路(applicationspecificintegratedcircuit,简称:asic)、现场可编程门阵列(field-programmablegatearray,简称:fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件或者其任意适当组合。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1