点击率确定方法、装置及设备与流程

文档序号:22047343发布日期:2020-08-28 18:56阅读:115来源:国知局
点击率确定方法、装置及设备与流程
本发明实施例涉及计算机
技术领域
,尤其涉及一种点击率确定方法、装置及设备。
背景技术
:在电子商务平台中,用户可以输入搜索词进行商品搜索,电子商务平台可以根据用户输入的搜索词向用户展示对象信息,例如,对象信息可以为商品信息或者广告信息等。在现有技术中,在用户输入搜索词之后,电子商务平台可以获取搜索词对应的多个对象信息,根据对象信息获取每个对象信息的点击率,并向用户推荐点击率较高的对象信息,对象信息的点击率是指对象信息被点击查看的概率。然而,在上述过程中,不同用户对同一对象的关注点不同,导致根据对象信息无法准确的获取对象信息的点击率,导致确定点击率的准确性较差。技术实现要素:本发明实施例提供一种点击率确定方法、装置及设备,提高了确定点击率的准确性。第一方面,本发明实施例提供一种点击率确定方法,包括:获取第一对象的对象信息,所述第一对象为待向用户推荐的对象,所述对象信息包括所述第一对象的图像和所述第一对象的文本描述信息;根据所述用户的用户特征信息和所述对象信息,确定所述用户点击查看所述第一对象的点击率,所述点击率用于指示所述用户点击查看所述第一对象的概率。在一种可能的实施方式中,根据所述用户的用户特征信息和所述对象信息,确定所述用户点击所述第一对象的点击率,包括:获取预估模型,所述预估模型包括第一模型和第二模型;通过所述第一模型对所述用户特征信息和所述文本描述信息进行处理,得到所述第一模型的输出结果;通过所述第二模型对所述图像进行处理,得到第二模型的输出结果;根据所述第一模型的输出结果和所述第二模型的输出结果,得到所述点击率。在一种可能的实施方式中,所述第二模型的输出结果包括所述图像的图像特征、所述图像关联的用户特征、所述图像关联的搜索关键词。在一种可能的实施方式中,所述通过所述第二模型对所述图像进行处理,得到所述第二模型的输出结果,包括:获取第一对应关系,所述第一对应关系中包括多个商品标识和每个商品标识对应的所述第二模型的输出结果,所述第一对应关系为根据所述第二模型预先生成的;获取所述第一对象对应的商品标识;根据所述第一对象对应的商品标识和所述第一对应关系,确定所述第二模型的输出结果。在一种可能的实施方式中,所述第一模型包括第一子模型和第二子模型;所述通过所述第一模型对所述用户特征信息和所述文本描述信息进行处理,得到所述第一模型的输出结果,包括:通过所述第一子模型获取所述用户特征信息和所述文本描述信息对应的第一向量;在所述用户特征信息和所述文本描述信息中确定第一类型的特征信息和第二类型的特征信息,所述第一类型的特征信息为在所述预估模型对应的样本数据中的出现频次大于或等于预设频次的特征信息,所述第二类型的特征信息为在所述预估模型对应的样本数据中的出现频次小于所述预设频次的特征信息;通过所述第二子模型获取所述第一类型的特征对应的第二向量和所述第二类型的特征对应的第三向量,所述第一模型的输出结果包括所述第一向量、所述第二向量和所述第三向量。在一种可能的实施方式中,所述根据所述第一模型的输出结果和所述第二模型的输出结果,得到所述点击率,包括:获取所述第二模型的输出结果对应的第四向量;根据所述第三向量、所述第三向量对应的权重矩阵、所述第四向量和所述第四向量对应的权重矩阵,确定得到第五向量;对所述第三向量和所述第五向量进行拼接处理,得到第六向量;根据所述第一向量和所述第六向量,确定所述点击率。在一种可能的实施方式中,所述根据所述第一向量和所述第六向量,确定所述点击率,包括:根据所述第一向量对应的权重向量,确定第一输出值;根据所述第六向量对应的权重向量,确定第二输出值;根据所述第一输出值、所述第二输出值和预设激活函数,确定所述点击率。在一种可能的实施方式中,所述获取预估模型之前,还包括:获取多组样本数据,每组样本数据包括样本用户特征信息、样本对象信息和样本点击率;根据所述多组样本数据,生成所述预估模型。在一种可能的实施方式中,所述多组样本数据包括多组第一样本数据,每组第一样本数据包括样本搜索关键词和所述样本搜索关键词对应的样本图像;所述根据所述多组样本数据,生成所述预估模型,包括:根据所述多组第一样本数据,生成初始第二模型,所述初始第二模型具有确定图像关联的搜索关键词的功能;根据所述多组样本数据和所述初始第二模型,生成所述预估模型。在一种可能的实施方式中,获取第一对象的对象信息之前,还包括:获取所述用户输入的搜索词;根据所述搜索词,确定所述第一对象。在一种可能的实施方式中,所述第一对象为商品或广告中的至少一种。在一种可能的实施方式中,所述第一模型为宽度深度模型,所述第一子模型为宽度模型,所述第二子模型为深度模型。在一种可能的实施方式中,所述第二模型为卷积神经网络模型。第二方面,本发明实施例提供一种点击率确定装置,包括获取模块和第一确定模块,其中,所述获取模块用于,获取第一对象的对象信息,所述第一对象为待向用户推荐的对象,所述对象信息包括所述第一对象的图像和所述第一对象的文本描述信息;所述第一确定模块用于,根据所述用户的用户特征信息和所述对象信息,确定所述用户点击查看所述第一对象的点击率,所述点击率用于指示所述用户点击查看所述第一对象的概率。在一种可能的实施方式中,所述第一确定模块具体用于:获取预估模型,所述预估模型包括第一模型和第二模型;通过所述第一模型对所述用户特征信息和所述文本描述信息进行处理,得到所述第一模型的输出结果;通过所述第二模型对所述图像进行处理,得到第二模型的输出结果;根据所述第一模型的输出结果和所述第二模型的输出结果,得到所述点击率。在一种可能的实施方式中,所述第二模型的输出结果包括所述图像的图像特征、所述图像关联的用户特征、所述图像关联的搜索关键词。在一种可能的实施方式中,所述第一确定模块具体用于:获取第一对应关系,所述第一对应关系中包括多个商品标识和每个商品标识对应的所述第二模型的输出结果,所述第一对应关系为根据所述第二模型预先生成的;获取所述第一对象对应的商品标识;根据所述第一对象对应的商品标识和所述第一对应关系,确定所述第二模型的输出结果。在一种可能的实施方式中,所述第一模型包括第一子模型和第二子模型;所述第一确定模块具体用于:通过所述第一子模型获取所述用户特征信息和所述文本描述信息对应的第一向量;在所述用户特征信息和所述文本描述信息中确定第一类型的特征信息和第二类型的特征信息,所述第一类型的特征信息为在所述预估模型对应的样本数据中的出现频次大于或等于预设频次的特征信息,所述第二类型的特征信息为在所述预估模型对应的样本数据中的出现频次小于所述预设频次的特征信息;通过所述第二子模型获取所述第一类型的特征对应的第二向量和所述第二类型的特征对应的第三向量,所述第一模型的输出结果包括所述第一向量、所述第二向量和所述第三向量。在一种可能的实施方式中,所述第一确定模块具体用于:获取所述第二模型的输出结果对应的第四向量;根据所述第三向量、所述第三向量对应的权重矩阵、所述第四向量和所述第四向量对应的权重矩阵,确定得到第五向量;对所述第三向量和所述第五向量进行拼接处理,得到第六向量;根据所述第一向量和所述第六向量,确定所述点击率。在一种可能的实施方式中,所述第一确定模块具体用于:根据所述第一向量对应的权重向量,确定第一输出值;根据所述第六向量对应的权重向量,确定第二输出值;根据所述第一输出值、所述第二输出值和预设激活函数,确定所述点击率。在一种可能的实施方式中,所述装置还包括生成模块,其中,所述生成模块用于,在所述第一确定模块获取预估模型之前,获取多组样本数据,并根据所述多组样本数据,生成所述预估模型,每组样本数据包括样本用户特征信息、样本对象信息和样本点击率。在一种可能的实施方式中,所述多组样本数据包括多组第一样本数据,每组第一样本数据包括样本搜索关键词和所述样本搜索关键词对应的样本图像;所述生成模块具体用于:根据所述多组第一样本数据,生成初始第二模型,所述初始第二模型具有确定图像关联的搜索关键词的功能;根据所述多组样本数据和所述初始第二模型,生成所述预估模型。在一种可能的实施方式中,所述装置还包括第二确定模块,其中,所述第二确定模块用于,在所述获取模块获取第一对象的对象信息之前,获取所述用户输入的搜索词,并根据所述搜索词,确定所述第一对象。在一种可能的实施方式中,所述第一对象为商品或广告中的至少一种。在一种可能的实施方式中,所述第一模型为宽度深度模型,所述第一子模型为宽度模型,所述第二子模型为深度模型。在一种可能的实施方式中,所述第二模型为卷积神经网络模型。第三方面,本发明实施例提供一种点击率确定装置,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如第一方面任一项所述的点击率确定方法。第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面任一项所述的点击率确定方法。本发明实施例提供的点击率确定方法,在确用户点击第一对象的点击率时,获取第一对象的对象信息和用户的用户特征信息,并根据用户特征信息和对象信息,确定用户点击查看第一对象的点击率。在上述过程中,不但参考了第一对象的对象信息,还参考了用户的用户特征信息,使得确定得到的点击率更加准确,提高了确定点击率的准确性。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的点击率确定方法的应用场景示意图;图2为本发明实施例提供的点击率确定方法的流程示意图;图3为本发明实施例提供的生成预估模型方法的流程示意图;图4为本发明实施例提供的预估模型训练过程示意图;图5为本发明实施例提供通过预估模型确定点击率方法的流程示意图;图6为本发明实施例提供的一种点击率确定装置的结构示意图;图7为本发明实施例提供的另一种点击率确定装置的结构示意图;图8为本发明实施例提供的点击率确定装置的硬件结构示意图。具体实施方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。图1为本发明实施例提供的点击率确定方法的应用场景示意图。请参见图1,电子设备(例如手机、电脑等设备)中安装有应用程序(例如购物应用程序等),用户可以通过应用程序在电子设备中输入搜索词,例如,用户可以通过输入框p在电子设备中输入搜索词。电子设备可以根据搜索词向服务器请求对象信息,服务器可以先确定搜索词对应的待推荐对象,并根据用户的用户特征信息和待推荐对象的对象信息确定用户点击待推荐对象的点击率,该点击率为用户点击查看待推荐对象的概率,服务器可以优先向用户推荐点击率较高的对象,对象可以为商品、广告等,例如,请参见图1,电子设备显示的第1、2和4个对象为商品,第3个对象为广告。对象的对象信息通常包括图像和文字描述信息,例如,请参见图1,电子设备显示的第二个对象中包括图像m和文字描述信息n。需要说明的是,图1只是以示例的形式示意一种应用场景,并非对应用场景的限定,在实际应用过程中,可以根据实际需要设置应用场景,本发明实施例对此不作具体限定。在本申请中,针对任意一个第一对象,确定用户点击查看第一对象的点击率时,可以根据用户的用户特征信息和第一对象的对象信息确定用户点击查看第一对象的点击率。在确定点击率的过程中,不但参考了第一对象的对象信息,还参考了用户的用户特征信息,使得确定得到的点击率更加准确,提高了确定点击率的准确性。下面,通过具体实施例对本申请所示的技术方案进行详细说明。需要说明的是,下面几个具体实施例可以相互结合,对于相同或相似的内容,在不同的实施例中不再进行重复说明。图2为本发明实施例提供的点击率确定方法的流程示意图。请参见图2,该方法可以包括:s201、获取第一对象的对象信息,第一对象为待向用户推荐的对象,对象信息包括第一对象的图像和第一对象的文本描述信息。本发明实施例的执行主体可以服务器,也可以为设置在服务器中的点击率确定装置。点击率确定装置可以通过软件实现,也可以通过软件和硬件的结合实现。可选的,第一对象可以为商品、广告等。相应的,第一对象的对象信息可以为商品信息、广告信息等。可选的,第一对象可以为服务器根据用户输入的搜索词确定得到的。例如,服务器获取得到搜索词之后,可以根据搜索词进行对象匹配,以确定得到第一对象。可选的,第一对象的图像用于以图像的方式直观的描述第一对象。第一对象的文本信息用于以文本的方式描述第一对象。例如,当第一对象为商品时,第一对象的文本描述可以包括商品的名称、商品的价格、商品的评价数量、商品的好评率等。例如,请参见图1,电子设备显示的第二个对象的图像为图像m,第二个对象的文本描述信息包括“bb连衣裙2019新款,269元、1318条评价、98好评”。s202、根据用户的用户特征信息和对象信息,确定用户点击查看第一对象的点击率,点击率用于指示用户点击查看第一对象的概率。可选的,用户特征信息可以包括用户的账号信息、用户年龄、用户性别、用户的购买力、用户的历史购买记录、用户本次输入的搜索词等。当然,用户特征信息还可以包括其它内容,本发明实施例对此不作具体限定。可选的,第一对象的对象信息可以包括第一对象的详情页面的链接,用户可以对第一对象的对象信息进行点击操作,以使电子设备显示第一对象的详情页面,第一对象的详情页面中包括第一对象的详情信息。用户点击查看第一对象是指用户对第一对象的对象信息进行点击操作,以使电子设备显示第一对象的详情信息。可选的,可以预先训练得到预估模型,预估模型包括第一模型和第二模型;通过第一模型对用户特征信息和文本描述信息进行处理,得到第一模型的输出结果,通过第二模型对图像进行处理,得到第二模型的输出结果。并根据第一模型的输出结果和第二模型的输出结果,得到点击率。可选的,第一模型可以为宽度深度模型(wide-deep模型)。第一模型可以包括第一子模型和第二子模型,第一子模型为宽度模型(wide模型),第二子模型为深度模型(deep模型)。可选的,第二模型为卷积神经网络(convolutionalneuralnetworks,cnn)模型。需要说明的是,在图3所示的实施例中,对生成预估模型的过程进行详细说明,在图4所示的实施例中,对通过预估模型确定点击率的过程进行详细说明,此处不再进行赘述。本发明实施例提供的点击率确定方法,在确用户点击第一对象的点击率时,获取第一对象的对象信息和用户的用户特征信息,并根据用户特征信息和对象信息,确定用户点击查看第一对象的点击率。在上述过程中,不但参考了第一对象的对象信息,还参考了用户的用户特征信息,使得确定得到的点击率更加准确,提高了确定点击率的准确性。在上述任意一个实施例的基础上,下面,结合图3,对生成预估模型的过程进行详细说明。图3为本发明实施例提供的生成预估模型方法的流程示意图。请参见图3,该方法可以包括:s301、获取多组样本数据。其中,每组样本数据包括样本用户特征信息、样本对象信息和样本点击率。可选的,可以根据多个用户的历史时段查看的对象信息确定样本数据。例如,假设用户1在历史时段输入搜索词1,电子设备展示的对象为对象1-对象5,用户对对象2进行了点击操作,以查看了对象2的详情信息,据此,可以确定5组样本数据,该5组样本数据可以如表1所示:表1需要说明的是,表1只是以示例的形式示意5组样本数据,并非对样本数据的限定。在实际应用过程中,获取的样本数据的组数可以为几千组、几万组等。其中,多组样本数据中包括多组第一样本数据,每组第一样本数据包括样本搜索关键词和样本搜索关键词对应的样本图像。在本发明实施例中,搜索词是指用户在电子设备中输入的词汇,一个搜索词包括一个或多个搜索关键词。例如,假设用户在电子设备中输入“红色的连衣裙”,则搜索词为“红色的连衣裙”,该搜索词中包括的搜索关键词为:“红色”和“连衣裙”。可选的,可以根据用户在历史时段输入的搜索词、以及用户在该搜索词下查看的对象信息中包括的图像确定多组第一样本数据。例如,多组第一样本数据可以如表2所示:表2搜索关键词图像搜索关键词1、搜索关键词2图像1搜索关键词1、搜索关键词3图像2搜索关键词4图像3…………请参见图2,当用户输入的搜索词中包括搜索关键词1和搜索关键词2时,用户点击的对象信息中包括的图像为图像1。当用户输入的搜索词中包括搜索关键词1和搜索关键词3时,用户点击的对象信息中包括的图像为图像2。当用户输入的搜索词中包括搜索关键词4时,用户点击的对象信息中包括的图像为图像3。s302、根据多组第一样本数据,生成初始第二模型。其中,初始第二模型具有确定图像关联的搜索关键词的功能。图像关联的搜素关键词可以为一个或者多个。可选的,一个图像关联的搜索关键词是指,在用户输入的搜索关键词为该搜索关键词时,用户对包括该图像的对象信息进行点击查看的概率较高。例如,假设图像1关联的搜索关键词为关键词1,假设用户输入的搜索关键词为关键词1,在电子设备显示关键词1对应的对象信息时,用户对包括图像1的对象信息进行点击的概率较大。可选的,可以根据多组第一样本数据对卷积神经网络进行训练,以得到初始第二模型。在训练卷积神经网络时,可以根据多组第一样本数据,统计每个搜索关键词的出现次数,并获取在多组第一样本数据中获取出现次数大于预设阈值的搜索关键词。根据出现次数大于预设阈值的搜索关键词生成关键词词典,其中,关键词词典中包括出现次数大于预设阈值的搜索关键词。可选的,关键词词典中还可以包括搜索关键词对应的类型,其中,每个搜索关键词对应的类型不同,一个搜索关键词对应一个类型,一个搜索关键词的类型可以为对该搜索关键词的编号等。通过上述训练过程得到的初始第二模型具有确定图像关联的搜索关键词的功能,即,向初始第二模型中输出一个图像,初始第二模型可以输出该图像关联的搜索关键词。s303、根据多组样本数据和初始第二模型,生成预估模型。可选的,可以根据多组样本数据,对初始第二模型和原始的第一模型进行训练,以得到预估模型,预估模型可以包括第一模型和第二模型。可选的,原始的第一模型是指未经过训练的模型。训练完成的第二模型具有确定图像的图像特征、图像关联的用户特征、图像关联的搜索关键词的功能,即,向第二模型中输入一个图像之后,第二模型可以输出该图像的图像特征图像关联的用户特征、图像关联的搜索关键词。在图3所示的实施例中,下面,以第一模型为宽度深度模型(wide-deep模型)、第二模型为cnn模型为例,结合图4,对生成预估模型的过程进行说明。图4为本发明实施例提供的预估模型训练过程示意图。请参见图4,第一模型为wide-deep模型,wide-deep模型中包括wide模型和deep模型,第二模型为cnn模型。训练预估模型的过程包括正向传播过程和反向传播过程。可选的,对预估模型进行离线训练的框架可以采用tensorflow的参数服务器(parameterserver)架构。模型参数存储在训练服务器(server)上,训练服务器可以为具有中央处理器(centralprocessingunit,cpu)的机器。训练过程可以由计算(worker)端实现,worker端为具有图形处理器(graphicsprocessingunit,gpu)的机器。在训练过程中,worker端从server获取最新的模型参数,再并行地在本机的多个gpu卡上前向、反向传播,然后整合多个gpu卡上的梯度,最后调用优化算法将整合了的梯度回传server。各worker之间采用异步更新策略。在训练图4所示的模型之前,先对cnn模型进行预训练,其中,预训练cnn模型的过程可以参见s302,此处不再进行赘述。在对cnn模型预训练完成之后,对图4所示的模型执行前向传播过程,其中,前向传播过程如下:将样本数据中的样本用户特征信息和样本文本描述信息输入至wide模型,wide模型根据输入确定输出1,wide模型的作用用于快速记忆长尾稀疏特征,长尾稀疏特征是指在样本数据中出现次数较少的特征。在样本用户特征信息和样本文本描述信息中确定泛化特征信息和特化特征信息,其中,泛化特征信息还可以称为第一类型的特征信息,第一类型的特征信息为在预估模型对应的样本数据中的出现频次大于或等于预设频次的特征信息,特化特征信息还可以称为第二类型的特征信息,第二类型的特征信息为在预估模型对应的样本数据中的出现频次小于预设频次的特征信息。并将泛化特征信息和特化特征信息分别输入至deep模型,deep模型对泛化特征信息进行处理得到输出2,deep模型对特化特征信息进行处理得到输出3。cnn模型为经过预训练的模型,即,cnn模型具有确定图像关联的搜索关键词的功能,将样本数据中的样本图像输入至cnn模型,cnn模型对样本图像进行处理得到输出4,其中,输出4中包括样本图像的图像特征和搜索关键字。需要说明的是,由于cnn模型的层数较多、计算复杂,因此,对cnn模型的训练是整个网络的计算瓶颈。为了提高cnn模型的训练效率,可以根据商品标识对样本数据进行分类,得到同一个商品标识对应的多个样本数据,由于同一商品标识对应的图像一样,因此,针对一个商品标识对应的多个样本数据,仅需计算一次cnn模型的输出即可,再将cnn模型的输出复制多分,作为cnn模型对该商品标识对应的其它样本数据的输出,这样,可以减少cnn模型的运算量,进而提高预估预估模型的训练效率。对输出3和输出4进行特征融合,并对输出2和特征融合后的特征进行特征拼接,并根据输出1和特征拼接的结果确定点击率。通过将输出3和输出4进行特征融合,可以提高特性特征的泛化特性。需要说明的是,在图5所示的实施例中,对特征融合、特征拼接的过程进行说明,此处不再进行赘述。根据确定得到的点击率和样本点击率进行反向传播,以优化wide模型、deep模型和cnn模型中的权重值。在反向传播过程中,依据特化特征信息对cnn模型的权重值进行更新。由于特化特征信息中包括用户特征信息,因此,最终生成的cnn模型依赖于用户特征信息。由上可知,cnn模型的训练依赖于用户特征信息和搜索关键词,使得cnn模型可以将用户特征信息和图像相关联,进而使得预估模型可以根据关联的用户特征信息和图像确定点击率,进而提高确定点击率的准确性。重复执行上述过程,直至wide模型、deep模型和cnn模型收敛时,得到预估模型。在上述任意一个实施例的基础上,下面,结合图5,对通过预估模型确定点击率的过程进行详细说明。图5为本发明实施例提供通过预估模型确定点击率方法的流程示意图。请参见图5,该方法可以包括:s501、通过第一子模型获取用户特征信息和文本描述信息对应的第一向量。其中,第一向量用户描述用户特征信息和文本描述信息。s502、在用户特征信息和文本描述信息中确定第一类型的特征信息和第二类型的特征信息。其中,第一类型的特征信息为在预估模型对应的样本数据中的出现频次大于或等于预设频次的特征信息,第二类型的特征信息为在预估模型对应的样本数据中的出现频次小于预设频次的特征信息。第一类型的特征信息还可以称为泛化特征信息,第二类型的特征信息还可以称为特化特征信息。例如,泛化特征信息可以包括年龄、性别、购买力等。特化特征信息可以包括商品标识、商家标识、用户历史购买的商品等。s503、通过第二子模型获取第一类型的特征对应的第二向量和第二类型的特征对应的第三向量。其中,第二向量用于描述用户特征信息和文本描述信息中泛化的特征信息,第三向量用于描述用户特征信息和文本描述信息中特化的特征信息。s504、通过第二模型对图像进行处理,得到第二模型的输出结果。可选的,为了保证响应速度,可以预先通过第二模型生成第一对应关系,第一对应关系中包括多个商品标识和每个商品标识对应的第二模型的输出结果。相应的,可以获取第一对象对应的商品标识,并根据第一对象对应的商品标识和第一对应关系,确定第二模型的输出结果。s505、获取第二模型的输出结果对应的第四向量。s506、根据第三向量、第三向量对应的权重矩阵、第四向量和第四向量对应的权重矩阵,确定得到第五向量。其中,该步骤s506即为对第三向量和第四向量进行特征融合的过程。可选的,可以将第三向量乘以第三向量对应的权重矩阵,加上第四向量乘以第四向量对应的权重矩阵。例如,假设第三向量为n维向量,则第三向量对应的权重矩阵可以为n*k矩阵,第三向量乘以第三向量对应的权重矩阵可以得到第一个k维矩阵。假设第四向量为m维向量,则第四向量对应的权重矩阵可以为m*k矩阵,第四向量乘以第四向量对应的权重矩阵可以得到第二个k维矩阵。将上述第一个k维矩阵和第二个k维矩阵相加,即可得到第五向量,第五向量为第三向量和第四向量的融合向量。s507、对第三向量和第五向量进行拼接处理,得到第六向量。可选的,可以将第五向量添加至第三向量之后,以得到第六向量。例如,假设第三向量为x维向量,第五向量为k维向量,则第六向量为x+k维向量。例如,假设第三向量为(a1,a2,...,ax),第五向量为(b1,b2,…,bk),则第六向量为(a1,a2,...,ax,b1,b2,…,bk)s508、根据第一向量和第六向量,确定点击率。可选的,可以根据第一向量对应的权重向量,确定第一输出值;根据第六向量对应的权重向量,确定第二输出值;根据第一输出值、第二输出值和预设激活函数,确定点击率。可选的,假设第一向量为p维行向量,则第一向量对应的权重向量为p维列向量,假设第六向量为q维行向量,则第六向量对应的权重向量为q维列向量。可选的,激活函数可以为sigmoid函数。可选的,可以获取第一输出值和第二输出值之和,并通过预设激活函数对第一输出值和第二输出值之和进行处理,得到点击率。在图5所示的实施例中,由于cnn模型的训练依赖于用户特征信息和搜索关键词,因此,cnn模型的输出结构可以将用户特征信息和图像相关联,进而使得预估模型可以根据关联的用户特征信息和图像确定点击率,进而提高确定点击率的准确性。图6为本发明实施例提供的一种点击率确定装置的结构示意图。请参见图6,该点击率确定装置10可以包括获取模块11和第一确定模块12,其中,所述获取模块11用于,获取第一对象的对象信息,所述第一对象为待向用户推荐的对象,所述对象信息包括所述第一对象的图像和所述第一对象的文本描述信息;所述第一确定模块12用于,根据所述用户的用户特征信息和所述对象信息,确定所述用户点击查看所述第一对象的点击率,所述点击率用于指示所述用户点击查看所述第一对象的概率。本发明实施例提供的点击率确定装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。在一种可能的实施方式中,所述第一确定模块12具体用于:获取预估模型,所述预估模型包括第一模型和第二模型;通过所述第一模型对所述用户特征信息和所述文本描述信息进行处理,得到所述第一模型的输出结果;通过所述第二模型对所述图像进行处理,得到第二模型的输出结果;根据所述第一模型的输出结果和所述第二模型的输出结果,得到所述点击率。在一种可能的实施方式中,所述第二模型的输出结果包括所述图像的图像特征、所述图像关联的用户特征、所述图像关联的搜索关键词。在一种可能的实施方式中,所述第一确定模块12具体用于:获取第一对应关系,所述第一对应关系中包括多个商品标识和每个商品标识对应的所述第二模型的输出结果,所述第一对应关系为根据所述第二模型预先生成的;获取所述第一对象对应的商品标识;根据所述第一对象对应的商品标识和所述第一对应关系,确定所述第二模型的输出结果。在一种可能的实施方式中,所述第一模型包括第一子模型和第二子模型;所述第一确定模块12具体用于:通过所述第一子模型获取所述用户特征信息和所述文本描述信息对应的第一向量;在所述用户特征信息和所述文本描述信息中确定第一类型的特征信息和第二类型的特征信息,所述第一类型的特征信息为在所述预估模型对应的样本数据中的出现频次大于或等于预设频次的特征信息,所述第二类型的特征信息为在所述预估模型对应的样本数据中的出现频次小于所述预设频次的特征信息;通过所述第二子模型获取所述第一类型的特征对应的第二向量和所述第二类型的特征对应的第三向量,所述第一模型的输出结果包括所述第一向量、所述第二向量和所述第三向量。在一种可能的实施方式中,所述第一确定模块12具体用于:获取所述第二模型的输出结果对应的第四向量;根据所述第三向量、所述第三向量对应的权重矩阵、所述第四向量和所述第四向量对应的权重矩阵,确定得到第五向量;对所述第三向量和所述第五向量进行拼接处理,得到第六向量;根据所述第一向量和所述第六向量,确定所述点击率。在一种可能的实施方式中,所述第一确定模块12具体用于:根据所述第一向量对应的权重向量,确定第一输出值;根据所述第六向量对应的权重向量,确定第二输出值;根据所述第一输出值、所述第二输出值和预设激活函数,确定所述点击率。图7为本发明实施例提供的另一种点击率确定装置的结构示意图。在图6所示实施例的基础上,请参见图7,点击率确定装置10还包括生成模块13,其中,所述生成模块3用于,在所述第一确定模块12获取预估模型之前,获取多组样本数据,并根据所述多组样本数据,生成所述预估模型,每组样本数据包括样本用户特征信息、样本对象信息和样本点击率。在一种可能的实施方式中,所述多组样本数据包括多组第一样本数据,每组第一样本数据包括样本搜索关键词和所述样本搜索关键词对应的样本图像;所述生成模块13具体用于:根据所述多组第一样本数据,生成初始第二模型,所述初始第二模型具有确定图像关联的搜索关键词的功能;根据所述多组样本数据和所述初始第二模型,生成所述预估模型。在一种可能的实施方式中,所述点击率确定装置10还包括第二确定模块14,其中,所述第二确定模块14用于,在所述获取模块获取第一对象的对象信息之前,获取所述用户输入的搜索词,并根据所述搜索词,确定所述第一对象。在一种可能的实施方式中,所述第一对象为商品或广告中的至少一种。在一种可能的实施方式中,所述第一模型为宽度深度模型,所述第一子模型为宽度模型,所述第二子模型为深度模型。在一种可能的实施方式中,所述第二模型为卷积神经网络模型。本发明实施例提供的点击率确定装置可以执行上述方法实施例所示的技术方案,其实现原理以及有益效果类似,此处不再进行赘述。图8为本发明实施例提供的点击率确定装置的硬件结构示意图,如图8所示,该点击率确定装置20包括:至少一个处理器21和存储器22。其中,处理器21和存储器22通过总线23连接。在具体实现过程中,至少一个处理器21执行所述存储器22存储的计算机执行指令,使得至少一个处理器21执行如上的点击率确定方法。处理器21的具体实现过程可参见上述方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。在上述图8所示的实施例中,应理解,处理器可以是中央处理单元(英文:centralprocessingunit,简称:cpu),还可以是其他通用处理器、数字信号处理器(英文:digitalsignalprocessor,简称:dsp)、专用集成电路(英文:applicationspecificintegratedcircuit,简称:asic)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。存储器可能包含高速ram存储器,也可能还包括非易失性存储nvm,例如至少一个磁盘存储器。总线可以是工业标准体系结构(industrystandardarchitecture,isa)总线、外部设备互连(peripheralcomponent,pci)总线或扩展工业标准体系结构(extendedindustrystandardarchitecture,eisa)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上所述的点击率确定方法。上述的计算机可读存储介质,上述可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。可读存储介质可以是通用或专用计算机能够存取的任何可用介质。一种示例性的可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(applicationspecificintegratedcircuits,简称:asic)中。当然,处理器和可读存储介质也可以作为分立组件存在于设备中。所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1