对象推荐方法和装置、推荐信息处理方法和装置与流程

文档序号:11276398阅读:172来源:国知局
对象推荐方法和装置、推荐信息处理方法和装置与流程
本发明涉及计算机
技术领域
,特别是涉及一种对象推荐方法和装置、推荐信息处理方法和装置。
背景技术
:推荐对象是向用户传递信息的一种重要方式,推荐的对象比如应用程序、用户或者商品等,可将推荐这些对象的推荐信息发送至用户终端,由用户终端对推荐信息进行响应。目前的对象推荐方法,一般是采用特定的评分算法计算出候选对象集合中的各个对象的分值,再根据分值从候选对象集合中选出一部分对象作为推荐结果。然而,目前的对象推荐方法,在计算分值时采用的评分算法不同,计算出的各个对象的分值也不同,计算出的各种分值的分布情况也不同,这样不同评分算法下对象推荐的概率有一定差异,导致推荐结果不精准,需要改进。技术实现要素:基于此,有必要针对目前的对象推荐方法因计算分值时采用的评分算法不同而导致推荐结果不精准的问题,提供一种对象推荐方法和装置、推荐信息处理方法和装置。一种对象推荐方法,所述方法包括:获取候选对象集合中各对象的原始分值;获取当前对象推荐场景下预设的目标分值概率累积分布;根据所述目标分值概率累积分布,将所述原始分值保序回归映射为目标分值;根据所述目标分值从所述候选对象集合中挑选相应的对象;推荐挑选出的所述对象。一种对象推荐装置,所述装置包括:原始分值获取模块,用于获取候选对象集合中各对象的原始分值;目标分值概率累积分布获取模块,用于获取当前对象推荐场景下预设的目标分值概率累积分布;映射模块,用于根据所述目标分值概率累积分布,将所述原始分值保序回归映射为目标分值;挑选模块,用于根据所述目标分值从所述候选对象集合中挑选相应的对象;推荐模块,用于推荐挑选出的所述对象。一种推荐信息处理方法,所述方法包括:接收推荐对象的推荐信息;所述推荐信息是根据所述对象的目标分值挑选出的,所述目标分值是在对所述对象进行评分而获得原始分值后,根据当前对象推荐场景下预设的目标分值概率累积分布将所述原始分值保序回归映射而成的;根据所述对象的目标分值对所述推荐信息进行排序;按照排序顺序展示所述推荐信息。一种推荐信息处理装置,所述装置包括:推荐信息接收模块,用于接收推荐对象的推荐信息;所述推荐信息是根据所述对象的目标分值挑选出的,所述目标分值是在对所述对象进行评分而获得原始分值后,根据当前对象推荐场景下预设的目标分值概率累积分布将所述原始分值保序回归映射而成的;排序模块,用于根据所述对象的目标分值对所述推荐信息进行排序;推荐信息展示模块,用于按照排序顺序展示所述推荐信息。上述对象推荐方法和装置、推荐信息处理方法和装置,将对象进行评分获得相应的原始评分值,再按照当前对象推荐场景下预设的目标分值概率累积分布将原始评分值保序回归映射到目标分值,从而根据目标分值来推荐相应的对象。即使采用不同的评分算法来获得原始分值,都可以保序映射到满足目标分值概率累积分布的目标分值,这样推荐对象所用的目标分值的概率分布是准确的,再根据目标分值推荐对象的推荐结果也是精准的。附图说明图1为一个实施例中推荐系统的应用环境图;图2为一个实施例中终端的内部结构示意图;图3为一个实施例中服务器的内部结构示意图;图4为一个实施例中对象推荐方法的流程示意图;图5为一个实施例中根据目标分值概率累积分布,将原始分值保序回归映射为目标分值的步骤的流程示意图;图6为一个实施例中根据目标分值概率累积分布,将原始分值概率累积值映射为与原始分值概率累积值匹配的目标分值概率累积值的步骤的流程示意图;图7为一个实施例中通过gbdt算法获得的原始分值概率累积分布曲线示意图;图8为一个实施例中映射获得的原始分值的概率累积分布曲线示意图;图9为一个实施例中生成目标分值概率累积分布的步骤的流程示意图;图10为另一个实施例中生成目标分值概率累积分布的步骤的流程示意图;图11为一个实施例中校准前的目标分值概率密度曲线和校准后的目标分值概率密度曲线对比示意图;图12为一个实施例中推荐信息处理方法的流程示意图;图13为一个实施例中对象推荐装置的结构框图;图14为一个实施例中映射模块的结构框图;图15为另一个实施例中对象推荐装置的结构框图;图16为再一个实施例中对象推荐装置的结构框图;图17为一个实施例中推荐信息处理装置的结构框图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。如图1所示,在一个实施例中,提供了一种推荐系统,包括终端110和服务器120,其中终端110包括移动终端、车载设备和个人计算机等,移动终端包括手机、平板电脑、智能手表或者个人数字助理(pda)等中的至少一种。服务器120可以是独立的物理服务器也可以是物理服务器集群。如图2所示,在一个实施例中,提供了一种终端110,包括通过系统总线连接的处理器、非易失性存储介质、内存储器、网络接口、显示屏和输入设备。其中处理器具有计算功能和控制终端110工作的功能,该处理器被配置为执行一种推荐信息处理方法。非易失性存储介质包括磁存储介质、光存储介质和闪存式存储介质中的至少一种。非易失性存储介质存储有操作系统,还存储有推荐信息处理装置。该推荐信息处理装置用于实现一种推荐信息处理方法。网络接口用于通过网络连接到服务器120。输入设备可以是物理按键或者与显示屏重叠的触控层,触控层和显示屏构成触控屏。如图3所示,在一个实施例中,提供了一种服务器120,包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中处理器具有计算功能和控制服务器120工作的功能,该处理器被配置为执行一种对象推荐方法。非易失性存储介质包括磁存储介质、光存储介质和闪存式存储介质中的至少一种。非易失性存储介质存储有操作系统,还存储有对象推荐装置。该对象推荐装置用于实现一种对象推荐方法。网络接口用于通过网络连接到终端110。如图4所示,在一个实施例中,提供了一种对象推荐方法,本实施例以该方法应用于上述图3中的服务器120来举例说明。该方法具体包括如下步骤:步骤402,获取候选对象集合中各对象的原始分值。其中,候选对象集合是若干可推荐的对象构成的集合,候选对象集合中的对象可以用相应的对象标识来表示,对象标识则是具有唯一性的字符串。候选对象集合中的对象具体可以是用户、商品或者应用程序等,商品比如虚拟商品或者实体商品等。服务器具体可获取候选对象集合中各对象的多个维度的对象属性,从而根据多个维度的对象属性并通过第一评分算法进行评分,获得原始分值。比如服务器可获取商品的售价、成交价、点击次数、点击率、成交次数以及转化率等多个维度的商品属性,并对每个维度的商品属性进行评分后加权求和获得原始分值。原始分值是相对于下述的目标分值而言,是映射获得目标分值前的分值。在一个实施例中,服务器具体可提取训练集中的样本的特征,采用机器学习算法训练获得预测模型,从而提取候选对象集合中各对象的特征并输入到预测模型,从而预测出候选对象集合中各对象的原始分值。其中预测模型是将需预测分值的对象的特征映射为预测的分值的函数。采用的机器学习算法比如gbdt(gradientboostingdecisiontree,梯度提升决策树)算法、cart(classificationandregressiontrees,分类与回归树)算法或者支持向量机算法等。步骤404,获取当前对象推荐场景下预设的目标分值概率累积分布。具体地,服务器预先存储有各种对象推荐场景对应的目标分值概率累积分布,从而在获得原始分值后,获取当前对象推荐场景下的目标分值概率累积分布。其中对象推荐场景是指推荐特定类型的对象的场景,比如推荐用户的场景、推荐商品的场景或者推荐应用程序的场景等。目标分值是采用与当前计算原始分值的机器学习算法不同的机器学习算法学习获得的精确的分值,目标分值概率累积分布是表示目标分值概率累积值分布情况的数据。一个目标分值对应一个目标分值概率累积值,该目标分值概率累积值表示小于等于相应的目标分值的所有目标分值占目标分值集合中所有目标分值的比例。目标分值是离散的,概率累积分布可以用离散函数关系来表示,也可以用枚举方式来表示。举例说明,假设目标分值集合中的目标分值按照升序依次为3,5,9和10,相应的目标分值相对于目标分值集合的概率依次为0.2,0.4,0.2和0.2,则相应的目标分值概率累积值依次为0.2,0.6,0.8和1。步骤406,根据目标分值概率累积分布,将原始分值保序回归映射为目标分值。具体地,保序是指原始分值被映射为目标分值后,相应的目标分值保留原始分值的大小关系。比如原始分值a和b分别映射为目标分值a和b,且a<b,则a<b。回归是指将原始分值通过某种映射后获得的目标分值的概率分布,与目标分值概率累积分布对应的目标分值概率分布是基本一致的。在一个实施例中,服务器具体可将原始分值按照升序或者降序排序,进而按照排序顺序依次调整每个原始分值为相应的目标分值,使得目标分值满足目标分值概率累积分布。步骤408,根据目标分值从候选对象集合中挑选相应的对象。具体地,服务器可根据需要设定合适的筛选条件,根据该筛选条件从候选对象集合中挑选对象,该筛选条件根据目标分值进行约束。筛选条件比如选择具有大于预设值的目标分值的对象,或者选择目标分值最大的预设数量的目标分值对应的对象,或者选择与随机生成的分值匹配的目标分值对应的对象等。步骤410,推荐挑选出的对象。具体地,服务器可生成推荐挑选出的对象的推荐信息,并将推荐信息推送到终端。推荐信息包括对象标识,还可以包括对象描述文本和/或描述图片,还可以包括每个挑选出的对象对应的目标分值。上述对象推荐方法,将对象进行评分获得相应的原始评分值,再按照当前对象推荐场景下预设的目标分值概率累积分布将原始评分值保序回归映射到目标分值,从而根据目标分值来推荐相应的对象。即使采用不同的评分算法来获得原始分值,都可以保序映射到满足目标分值概率累积分布的目标分值,这样推荐对象所用的目标分值的概率分布是准确的,再根据目标分值推荐对象的推荐结果也是精准的。如图5所示,在一个实施例中,步骤406具体包括如下步骤:步骤502,将原始分值按照升序排序,根据排序结果获得各原始分值对应的原始分值概率累积值。其中,将原始分值按照升序排序是指将原始分值按照原始分值从小到大的顺序排序。具体地,服务器在将原始分值按照升序排序后,遍历排序结果中的原始分值,获取当前遍历的原始分值对应的概率值,从而将该排序结果中从首位开始到当前遍历的原始分值的所有概率值相加,获得当前遍历的原始分值对应的原始分值概率累积值。举例说明,见表一:升序排序的原始分值原始分值概率累积值0.0010.00130.0020.00180.0040.00190.0060.0020......0.321上述表一中第一列是按照升序排序的原始分值,第二列则是第一列中原始分值对应的原始分值概率累积值,每一行中的原始分值与原始分值概率累积值是一一对应的,第二列的原始分值概率累积值表示小于等于第一列中相应原始分值的原始分值占所有原始分值的占比。步骤504,根据目标分值概率累积分布,将原始分值概率累积值映射为与原始分值概率累积值匹配的目标分值概率累积值。具体地,服务器可根据目标分值概率累积分布,遍历原始分值概率累积值,为遍历的原始分值概率累积值寻找相等或相近的目标分值概率累积值,进而将遍历的原始分值映射为寻找到的目标分值概率累积值。其中目标分值概率累积值与原始分值概率累积值匹配是指目标分值概率累积值与原始分值概率累积值满足接近条件。服务器还可以通过插值为遍历的原始分值概率累积值分配匹配的目标分值概率累积值。步骤506,将原始分值映射为与目标分值概率累积值对应的目标分值。具体地,目标分值概率累积值是将目标分值按照升序排序后生成的,目标分值概率累积值与目标分值具有一一对应关系,服务器在映射获得目标分值概率累积值后,便可以将原始分值映射为该目标分值概率累积值所对应的目标分值。本实施例中,原始分值经过升序排序后,获得的原始分值概率累积值均可以反映出小于等于当前的原始分值的原始分值占所有原始分值的比例,目标分值概率累积值也反映出小于等于相应的目标分值的目标分值占所有目标分值的比例。这样将原始分值概率累积值和目标分值概率累积值匹配后,将相应的原始分值映射为相应的目标分值,便使得映射后的目标分值既可以保留原始分值的大小关系,又可以满足预设的目标分值概率分布,而且计算量小。如图6所示,在一个实施例中,步骤504具体包括如下步骤:步骤602,根据目标分值概率累积分布,查找与原始分值概率累积值相等的目标分值概率累积值;若查找到,则执行步骤604;若未查找到,则执行步骤606。目标分值概率累积分布表示各种目标分值出现的概率,服务器具体可将目标分值概率累积分布所表示的各种目标分值概率累积值按升序排序,在该排序结果中查找等于原始分值概率累积值的目标分值概率累积值。步骤604,将原始分值概率累积值映射为查找到的目标分值概率累积值。具体地,若能查找到与原始分值概率累积值相等的目标分值概率累积值,说明该查找到的目标分值概率累积值对应的目标分值在整个目标分值集合中的位置,与相应的原始分值概率累积值对应的原始分值在整个原始分值集合中的位置是相同的,将该原始分值概率累积值直接映射为查找到的目标分值概率累积值,可实现保序回归。举例说明,见表二:原始分值原始分值概率累积值目标分值概率累积值目标分值0.0010.00130.00120.000010.0020.00180.00150.000020.0040.00190.00150.000020.0060.00200.00200.00004............0.32110.05432上述表二中第三列的目标分值概率累积值通过查表方式获得,具体是根据目标分值概率累积分布查找小于等于相应的原始分值概率累积值的最大目标分值概率累积值。第四列中的目标分值与第三列中的目标分值概率累积值是一一对应关系。举例说明,上述表二中,原始分值概率累积值为0.0020时,可以查找到等于0.0020的目标分值概率累积值,则将相应的原始分值0.006映射为相应的目标分值0.00004。步骤606,将原始分值概率累积值映射为与原始分值概率累积值满足接近条件的目标分值概率累积值。具体地,服务器在无法查找到与原始分值概率累积值相等的目标分值概率累积值时,可根据目标分值概率累积分布,再查找与原始分值概率累积值接近的目标分值概率累积值作为映射的目标。在一个实施例中,步骤606包括:将原始分值概率累积值映射为与原始分值概率累积值最接近的目标分值概率累积值。具体地,服务器可查找与原始分值概率累积值的差距最小的目标分值概率累积值,并将原始分值概率累积值映射为该目标分值概率累积值。在一个实施例中,步骤606包括:将原始分值概率累积值映射为小于原始分值概率累积值的最大目标分值概率累积值。举例说明,上述表二中,原始分值概率累积值为0.0018时,不存在等于0.0018的目标分值概率累积值,但可以查找到小于0.0018的最大目标分值概率累积值为0.0015,则将相应的原始分值0.002映射为相应的目标分值0.00002。还比如原始分值概率累积值为0.0019时,不存在等于0.0019的目标分值概率累积值,但可以差值到小于0.0019的最大目标分值概率累积值为0.0015,则将相应的原始分值0.004映射为相应的目标分值0.00002。可以看出,原始分值0.0018和0.0019均映射为0.00002,但这种局部相等的情况并不影响整体上保留的原始分值的顺序,仍然是保序回归的。本实施例中若原始分值通过gbdt算法获得,相应的原始分值概率累积分布曲线如图7所示,映射后的目标分值的概率累积分布曲线则如图8所示。图7和图8的纵坐标均表示概率累积值,横坐标表示按升序排序的分值。在一个实施例中,步骤606包括:将原始分值概率累积值映射为大于原始分值概率累积值的最小目标分值概率累积值。在一个实施例中,步骤606包括:获取小于原始分值概率累积值的最大目标分值概率累积值和大于原始分值概率累积值的最小目标分值概率累积值间的平均值,将原始分值概率累积值映射为平均值。这里的平均值可以是算术平均值或者加权平均值,加权平均值的权重可根据需要设置。本实施例中,根据目标分值概率累积分布,优先查找与原始分值概率累积值相等的目标分值概率累积值进行映射,若未查找到则再查找与原始分值概率累积值接近的目标分值概率累积值进行映射。可以以较小的计算量达到较为精确的保序回归的映射,简单、高效且准确。在一个实施例中,目标分值是根据预测模型对预测样本集进行概率预测获得的概率值,且预测模型是根据训练样本集并通过逻辑回归(logisticregression,lr)算法进行训练获得的。本实施例中,将原始分值直接映射为概率值,在推荐对象时可直接根据概率值进行推荐,避免了再将目标分值映射为概率值的繁琐过程。而采用逻辑回归算法训练获得的预测模型对预测样本集进行预测获得的概率分布更接近真实的概率分布。如图9所示,在一个实施例中,该对象推荐方法还包括生成目标分值概率累积分布的步骤,具体包括如下步骤:步骤902,获取当前对象推荐场景下的全量训练样本集和全量预测样本集。具体地,服务器可将当前对象推荐场景下的所有样本分成两部分,一部分作为全量训练样本集,另一部分作为全量预测样本集。全量训练样本集包括正训练样本和负训练样本。步骤904,根据全量训练样本集并通过逻辑回归算法训练获得预测模型。具体地,服务器可采用全量训练样本集,将全量训练样本集中的训练样本提取特征后,根据提取的特征并通过逻辑回归算法进行训练,获得预测模型。一般全量训练样本集中训练样本数量非常多,训练耗时长,但训练获得的预测模型预测的分值的概率分布很准确。步骤906,根据预测模型对全量预测样本集进行分值预测,获得目标分值概率分布。具体地,服务器采用与提取训练样本的特征相同的特征提取方式,从全量预测样本中的所有预测样本提取特征,并输入到训练出的预测模型,获得每个预测样本的目标分值,对预测出的目标分值统计概率获得目标分值概率分布。步骤908,根据目标分值概率分布获得相应的目标分值概率累积分布。具体地,服务器在将目标分值按照升序排序后,可遍历排序结果中的目标分值,获取当前遍历的目标分值对应的概率值,从而将该排序结果中从首位开始到当前遍历的目标分值的所有概率值相加,获得当前遍历的目标分值对应的目标分值概率累积值,根据所有目标分值对应的目标分值概率累积值构成目标分值概率分布。本实施例中,根据全量训练样本集并通过逻辑回归算法训练获得预测模型,这样训练出的预测模型预测出的分值接近真实概率分布,在推荐对象时推荐结果将更为准确。如图10所示,在一个实施例中,该对象推荐方法还包括生成目标分值概率累积分布的步骤,具体包括如下步骤:步骤1002,获取当前对象推荐场景下的全量训练样本集和全量预测样本集。步骤1004,对全量训练样本集进行均匀采样,根据采样获得的训练样本并通过逻辑回归算法训练获得预测模型。在一个实施例中,步骤1004包括:对全量训练样本集中的全量负训练样本进行均匀采样,根据全量训练样本集中的全量正训练样本和采样获得的负训练样本并通过逻辑回归算法训练获得预测模型。全量训练样本集中负训练样本的数量远大于正训练样本的数量,仅保留全量正训练样本可保证训练出的预测模型的预测准确性,而且对全量负训练样本进行均匀采样可提高训练效率。比如全量训练样本集中训练样本总数为1亿,其中正训练样本100万,负训练样本9900万。如果把所有训练样本都用来训练预测模型,对计算能力的要求会比较高。因此对正训练样本全保留,对负训练样本按10%的比例来均匀采样,也就是从9900万负训练样本里面按照一定规则来抽取990万条训练样本。在一个实施例中,步骤1004包括:对全量训练样本集中的全量正训练样本和全量负训练样本分别按照不同的采样率进行均匀采样,根据采样获得的正训练样本和负训练样本并通过逻辑回归算法训练获得预测模型。在训练样本集非常庞大时可分别将全量正训练样本和全量负训练样本进行均匀采样,来提高训练效率。步骤1006,对预测模型进行校准。在一个实施例中,若全量正训练样本被保留,全量负训练样本按照预设采样率r进行均匀采样。则在对预测模型进行校准时,可将预测模型修改为其中xi为输入的特征,wi为特征的权重,k和c为常数参数,r为负训练样本的采样率,y为预测的中间分值。在一个实施例中,可对预测模型的逻辑函数进行修改来实现预测模型的校准。具体原本的逻辑函数为p=1/(1+e-y),修改后的逻辑函数为p’=p/(p+(1-p)/r),其中y为预测的中间分值,通过修改后的逻辑函数p’输出目标分值。步骤1008,根据校准的预测模型对全量预测样本集进行分值预测,获得目标分值概率分布。步骤1010,根据目标分值概率分布获得相应的目标分值概率累积分布。本实施例中,通过对全量训练样本集进行均匀采样提高了训练效率,并通过对预测模型的校准使得最终预测获得的目标分值概率分布符合真实的概率分布。参照图11,曲线1是校准前的目标分值概率密度曲线,曲线2是校准后的目标分值概率密度曲线,曲线2更符合真实的目标分值概率分布。图11中横坐标为目标分值的取值,纵坐标为相应的概率值。如图12所示,在一个实施例中,提供了一种推荐信息处理方法,本实施例以该方法应用于上述图1和图2中的终端110来举例说明。该方法具体包括如下步骤:步骤1202,接收推荐对象的推荐信息;推荐信息是根据对象的目标分值挑选出的,目标分值是在对对象进行评分而获得原始分值后,根据当前对象推荐场景下预设的目标分值概率累积分布将原始分值保序回归映射而成的。具体地,服务器可获取候选对象集合中各对象的原始分值;获取当前对象推荐场景下预设的目标分值概率累积分布;根据目标分值概率累积分布,将原始分值保序回归映射为目标分值;根据目标分值从候选对象集合中挑选相应的对象;向终端发送推荐挑选出的对象的推荐信息。推荐信息包括对象标识,还可以包括对象描述文本和/或描述图片,还可以包括每个挑选出的对象对应的目标分值。在一个实施例中,服务器可将原始分值按照升序排序,根据排序结果获得各原始分值对应的原始分值概率累积值;根据目标分值概率累积分布,将原始分值概率累积值映射为与原始分值概率累积值匹配的目标分值概率累积值;将原始分值映射为与目标分值概率累积值对应的目标分值。在一个实施例中,服务器可根据目标分值概率累积分布,查找与原始分值概率累积值相等的目标分值概率累积值;若查找到,则将原始分值概率累积值映射为查找到的目标分值概率累积值;若未查找到,则将原始分值概率累积值映射为查找到的目标分值概率累积值。在一个实施例中,服务器若未查找到,则可将原始分值概率累积值映射为与原始分值概率累积值最接近的目标分值概率累积值;或者,将原始分值概率累积值映射为小于原始分值概率累积值的最大目标分值概率累积值;或者,将原始分值概率累积值映射为大于原始分值概率累积值的最小目标分值概率累积值;或者,获取小于原始分值概率累积值的最大目标分值概率累积值和大于原始分值概率累积值的最小目标分值概率累积值间的平均值,将原始分值概率累积值映射为平均值。在一个实施例中,目标分值是根据预测模型对预测样本集进行概率预测获得的概率值,且预测模型是根据训练样本集并通过逻辑回归算法进行训练获得的。在一个实施例中,服务器可获取当前对象推荐场景下的全量训练样本集和全量预测样本集;根据全量训练样本集并通过逻辑回归算法训练获得预测模型;根据预测模型对全量预测样本集进行分值预测,获得目标分值概率分布;根据目标分值概率分布获得相应的目标分值概率累积分布。在一个实施例中,服务器可获取当前对象推荐场景下的全量训练样本集和全量预测样本集;对全量训练样本集进行均匀采样,根据采样获得的训练样本并通过逻辑回归算法训练获得预测模型;对预测模型进行校准;根据校准的预测模型对全量预测样本集进行分值预测,获得目标分值概率分布;根据目标分值概率分布获得相应的目标分值概率累积分布。步骤1204,根据对象的目标分值对推荐信息进行排序。步骤1206,按照排序顺序展示推荐信息。具体地,终端可按照目标分值从大到小的顺序对相应的推荐信息进行排序,并根据排序顺序,将推荐信息按照相应的目标分值从大到小的顺序进行展示。终端还可以获取对展示的推荐信息的操作指令,根据操作指令对推荐信息进行响应。比如若对象为用户,则终端可向服务器发起加好友请求;若对象为商品,则终端可向服务器发起商品购买请求;若对象为应用程序,则终端可向服务器发起应用程序下载请求等。上述推荐信息处理方法,将对象进行评分获得相应的原始评分值,再按照当前对象推荐场景下预设的目标分值概率累积分布将原始评分值保序回归映射到目标分值,从而根据目标分值来推荐相应的对象。即使采用不同的评分算法来获得原始分值,都可以保序映射到满足目标分值概率累积分布的目标分值,这样推荐对象所用的目标分值的概率分布是准确的,再根据目标分值推荐对象的推荐结果也是精准的。如图13所示,在一个实施例中,提供了一种对象推荐装置1300,包括原始分值获取模块1301、目标分值概率累积分布获取模块1302、映射模块1303、挑选模块1304和推荐模块1305。原始分值获取模块1301,用于获取候选对象集合中各对象的原始分值。目标分值概率累积分布获取模块1302,用于获取当前对象推荐场景下预设的目标分值概率累积分布。映射模块1303,用于根据目标分值概率累积分布,将原始分值保序回归映射为目标分值。挑选模块1304,用于根据目标分值从候选对象集合中挑选相应的对象。推荐模块1305,用于推荐挑选出的对象。上述对象推荐装置1300,将对象进行评分获得相应的原始评分值,再按照当前对象推荐场景下预设的目标分值概率累积分布将原始评分值保序回归映射到目标分值,从而根据目标分值来推荐相应的对象。即使采用不同的评分算法来获得原始分值,都可以保序映射到满足目标分值概率累积分布的目标分值,这样推荐对象所用的目标分值的概率分布是准确的,再根据目标分值推荐对象的推荐结果也是精准的。如图14所示,在一个实施例中,映射模块1303包括:原始分值概率累积值获取模块1303a、概率累积值映射模块1303b和分值映射模块1303c。原始分值概率累积值获取模块1303a,用于将原始分值按照升序排序,根据排序结果获得各原始分值对应的原始分值概率累积值。概率累积值映射模块1303b,用于根据目标分值概率累积分布,将原始分值概率累积值映射为与原始分值概率累积值匹配的目标分值概率累积值。分值映射模块1303c,用于将原始分值映射为与目标分值概率累积值对应的目标分值。本实施例中,原始分值经过升序排序后,获得的原始分值概率累积值均可以反映出小于等于当前的原始分值的原始分值占所有原始分值的比例,目标分值概率累积值也反映出小于等于相应的目标分值的目标分值占所有目标分值的比例。这样将原始分值概率累积值和目标分值概率累积值匹配后,将相应的原始分值映射为相应的目标分值,便使得映射后的目标分值既可以保留原始分值的大小关系,又可以满足预设的目标分值概率分布,而且计算量小。在一个实施例中,概率累积值映射模块1303b具体用于根据目标分值概率累积分布,查找与原始分值概率累积值相等的目标分值概率累积值;若查找到,则将原始分值概率累积值映射为查找到的目标分值概率累积值;若未查找到,则将原始分值概率累积值映射为与原始分值概率累积值最接近的目标分值概率累积值;或者,将原始分值概率累积值映射为小于原始分值概率累积值的最大目标分值概率累积值;或者,将原始分值概率累积值映射为大于原始分值概率累积值的最小目标分值概率累积值;或者,获取小于原始分值概率累积值的最大目标分值概率累积值和大于原始分值概率累积值的最小目标分值概率累积值间的平均值,将原始分值概率累积值映射为平均值。本实施例中,根据目标分值概率累积分布,优先查找与原始分值概率累积值相等的目标分值概率累积值进行映射,若未查找到则再查找与原始分值概率累积值接近的目标分值概率累积值进行映射。可以以较小的计算量达到较为精确的保序回归的映射,简单、高效且准确。在一个实施例中,目标分值是根据预测模型对预测样本集进行概率预测获得的概率值,且预测模型是根据训练样本集并通过逻辑回归算法进行训练获得的。如图15所示,在一个实施例中,对象推荐装置1300还包括:全量训练样本集获取模块1306、训练模块1307、预测模块1308和概率累积分布生成模块1309。全量训练样本集获取模块1306,用于获取当前对象推荐场景下的全量训练样本集和全量预测样本集。训练模块1307,用于根据全量训练样本集并通过逻辑回归算法训练获得预测模型。预测模块1308,用于根据预测模型对全量预测样本集进行分值预测,获得目标分值概率分布。概率累积分布生成模块1309,用于根据目标分值概率分布获得相应的目标分值概率累积分布。本实施例中,根据全量训练样本集并通过逻辑回归算法训练获得预测模型,这样训练出的预测模型预测出的分值接近真实概率分布,在推荐对象时推荐结果将更为准确。如图16所示,在一个实施例中,对象推荐装置1300还包括:全量训练样本集获取模块1306、训练模块1307、预测模块1308、概率累积分布生成模块1309和校准模块1310。全量训练样本集获取模块1306,用于获取当前对象推荐场景下的全量训练样本集和全量预测样本集。训练模块1307,用于对全量训练样本集进行均匀采样,根据采样获得的训练样本并通过逻辑回归算法训练获得预测模型。校准模块1310,对预测模型进行校准。预测模块1308,用于根据校准的预测模型对全量预测样本集进行分值预测,获得目标分值概率分布。概率累积分布生成模块1309,用于根据目标分值概率分布获得相应的目标分值概率累积分布。本实施例中,通过对全量训练样本集进行均匀采样提高了训练效率,并通过对预测模型的校准使得最终预测获得的目标分值概率分布符合真实的概率分布。在一个实施例中,训练模块1307具体用于对全量训练样本集中的全量负训练样本进行均匀采样,根据全量训练样本集中的全量正训练样本和采样获得的负训练样本并通过逻辑回归算法训练获得预测模型。如图17所示,在一个实施例中,提供了一种推荐信息处理装置1700,包括:推荐信息接收模块1701、排序模块1702和推荐信息展示模块1703。推荐信息接收模块1701,用于接收推荐对象的推荐信息;推荐信息是根据对象的目标分值挑选出的,目标分值是在对对象进行评分而获得原始分值后,根据当前对象推荐场景下预设的目标分值概率累积分布将原始分值保序回归映射而成的。排序模块1702,用于根据对象的目标分值对推荐信息进行排序。推荐信息展示模块1703,用于按照排序顺序展示推荐信息。上述推荐信息处理装置1700,将对象进行评分获得相应的原始评分值,再按照当前对象推荐场景下预设的目标分值概率累积分布将原始评分值保序回归映射到目标分值,从而根据目标分值来推荐相应的对象。即使采用不同的评分算法来获得原始分值,都可以保序映射到满足目标分值概率累积分布的目标分值,这样推荐对象所用的目标分值的概率分布是准确的,再根据目标分值推荐对象的推荐结果也是精准的。在一个实施例中,目标分值是根据预测模型对预测样本集进行概率预测获得的概率值,且预测模型是根据训练样本集并通过逻辑回归算法进行训练获得的。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该计算机程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等非易失性存储介质,或随机存储记忆体(randomaccessmemory,ram)等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1