信息推荐方法及装置与流程

文档序号:11286327阅读:182来源:国知局
信息推荐方法及装置与流程

技术领域
】本申请涉及互联网
技术领域
,尤其涉及一种信息推荐方法及装置。
背景技术
:随着互联网技术的发展,用户可以从网站上获取的内容(简称为网络对象)越来越多。在用户浏览网站选择网络对象的过程中,网站推荐系统起着十分重要的作用,特别是对于不具有明确需求的用户,很可能会直接选择网站推荐系统所推荐的网络对象。一个高效的推荐系统,不仅可以方便用户使用,提升网站自身价值,而且更重要的是能够减少用户漫无目的的浏览、点击等行为,有利于减轻网站服务器的负担,节约网络带宽资源。目前,越来越多的业务系统开始有自己的推荐系统。现有推荐系统都是针对特定业务场景的,其所需的数据流是固化的,而目前业务系统提供的业务类型在不断增多,如果直接将现有推荐系统应用于新业务中,需要重新接入与新业务有关的数据,这种实现代价极高,所以现有推荐系统的通用性较差,无法直接应用于多种业务场景,无法满足业务种类不断增多的应用需求。技术实现要素:本申请的多个方面提供一种信息推荐方法及装置,用以提供一种通用性更强的推荐方法,以适应各种业务场景。本申请的一方面,提供一种信息推荐方法,包括:按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据;按照适用于各业务场景的通用数据处理逻辑,对所述实时用户行为数据进行分析,以获得至少一种推荐数据模型;根据待推荐业务场景,从所述至少一种推荐数据模型中,获取所述待推荐业务场景所需的参考数据;根据所述待推荐业务场景所需的参考数据向所述待推荐业务场景进行信息推荐。在本申请一可选实施方式中,所述按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据,包括:实时采集所述用户行为涉及的业务标识、网络对象标识、网络对象所在的业务路径、用户标识以及用户行为类型,以形成所述实时用户行为数据。在本申请一可选实施方式中,所述按照适用于各业务场景的通用数据处理逻辑,对所述实时用户行为数据进行分析,以获得至少一种推荐数据模型,包括:从用户行为类型和对象类型两个维度,对所述实时用户行为数据进行解析,以获得各行为对象在各种用户行为类型下的用户行为数据,其中,所述行为对象为所述用户行为涉及的网络对象或所述用户行为涉及的网络对象所在的业务路径上的节点;根据各业务场景的信息推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得所述至少一种推荐数据模型。在本申请一可选实施方式中,所述从用户行为类型和对象类型两个维度,对所述实时用户行为数据进行解析,以获得各行为对象在各种用户行为类型下的用户行为数据,包括:根据所述用户行为涉及的业务标识,将包括相同业务标识的实时用户行为数据划入一个数据分组;从用户行为类型和对象类型两个维度,对每个数据分组内的实时用户行为数据进行解析,以获得每个数据分组中各行为对象在各种用户行为类型下的用户行为数据。在本申请一可选实施方式中,所述根据各业务场景的信息推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得所述至少一种推荐数据模型,包括:根据网络对象推荐需求、用户偏好推荐需求、网络对象热度推荐需求以及网络对象转移关系推荐需求中的至少一种推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。在本申请一可选实施方式中,所述根据网络对象推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象基础推荐数据模型,包括:从网络对象的维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行组织管理,以获得各网络对象的基础数据。在本申请一可选实施方式中,所述根据用户偏好推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得用户偏好推荐数据模型,包括:从用户、网络对象以及用户行为类型三个维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分。在本申请一可选实施方式中,所述根据网络对象热度推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象热度推荐数据模型,包括:从用户、网络对象以及用户行为类型三个维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分;根据各用户对各行为对象的偏好得分,计算各行为对象的热度值。在本申请一可选实施方式中,所述根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分,包括:对每个用户,对所述用户在各时间窗内对各行为对象发生每种类型的用户行为的次数进行加权求和,以获得所述用户在各时间窗内对各行为对象的偏好得分;按照时间衰减因子,对所述用户在各时间窗内对各行为对象的偏好得分进行加权求和,以获得所述用户对各行为对象的偏好得分。在本申请一可选实施方式中,所述根据各用户对各行为对象的偏好得分,计算各行为对象的热度值,包括:对每个行为对象,对各用户对所述行为对象的偏好得分进行累加,以获得所述行为对象的热度值。在本申请一可选实施方式中,所述根据网络对象转移关系推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象转移关系推荐数据模型,包括:从对象转移的维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,以获得至少一个行为对象转移对,所述行为对象转移对表示同一用户前后两次用户行为涉及的行为对象之间的转移关系。在本申请一可选实施方式中,所述根据待推荐业务场景,从所述至少一种推荐数据模型中,获取所述待推荐业务场景所需的参考数据,包括:当所述待推荐业务场景为根据目标用户正在搜索的目标行为对象向所述目标用户推荐行为对象时,从所述至少一个行为对象转移对中,获取包含所述目标行为对象且从所述目标行为对象转向另一行为对象的至少一个候选行为对象转移对;所述根据所述待推荐业务场景所需的参考数据向所述待推荐业务场景进行信息推荐,包括:对所述至少一个候选行为对象转移对中的每个候选行为对象转移对,根据所述目标行为对象转向另一行为对象的次数,计算所述候选行为对象转移对的转移概率;根据每个候选行为对象转移对的转移概率,从所述至少一个候选行为对象转移对中选择目标行为对象转移对,将所述目标行为对象转移对中除所述目标行为对象之外的行为对象推荐给所述目标用户。本申请的另一方面,提供一种信息推荐装置,包括:实时采集模块,用于按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据;模型计算模块,用于按照适用于各业务场景的通用数据处理逻辑,对所述实时用户行为数据进行分析,以获得至少一种推荐数据模型;参数提取模块,用于根据待推荐业务场景,从所述至少一种推荐数据模型中,获取所述待推荐业务场景所需的参考数据;信息推荐模块,用于根据所述待推荐业务场景所需的参考数据向所述待推荐业务场景进行信息推荐。在本申请一可选实施方式中,所述实时采集模块具体用于:实时采集所述用户行为涉及的业务标识、网络对象标识、网络对象所在的业务路径、用户标识以及用户行为类型,以形成所述实时用户行为数据。在本申请一可选实施方式中,所述模型计算模块包括:数据解析单元,用于从用户行为类型和对象类型两个维度,对所述实时用户行为数据进行解析,以获得各行为对象在各种用户行为类型下的用户行为数据,其中,所述行为对象为所述用户行为涉及的网络对象或所述用户行为涉及的网络对象所在的业务路径上的节点;模型处理单元,用于根据各业务场景的信息推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得所述至少一种推荐数据模型。在本申请一可选实施方式中,所述数据解析单元具体用于:根据所述用户行为涉及的业务标识,将包括相同业务标识的实时用户行为数据划入一个数据分组;从用户行为类型和对象类型两个维度,对每个数据分组内的实时用户行为数据进行解析,以获得每个数据分组中各行为对象在各种用户行为类型下的用户行为数据。在本申请一可选实施方式中,所述模型处理单元具体用于:根据网络对象推荐需求、用户偏好推荐需求、网络对象热度推荐需求以及网络对象转移关系推荐需求中的至少一种推荐需求,对所述各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。在本申请一可选实施方式中,所述模型处理单元在获得所述网络对象基础推荐数据模型时,具体用于:从网络对象的维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行组织管理,以获得各网络对象的基础数据。在本申请一可选实施方式中,所述模型处理单元在获得所述用户偏好推荐数据模型时,具体用于:从用户、网络对象以及用户行为类型三个维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分。在本申请一可选实施方式中,所述模型处理单元在获得所述网络对象热度推荐数据模型时,具体用于:从用户、网络对象以及用户行为类型三个维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分;根据各用户对各行为对象的偏好得分,计算各行为对象的热度值。在本申请一可选实施方式中,所述模型处理单元具体用于:对每个用户,对所述用户在各时间窗内对各行为对象发生每种类型的用户行为的次数进行加权求和,以获得所述用户在各时间窗内对各行为对象的偏好得分;按照时间衰减因子,对所述用户在各时间窗内对各行为对象的偏好得分进行加权求和,以获得所述用户对各行为对象的偏好得分。在本申请一可选实施方式中,所述模型处理单元具体用于:对每个行为对象,对各用户对所述行为对象的偏好得分进行累加,以获得所述行为对象的热度值。在本申请一可选实施方式中,所述模型处理单元在获得所述网络对象转移关系推荐数据模型时,具体用于:从对象转移的维度,对所述各行为对象在各种用户行为类型下的用户行为数据进行统计,以获得至少一个行为对象转移对;所述行为对象转移对表示同一用户前后两次用户行为涉及的行为对象之间的转移关系。在本申请一可选实施方式中,所述参数提取模块具体用于:当所述待推荐业务场景为根据目标用户正在搜索的目标行为对象向所述目标用户推荐行为对象时,从所述至少一个行为对象转移对中,获取包含所述目标行为对象且从所述目标行为对象转向另一行为对象的至少一个候选行为对象转移对;所述信息推荐模块具体用于:对所述至少一个候选行为对象转移对中的每个候选行为对象转移对,根据所述目标行为对象转向另一行为对象的次数,计算所述候选行为对象转移对的转移概率;根据每个候选行为对象转移对的转移概率,从所述至少一个候选行为对象转移对中选择目标行为对象转移对,将所述目标行为对象转移对中除所述目标行为对象之外的行为对象推荐给所述目标用户。在本申请中,按照适用于各业务场景的通用数据采集规范,实时采集网络系统中的用户行为,获得实时用户行为数据,按照适用于各业务场景的通用数据处理逻辑,对实时用户行为数据进行分析,以获得至少一种推荐数据模型,当需要进行信息推荐时,可以根据待推荐业务场景从至少一种推荐数据模型中获取参考数据,根据获取的参考数据向所述待推荐业务场景进行信息推荐。由此可见,本申请基于适合各业务场景的通用数据采集规范进行数据采集,并基于适合各业务场景的通用数据处理逻辑给出推荐数据模型,使得可以根据业务场景的不同,从推荐数据模型中选择具体的参考数据向所述待推荐业务场景进行信息推荐,因此可以适用于各种业务场景,通用性较强。【附图说明】为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请一实施例提供的信息推荐方法的流程示意图;图2为本申请另一实施例提供的数据投放框架示意图;图3为本申请又一实施例提供的信息推荐装置的结构示意图;图4为本申请又一实施例提供的信息推荐装置的结构示意图。【具体实施方式】为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。图1为本申请一实施例提供的信息推荐方法的流程示意图。如图1所示,该方法包括:101、按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据。102、按照适用于各业务场景的通用数据处理逻辑,对实时用户行为数据进行分析,以获得至少一种推荐数据模型。103、根据待推荐业务场景,从至少一种推荐数据模型中,获取待推荐业务场景所需的参考数据。104、根据待推荐业务场景所需的参考数据向待推荐业务场景进行信息推荐。本实施例提供一种信息推荐方法,可由信息推荐装置来执行,用以提供一种通用性更强的推荐方法,以适应于各种业务场景。在实际应用中,由于大型网站的业务繁多,业务与业务之前的信息共用性不高。现有推荐系统都是针对特定业务场景的,其所需数据流是固化的,如果要将现有推荐系统直接接入一个数据异构的新业务场景中,其实现成本是很高的。以电子商务领域中的应用为例,假设要将一个用于推荐商品的推荐系统用来推荐促销/优惠活动,这需要重新接入与促销/优惠活动相关的数据,而且还需要更新数据计算,其接入成本不亚于针对促销/优惠活动重新做一套推荐系统。针对上述问题,本实施例提供一种通用的信息推荐方法,具体的:首先,提供一种适合各业务场景的通用数据采集规范,然后按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据,作为信息推荐的原始数据。这里的用户行为主要是指用户对网络系统中的网络对象进行操作的行为。根据应用场景的不同,本实施例的网络系统、网络系统中的用户行为及网络对象均会有所不同。本实施例不对网络系统、网络系统中的用户行为及网络对象的实现形式进行限定。例如,网络系统可以是以各电商网站为核心的网络系统,相应的,网络系统中的网络对象可以为商品对象,网络系统中的用户行为可以包括浏览、收藏、加购物车、购买、支付以及评论中的至少一种。又例如,网络系统可以是以资源下载网站为核心的网络系统,相应的,网络系统中的网络对象可以为下载资源,例如音视频资源、文本资源等,网络系统中的用户行为可以包括预览、下载、播放等中的至少一种。另外,本实施例的网络对象还可以是基于互联网的服务对象,所述服务对象可以是洗车服务、养护服务、按摩服务、清洁服务、厨师上门服务、家政服务、家教服务、娱乐服务、吃喝服务、旅行服务、酒店服务、租车服务等等。在具体实现上,可以是网络系统中每出现一次用户行为,例如网络系统中有用户点击了某个网络对象,或者网络系统中有用户收藏了某个网络对象等,信息推荐装置就执行一次采集操作,对该用户行为进行实时采集,以获得实时用户行为数据。或者,为了减少信息推荐装置实时采集的次数,以减轻信息推荐装置的负担,可以设置一个缓存(cache)空间,用于存储网络系统中出现的用户行为。一次用户行为对应一条用户行为数据。例如,当该缓存空间被写满时,信息推荐装置执行一次采集操作,采集该缓存空间中的用户行为数据。或者,当该缓存空间中记录的用户行为数据达到一定数量(例如500条)时,信息推荐装置执行一次采集操作,采集该缓存空间中的用户行为数据。或者,可以预先设定一定时间间隔(例如1分钟),信息推荐装置可以每间隔一定时间间隔执行一次采集操作,采集该缓存空间中的用户行为数据。由于本实施例提供的信息推荐方法是面向整个网络系统的,优选的需要适应网络系统中的各业务场景,所以有必要定义一套能够体现用户行为信息和网络对象的详细信息的数据规范,并且该数据规范一方面要能够区分不同的业务场景,另一方面还要适合不同的业务场景。在本实施例中,将该数据规范称为通用数据采集规范。基于此,信息推荐装置在对网络系统中的用户行为进行实时采集时,可以按照适合各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集。考虑到在各业务场景中,用户行为一般由行为用户(简称为用户)对网络对象产生的行为构成,即用户行为会涉及用户、网络对象以及用户行为类型等信息。基于此,在上述通用数据采集规范的一种示例中,可以规定采集用户行为涉及的用户标识、网络对象标识、用户行为类型。另外,业务可由其标识来唯一区分,业务标识一般由系统提供方进行统一的分配和管理。为了区分不同业务场景,在通用数据采集规范中还可以规定采集用户行为涉及的业务标识,以标识该用户行为所属的业务。进一步,网络对象所在的业务路径可以反映网络对象的层级关系或归属。例如,目前大多数电商业务都会采用树型或者目录型的组织结构来管理商品。例如,商品会有归属的行业、类目;同时又会划分归属的卖家,还可能划分归属的活动等等。对某个商品来说,可以有多个业务路径,不同的业务路径记录不同的层级结构。比如第一业务路径记录商品归属的行业信息,第二业务路径记录商品的归属的商家,第三业务路径记录商品归属的活动信息。基于此,上述通用数据采集规范还可以规定采集用户行为涉及的网络对象所在的业务路径。综上所述,一种通用数据采集规范规定采集的参数如表1所示。表1以电子商务领域为例,表2给出一种示例,用于说明用户行为类型与其标号之间的对应关系。根据应用场景的不同,用户行为类型与标号之间的对应关系可适应性设置。表2行为类型(action_type)标号说明1点击浏览2系统留言3qq或者微信留言4查看联系方式5收藏6下单7支付8收货9退货10交易关闭11有效合同备案12加入进货单13搜索14喜欢15长时间浏览16vip身份激活……基于上述通用数据采集规范的示例,信息推荐装置具体可以按照通用数据采集规范,实时采集用户行为涉及的业务标识、网络对象标识、网络对象所在的业务路径、用户标识以及用户行为类型等信息,以形成实时用户行为数据。这里的实时用户行为数据包括:业务标识、网络对象标识、业务路径、用户标识、以及用户行为类型。在获得实时用户行为数据之后,信息推荐装置可以按照适合各业务场景的通用数据处理逻辑,对采集到的实时用户行为数据进行分析,以获得至少一种推荐数据模型。在本实施例中,每种推荐数据模型均包括信息推荐所需的参考数据,且不同推荐数据模型包括不同的参考数据。由于本实施例基于适合各业务场景的通用数据处理逻辑对采集到的实时用户行为数据进行处理,因此适合各业务场景。当某个业务场景需要进行信息推荐时,可以根据业务场景,从至少一种推荐数据模型中获取该业务场景所需的参考数据,根据所获取的参考数据向该业务场景进行信息推荐。为便于描述,本实施例将需要进行信息推荐的业务场景称为待推荐业务场景。待推荐业务场景可以是网络系统所支持的各种业务场景。由于本实施例基于适合各业务场景的通用数据采集规范进行数据采集,并基于适合各业务场景的通用数据处理逻辑给出推荐数据模型,使得可以根据业务场景的不同,从推荐数据模型中选择具体的参考数据向所述待推荐业务场景进行信息推荐,因此可以适用于各种业务场景,通用性较强。如何按照适用于各业务场景的通用数据处理逻辑,对实时用户行为数据进行分析,以获得至少一种推荐数据模型是本申请技术方案的核心。下面将具体进行说明。在一种可选实施方式中,上述适合各业务场景的通用数据处理逻辑具体可以是满足各业务场景的信息推荐需求的数据处理逻辑。信息推荐装置可以从用户行为类型和对象类型两个维度,对实时用户行为数据进行解析,以获得各行为对象在各种用户行为类型下的用户行为数据,其中,这里的行为对象为用户行为涉及的网络对象或用户行为涉及的网络对象所在的业务路径上的节点;然后,根据各业务场景的信息推荐需求,对各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得至少一种推荐数据模型。在上述实施方式中,从用户行为类型和对象类型两个维度,对实时用户行为数据进行解析,可以从用户行为类型和对象类型两个维度对用户行为数据进行维护管理,可便于数据按照不同维度进行组装,有利于提高后续数据处理的效率。更进一步,考虑到不同业务场景之间一般是相互独立的。所以,可以按照用户行为涉及的业务标识,将包括相同业务标识的实时用户行为数据划入一个数据分组,该数据分组通过独立的消息队列进行存储管理,从而实现业务之间的隔离。然后,从用户行为类型和对象类型两个维度,对每个数据分组中的实时用户行为数据进行解析,以获得每个数据分组中各行为对象在各种用户行为类型下的用户行为数据。后续,信息推荐装置可以对每个数据分组中各行为对象在各种用户行为类型下的用户行为数据,以获得每个数据分组对应的至少一种推荐数据模型。在一可选实施方式中,适合各业务场景的信息推荐需求包括:网络对象推荐需求、用户偏好推荐需求、网络对象热度推荐需求以及网络对象转移关系推荐需求中的至少一种推荐需求。相应的,至少一种推荐数据模型包括:网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。基于此,上述根据各业务场景的信息推荐需求,对各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得至少一种推荐数据模型的实施方式具体包括:根据网络对象推荐需求、用户偏好推荐需求、网络对象热度推荐需求以及网络对象转移关系推荐需求中的至少一种推荐需求,对各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。对于根据网络对象推荐需求获得网络对象基础推荐数据模型的过程:信息推荐装置可以从网络对象的维度,对各行为对象在各种用户行为类型下的用户行为数据进行组织管理,以获得各网络对象的基础数据。这意味着,网络对象基础推荐数据模型包括各网络对象的基础数据。网络对象的基础数据包括但不限于:网络对象所属业务的业务标识、网络对象标识、网络对象所在的业务路径等。在具体实现上,网络对象所属业务的业务标识和网络对象标识可以作为主键,而网络对象所在的业务路径及其它信息可以作为主键对应的值,以便于进行查询。另外,网络对象所在的业务路径可能会发生变化,此时可以用新的业务路径替换旧的业务路径。在实际应用中,可能会在数据采集过程中出现错误造成业务路径发生变化,此时新的业务路径实际上是错误的,如果用新的业务路径替换旧的业务路径就会发生错误,为避免这种错误,可以记录新的业务路径的出现次数,当新的业务路径的出现次数达到预设阈值时,再用新的业务路径替换旧的业务路径,以降低业务路径被错误更新的概率。对于根据用户偏好推荐需求获得用户偏好推荐数据模型的过程:信息推荐装置可以从用户、网络对象以及用户行为类型三个维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;然后,根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分。进一步,考虑到用户行为对用户或网络对象的影响程度会随着时间的推移而逐渐减弱,所以本实施例根据艾宾浩斯遗忘曲线理论,为不同用户行为类型设置不同的权值,该权值以时间作为衰减参数,从而更加合理的考虑用户行为对用户偏好的影响。基于上述,对每个用户,对该用户在各时间窗内对各行为对象发生每种类型的用户行为的次数进行加权求和,以获得该用户在所述时间窗内对行为对象的偏好得分;按照时间衰减因子,对该用户在各时间窗内对各行为对象的偏好得分进行加权求和,以获得该用户对各行为对象的偏好得分。具体的,信息推荐装置可以根据公式(1),计算各用户对各行为对象的偏好得分。在上述公式(1)中,f(u,o)表示用户u对行为对象o的偏好得分;u表示用户;o表示行为对象,可以是用户行为涉及的网络对象或者网络对象所在的业务路径上的节点;m表示时间窗的总数,每个时间窗代表指定时长;例如,每个时间窗代表的时长可以是但不限于:20分钟;yi(u,o)表示用户u在第i个时间窗内对行为对象o的偏好得分;p(t)表示艾宾浩斯遗忘曲线的时间衰减因子。其中,p(t)=k1+exp((-t-k2)/k3)。n表示用户行为类型的数量,例如点击、下单、支付、收藏等属于不同类型的用户行为;wj表示第j种用户行为类型的权重;xj(u,o)表示用户u对行为对象o发生第j种类型的用户行为的次数;t表示时间长度;k1、k2、k3均为衰减因子。经过上述处理,可以获得各用户的偏好得分。用户偏好推荐数据模型包括各用户的偏好得分。另外,在上述计算用户偏好推荐数据模型的过程中,还可以获取各用户的历史行为数据从而形成用户历史行为推荐数据模型。对于根据网络对象热度推荐需求获得网络对象热度推荐数据模型的过程:信息推荐装置可以从用户、网络对象以及用户行为类型三个维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分;根据各用户对各行为对象的偏好得分,计算各行为对象的热度值。同理,信息推荐装置可以按照上述具体方式计算各用户对各行为对象的偏好得分,在此不再赘述。在一种具体实施方式中,计算各行为对象的热度值的过程具体为:对每个行为对象,对各用户对该行为对象的偏好得分进行累加,以获得该行为对象的热度值。具体的,信息推荐装置可以根据公式(2),计算各行为对象的热度值。在上述公式(2)中,h(o)表示行为对象o的热度值,其它参数可参见公式(1)中的解释或说明,在此不再赘述。值得说明的是,上述把各用户对同一网络对象的偏好得分进行累加,并将累加结果作为该网络对象的热度值仅为一种具体实施方式,并不限于此。例如,还可以从单一维度对网络对象进行排序,例如按照销量进行排序、按照点击率进行排序、按照网络对象的销售价格进行排序等等,或者也可以根据多种因素进行综合排序,然后根据排序先后顺序确定网络对象的热度值。对于根据网络对象转移关系推荐需求获得网络对象转移关系推荐数据模型的过程:信息推荐装置可以从对象转移的维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,以获得至少一个行为对象转移对,这里的行为对象转移对表示同一用户前后两次用户行为涉及的行为对象之间的转移关系。优选的,上述行为对象转移对具体可以是用户倒数第二次用户行为涉及的行为对象到最后一次用户行为涉及的行为对象之间的转移关系。优选的,上述行为对象转移对中的行为对象的类型和级别相同。例如,两个行为对象都是商品、或者两个行为对象都是商家,或者两个行为对象都是相同级别的类目,等等。对于上述信息推荐装置从对象转移的维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,获得行为对象转移对的操作,其在具体实现上可以是:信息推荐装置从各行为对象在各种用户行为类型下的用户行为数据中,获取一条用户行为数据,记录该用户行为数据涉及的用户标识和网络对象标识;根据用户标识查询该用户标识所标识的用户最近一次发生用户行为涉及的网络对象标识,将这两个网络对象标识所标识的网络对象形成行为对象转移对。可选的,在获得行为对象转移对的同时,可以为该行为对象转移对加上时间戳,以便于对该行为对象转移对进行更新。例如,可以通过行为对象转移对的时间戳来判断该行为对象转移对是否过期,例如若从时间戳到当前时刻的时间间隔大于预设时间间隔的阈值(例如该阈值可以是但不限于7天),则确定该行为对象转移对过期,否则确定该行为对象转移对未过期;如果行为对象转移对过期,则可以将其删除,一方面可以节约存储空间,另一方面也可以提高网络对象转移关系推荐数据模型的精度,进而提高后续基于该网络对象转移关系推荐数据模型进行信息推荐时的精度。经过上述处理,可以获得上述网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。在获得这些推荐数据模型之后,可以根据业务场景从这些推荐数据模型中提取参考数据,进而基于参考数据向所述待推荐业务场景进行信息推荐,这部分可称为数据投放过程。一种数据投放过程的示意图如图2所示,本实施例提供的这些推荐数据模型支持多种业务场景。在数据投放过程中,预先为每个业务场景分配一个唯一的标识(id),并记录业务场景所需的参数及其组合方式;当每个业务场景发送参数请求时,携带该业务场景的标识以及其所需的参数及其组合方式等参数(例如可以包括用户标识,对象标识等);模型配置与组装模块按照业务场景及其传递的参数及其组合方式到相应的推荐数据模型中获取参考数据并按照组合方式进行组装,然后返回到业务场景中,以供业务场景输出推荐结果。举例说明:当用户在电商平台上搜索商品时,电商平台可以从用户历史行为推荐数据模型中获取用户最近浏览过的商品中与用户当前搜索的商品相似的商品,并从用户偏好推荐数据模型中获取这些相似商品中偏好得分较高的商品,然后将这些相似且偏好得分较高的商品推荐给用户。或者,当用户在电商平台上搜索商品时,电商平台可以从用户历史行为推荐数据模型中获取用户最近浏览过的商品中与用户当前搜索的商品相似的商品,然后从用户偏好推荐数据模型中获取这些商品中偏好得分较高的商品,再从网络对象热度推荐数据模型中获取这些相似商品中热度值较高的商品,最终选择偏好得分较高且热度值较高的商品推荐给用户。或者,当用户在电商平台上搜索商品时,电商平台可以确定用户当前搜索商品所在的类目路径,例如假设用户搜索的商品属于连衣裙类目下,然后按照该类目路径到网络对象热度推荐数据模型中进行搜索,获取热度值最高的n个商品,例如选择连衣裙类目下销量最好的50件商品,然后推荐给用户。在一种具体实施方式中,待推荐业务场景具体为根据目标用户正在搜索的目标行为对象向目标用户推荐网络对象。在该业务场景中,一种从至少一种推荐数据模型中,获取待推荐业务场景所需的参考数据的实施方式包括:从网络对象转移关系模型包含的至少一个行为对象转移对中,获取包含该目标行为对象且从目标行为对象转向另一行为对象的至少一个候选行为对象转移对。这里至少一个候选行为对象转移对即为待推荐业务场景所需的参考数据。相应的,上述根据待推荐业务场景所需的参考数据向所述待推荐业务场景进行信息推荐具体为:对至少一个候选行为对象转移对中的每个候选行为对象转移对,根据该候选行为对象转移对中的目标行为对象转向另一行为对象的次数,计算该候选行为对象转移对的转移概率;例如,可以根据如下公式(3),获得每个候选行为对象转移对的转移概率;之后,根据每个候选行为对象转移对的转移概率,从至少一个候选行为对象转移对中选择目标行为对象转移对,将目标行为对象转移对中除目标行为对象之外的行为对象推荐给目标用户。在上述公式(3)中,表示由目标行为对象ai转向另一行为对象aj形成的候选行为对象转移对的转移概率;表示从目标行为对象ai转向另一行为对象aj的转移次数,实际上也是候选行为对象转移对出现的次数,比如,假设从目标行为对象ai转向另一行为对象aj有100次或200次等,例如用户浏览连衣裙后又浏览牛仔裤的次数共有100次或200次,或者用户浏览华为手机后又浏览苹果手机的次数为50次;k1、k2表示可调参数。值得说明的是,信息推荐装置根据上述公式(3)计算候选行为对象转移对的转移概率实际上是玻尔兹曼分布概率。本实施例之所以采用玻尔兹曼分布概率,主要是考虑到实时系统的统计周期较短,大部分的样本统计差异不大。而玻尔兹曼分布可以把细小的差距从概率上进行放大,从而保证结果有较强的区分度。在本申请实施例中,基于适用于各业务场景的通用数据采集规范,实时采集网络系统中的用户行为,以获得实时用户行为数据,然后基于适合各业务场景的通用数据处理逻辑,对这些实时用户行为数据进行分析以形成推荐数据模型,推荐数据模型可以采用键值(key-value)格式,通用性和可移植性很强。本申请实施例提供的技术方案适用于不同业务场景,解决了现有推荐系统存在的缺陷,适用于业务类型不断增多的应用场景,有利于降低为新增业务场景信息推荐的开发与维护成本。另外,本申请实施例基于实时用户行为数据进行信息推荐,不需要离线收集数据的过程,可以快速对接新业务,不需要过多时间进行数据积累,解决了业务变更频繁以及用户行为稀疏所带来的冷启动问题,提升用户体验。在产品实现上,上述实时采集以及对实时用户行为数据进行解析的操作可通过一个消息中间件来实现,例如notify中间件。中间计算各推荐数据模型的的操作可通过一个实时计算系统来实现,例如storm。上述数据投放过程可以通过模型配置与组装模块实现,但不限于此。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。图3为本申请又一实施例提供的信息推荐装置的结构示意图。如图3所示,该装置包括:实时采集模块31、模型计算模块32、参数提取模块33和信息推荐模块34。实时采集模块31,用于按照适用于各业务场景的通用数据采集规范,对网络系统中的用户行为进行实时采集,以获得实时用户行为数据。模型计算模块32,用于按照适用于各业务场景的通用数据处理逻辑,对实时采集模块31采集到的实时用户行为数据进行分析,以获得至少一种推荐数据模型。参数提取模块33,用于根据待推荐业务场景,从模型计算模块32获得的至少一种推荐数据模型中,获取待推荐业务场景所需的参考数据。信息推荐模块34,用于根据参数提取模块33获取的待推荐业务场景所需的参考数据向待推荐业务场景进行信息推荐。在一可选实施方式中,实时采集模块31具体用于:实时采集用户行为涉及的业务标识、网络对象标识、网络对象所在的业务路径、用户标识以及用户行为类型,以形成实时用户行为数据。在一可选实施方式中,如图4所示,模型计算模块32的一种实现结构包括:数据解析单元321和模型处理单元322。数据解析单元321,用于从用户行为类型和对象类型两个维度,对实时用户行为数据进行解析,以获得各行为对象在各种用户行为类型下的用户行为数据,其中,行为对象为用户行为涉及的网络对象或用户行为涉及的网络对象所在的业务路径上的节点。模型处理单元322,用于根据各业务场景的信息推荐需求,对各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得至少一种推荐数据模型。进一步,数据解析单元321具体用于:根据用户行为涉及的业务标识,将包括相同业务标识的实时用户行为数据划入一个数据分组;从用户行为类型和对象类型两个维度,对每个数据分组内的实时用户行为数据进行解析,以获得每个数据分组中各行为对象在各种用户行为类型下的用户行为数据。进一步,模型处理单元322具体用于:根据网络对象推荐需求、用户偏好推荐需求、网络对象热度推荐需求以及网络对象转移关系推荐需求中的至少一种推荐需求,对各行为对象在各种用户行为类型下的用户行为数据进行分析处理,以获得网络对象基础推荐数据模型、用户偏好推荐数据模型、用户历史行为推荐数据模型、网络对象热度推荐数据模型以及网络对象转移关系推荐数据模型中的至少一种推荐数据模型。在一可选实施方式中,模型处理单元322在获得网络对象基础推荐数据模型时,具体用于:从网络对象的维度,对各行为对象在各种用户行为类型下的用户行为数据进行组织管理,以获得各网络对象的基础数据。在一可选实施方式中,模型处理单元322在获得用户偏好推荐数据模型时,具体用于:从用户、网络对象以及用户行为类型三个维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分。在一可选实施方式中,模型处理单元322在获得网络对象热度推荐数据模型时,具体用于:从用户、网络对象以及用户行为类型三个维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,获得各用户对各行为对象发生每种类型的用户行为的次数;根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分;根据各用户对各行为对象的偏好得分,计算各行为对象的热度值。进一步,在上述获得用户偏好推荐数据模型或网络对象热度推荐数据模型的过程中,模型处理单元322在根据各用户对各行为对象发生每种类型的用户行为的次数,计算各用户对各行为对象的偏好得分时,具体用于:对每个用户,对该用户在各时间窗内对各行为对象发生每种类型的用户行为的次数进行加权求和,以获得该用户在各时间窗内对各行为对象的偏好得分;按照时间衰减因子,对该用户在各时间窗内对各行为对象的偏好得分进行加权求和,以获得该用户对各行为对象的偏好得分。具体的,可以根据公式(1),计算各用户对各行为对象的偏好得分。关于公式(1)可参见上述方法实施例,在此不再赘述。基于上述根据公式(1),计算各用户对各行为对象的偏好得分,模型处理单元322在根据各用户对各行为对象的偏好得分,计算各行为对象的热度值以构成网络对象热度推荐数据模型时,具体用于:对每个行为对象,对各用户对所述行为对象的偏好得分进行累加,以获得所述行为对象的热度值。具体的,可以根据公式(2),计算各行为对象的热度值。关于公式(2)可参见上述方法实施例,在此不再赘述。在一可选实施方式中,模型处理单元322在获得网络对象转移关系推荐数据模型时,具体用于:从对象转移的维度,对各行为对象在各种用户行为类型下的用户行为数据进行统计,以获得至少一个行为对象转移对。行为对象转移对表示同一用户前后两次用户行为涉及的行为对象之间的转移关系。基于上述,参数提取模块33具体可用于:当待推荐业务场景为根据目标用户正在搜索的目标行为对象向目标用户推荐行为对象时,从至少一个行为对象转移对中,获取包含目标行为对象且从目标行为对象转向另一行为对象的至少一个候选行为对象转移对。相应的,信息推荐模块34具体用于:对至少一个候选行为对象转移对中的每个候选行为对象转移对,根据目标行为对象转向另一行为对象的次数,计算该候选行为对象转移对的转移概率;例如,可以根据公式(3),计算每个候选行为对象转移对的转移概率;之后,根据每个候选行为对象转移对的转移概率,从至少一个候选行为对象转移对中选择目标行为对象转移对,将目标行为对象转移对中除目标行为对象之外的行为对象推荐给目标用户。关于公式(3)可参见上述方法实施例,在此不再赘述。本实施例提供的信息推荐装置,一方面基于适合各业务场景的通用数据采集规范进行数据采集,并基于适合各业务场景的通用数据处理逻辑给出推荐数据模型,使得可以根据业务场景的不同,从推荐数据模型中选择具体的参考数据向待推荐业务场景进行信息推荐,因此可以适用于各种业务场景,通用性较强;另一方面,采用实时用户行为数据进行信息推荐,不需要离线收集数据的过程,可以快速对接新业务,不需要过多时间进行数据积累,解决了业务变更频繁以及用户行为稀疏所带来的冷启动问题,提升用户体验。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1