在线系统个性化推荐的方法、系统以及装置、电子设备与流程

文档序号:11276317阅读:359来源:国知局
在线系统个性化推荐的方法、系统以及装置、电子设备与流程

本申请涉及计算机技术领域,具体涉及一种在线系统个性化推荐的方法;相应于上述方法,本申请同时涉及一种在线个性化推荐的装置以及电子设备,以及一种在线系统个性化推荐的系统。



背景技术:

互联网技术的迅猛发展使人类进入了信息爆炸的时代。海量信息的同时呈现,一方面使信息获得者很难从中发现自己感兴趣的部分,另一方面也使得大量少人问津的信息无法被一般用户获取,以上情况严重阻碍了信息效用的充分发挥。

为解决上述问题,目前出现了个性化推荐系统。个性化推荐系统通过建立用户与信息之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的个性化信息,进而进行个性化推荐,使信息与信息使用者之间具有更高的匹配度。

现有技术下的个性化推荐系统,采用如下方式实现。

首先预先大量搜集用户的行为,提炼出样本数据,根据这些样本数据,通过机器学习的方法,训练得到用户模型,在线根据每个用户的用户特征数据以及上述用户模型,为用户推荐个性化信息,在在线交易系统中,所述个性化信息对应于个性化推荐的实体,一般包括商品、店铺或者品牌等;例如,亚马逊网站根据用户特征数据推荐书籍,就是个性化推荐实体的例子。

在上述现有技术下,需要通过不同系统搜集大量数据,并将采集到的原始数据,汇总到离线平台。例如,将用户曝光日志、点击日志、成交数据、购物车行为、收藏夹数据等多个不同应用的数据,汇总到离线平台。然后,根据这些原始数据计算所有用户的特征以及特征数据,再根据这些数据中记录的用户反馈行为,如:点击、访问、点赞、收藏、预定、购买等,对样本进行打标,最后在离线大数据平台中进行模型训练。训练完毕,将获得的用户模型上线使用。

上述现有技术存在明显缺陷,主要问题在于,需要从多个平台回流数据,然后汇总、计算,这个过程需要耗费较多的计算资源和存储资源;此外,由于各个平台回流数据的效率和时点不一,造成模型训练需要等待较长时间,使训练模型的实时性差。而且,由于一次需要积累的数据量比较大,一般只能使用所搜集的一部分数据记录,很多数据反映的情况无法反映到用户模型中,无法真正落实大数据应用。



技术实现要素:

本申请提供一种在线系统个性化推荐的方法,以解决现有技术下资源消耗过多,实时性差的问题,并真正落实大数据应用。本申请还提供一种在线个性化推荐系统,以及在线系统个性化推荐装置;以及一种实现在线系统个性化推荐的电子设备。

本申请提供一种在线系统个性化推荐的方法,包括:

接收访问用户的访问请求,并提取所述访问用户的用户特征数据;

根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息;

实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并形成新增用户模型训练条目;

将所述新增用户模型训练条目加入训练样本集;

以当前训练样本集进行用户模型训练;

所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

可选的,所述用户特征数据至少包括:用户身份标识,并包括下列任何用户特征数据中的至少一个:性别,年龄,交易记录。

可选的,所述个性化推荐信息包括下列个性化推荐实体的至少一种:商品、店铺、品牌。

可选的,所述访问用户作出反馈操作包括如下操作之一:点击,访问,点赞,收藏,预定,购买。

可选的,所述训练数据条目中还包括以下数据的一种或者两种:获取该记 录的时间点、资源位信息。

可选的,将积累的所述新增用户模型训练条目加入训练样本集之后,所述以当前训练样本集进行用户模型训练的步骤之前,执行下述步骤:

判断所述新增用户模型训练样本是否达到预定的阈值;若是,则进入下一步骤。

可选的,所述用户模型训练采用机器学习方法。

可选的,所述机器学习方法采用逻辑回归方法或者梯度提升决策树方法。

可选的,所述新增用户模型训练条目采用日志方式记录。

相应的,本申请还提供一种在线系统个性化推荐的装置,包括:

用户特征数据提取单元,用于接收访问用户的访问请求,并提取所述访问用户的用户特征数据;

个性化推荐信息提供单元,用于根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息;

用户模型训练条目形成单元,用于实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并形成新增用户模型训练条目;

训练样本集搜集单元,用于将所述新增用户模型训练条目加入训练样本集;

用户模型训练单元,用于以当前训练样本集进行用户模型训练;

用户模型更新单元,用于在所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

相应的,本申请还提供一种电子设备,包括:

显示器;

处理器;

存储器,用于存储实现在线系统个性化推荐的方法的程序,该设备通电并运行该在线系统个性化推荐的方法的程序后,执行下述步骤:

接收访问用户的访问请求,并提取所述访问用户的用户特征数据;

根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息;

实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性 化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并将为访问用户的一次访问-推荐过程形成的上述内容组合为一条新增的用户模型训练条目;

将所述新增的用户模型训练条目加入训练样本集;

以当前训练样本集进行用户模型训练;

所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

相应的,本申请还提供一种在线个性化推荐的系统,包括:在线子系统、离线子系统;

所述在线子系统,用于接收用户的访问请求,并提取用户特征数据,并根据所提取的用户特征数据以及当前用户模型,向提出访问请求的用户提供个性化推荐实体;以及,实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户对所述个性化推荐信息的反馈信息,形成新增用户模型训练条目并发送;以及,接收所述离线子系统提供的更新的用户模型;

所述离线子系统,接收所述在线子系统发送的新增用户模型训练条目,并将所述新增用户模型训练条目加入当前训练样本集;采用所述当前训练样本集进行用户模型训练,将训练完成获得的更新的用户模型向外发送。

与现有技术相比,本申请提供的在线系统个性化推荐的方法,对用户特征数据、个性化推荐信息和对所述用户作出反馈操作的所述个性化推荐信息进行实时搜集,并形成新增用户模型训练条目,通过积累所述用户模型训练条目形成的训练样本集,训练所述用户模型,并在新的用户模型形成后,立即作为当前用户模型,用于向用户提供个性化推荐信息。

使用本申请提供的方法,在向用户提供个性化推荐信息的同时,进行信息搜集并形成用户模型训练条目;这种处理方式,可以有效减少信息汇总产生的计算量,并且减少了存储中间信息的存储空间;因此,本申请提供的方法可以有效减少资源消耗。

在本申请提供的方法中,用户模型训练条目随时可以用于进行用户模型训练,并且新形成的用户模型可以马上在向用户提供个性化推荐信息时使用。这样,可以随时根据新搜集的数据对用户模型进行调整,并迅速用于向用户提供个性化推荐信息;因此,本申请提供的方法能够及时根据所搜集的数据对用户 模型进行调整,比现有技术具有更高实时性。此外,本申请提供的方法,还能够充分利用所搜集到的全部数据,有效实现大数据应用。

附图说明

图1是本申请第一实施例提供的一种在线系统个性化推荐的方法流程图;

图2是本申请第二实施例提供的一种在线系统个性化推荐的装置的单元框图;

图3是本申请第四实施例提供的一种在线系统个性化推荐的系统示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是,本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此,本申请不受下面公开的具体实施的限制。

本申请提供了一种在线系统个性化推荐的方法和装置,以及一种在线个性化推荐的系统;以及在线系统个性化推荐的电子设备,在下面的实施例中逐一进行详细说明。

为了便于理解本申请的技术方案,首先对提出本申请的背景及本申请的技术方案作简要说明。

参照图1,其示出了本申请第一实施例提供的一种在线系统个性化推荐的方法处理流程图。

在该实施例中,系统根据用户特征数据,以及当前用户模型,提供个性化推荐实体;并且,会记录本次推荐相关的用户特征数据、为用户提供的所述个性化推荐信息,以及用户作出反馈操作的情况,并将其作为训练新的用户模型的数据。

例如:当用户在购买一部手机时,系统将根据用户特征数据,推荐适合用户需要的耳机,手机套等商品;用户对某款耳机作出购买操作;上述过程可能形成多条用户模型训练条目,其中一条新增用户模型训练条目,包括如下数据:该用户的用户特征数据、向用户推荐的耳机、以及该用户将对耳机作出购买操 作的打标记录,这条用户模型训练条目作为正样本;另外一条新增用户模型训练条目包括如下数据:该用户的用户特征数据,向用户推荐的手机套,以及该用户未对手机套作出操作的打标记录,该条用户模型训练条目可以作为负样本使用。

以下结合图1对本实施例提供的一种个性化推荐系统方法进行说明,并且对该方法的各个步骤进行说明。

步骤s101,接收访问用户的访问请求,并提取所述访问用户的用户特征数据。

所谓访问用户,主要指通过因特网或者移动网在线访问特定站点、网页、服务器的用户。

所述访问用户的用户特征数据,是指反映访问用户本身的各方面特征信息的数据。这些数据可以通过不同渠道获得。

首先,访问用户一般通过浏览器或者app应用作为中介,实现对特定站点、网页、服务器的访问。登陆这些特定站点、网页或者服务器一般需要通过账户登陆,对应这些账户会记录有用户相关的特征数据。

其次,用户特征数据也可以通过用户访问方式、用户访问区域等不需要用户登录账户的方式获得。例如,所述访问用户的访问方式特征包括:互联网访问还是移动互联网访问;移动互联网访问中,还可以进一步判断使用的访问终端的品牌;所述用户访问区域,即lbs信息,即用户进行访问时所在的地域,这些地域可以根据具体地点划分为不同类型,如高校、商务办公地点;如城市、乡镇,每一种类型均反映用户可能具有不同的影响其反馈操作行为的特征。

所述用户特征数据,从获得方式划分,包括用户自己提供的数据,以及根据用户登陆访问行为获得的相关数据。

所述用户自己提供的数据,包括用户登陆时提供的用户身份标识,以及注册时提供的性别,年龄等信息;也可以包括用户在使用网站、服务器中关联的邮箱、银行账号等信息。

所述根据用户登陆访问行为获得的相关数据,包括直接获得的数据和间接获得的数据。

所述直接获得的数据包括:用户对购物网站的访问、下单情况获得的用户访问记录、用户购买记录以及其他各种用户行为信息,这些信息是对用户历史 行为的直接记录。

所述间接获得的数据,主要是从上述直接获得的数据中总结出的反映用户特征的数据,例如,根据用户购买的书籍,对用户的文化水平、阅读领域作出的归类等。根据用户购买的商品品牌,对用户的购买力水平做出的判断等。

在不同的应用场景下,所述用户特征数据的具体会包含不同具体项目,但不论何种情况,至少包括用户身份标识(id),用户身份标识可以直接通过用户登陆时提供的信息获得,并可以作为进一步查询获得用户的其它信息记录的依据;例如,用户的性别,年龄,以及交易记录(在网络购物的场景下)等,这些信息如前所述,一般以用户身份标识作为主关键字存储在数据库的记录表中。记录用户特征数据的数据表或者数据库既可以在远程的服务器上,也可能在客户端。

以上说明获得用户特征数据的各种渠道和获得方式,在具体实施例中,根据不同的需求,需要根据具体情况搜集所需要的用户特征数据,这些用户特征数据应当是对用户模型训练有用的数据。

一般而言,所述用户特征数据至少包括用户身份标识,并包括下列任何用户特征数据中的至少一个:性别,年龄,交易记录;当然,用户特征数据完全可以包含其他可能相关的数据。随着大数据技术的发展以及数据挖掘技术的进步,越来越多的数据相关性被发现,并且有越来越好的数据模型可以反映各种数据对最终希望提供的个性化推荐信息的作用,因此,可以用于用户模型训练的用户特征数据的类型也会越来越多。

本步骤所称的访问请求,可以包括对特定网站、网页的访问浏览,也可以指用户在网站中对商品等的搜索。

步骤s102,根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息。

通过前述步骤s101,获得了访问用户的用户特征数据;这些用户特征数据能够作为为用户提供个性化推荐信息的依据;具体获得个性化推荐信息需要通过使用当前用户模型,以所述用户特征数据为依据,带入当前用户模型,推导出所述个性化推荐信息。

所述当前用户模型,是根据所述访问用户访问前搜集的各个用户的用户特征数据,以预定的方式进行训练获得的当前正在使用的用户模型。当前用户模 型的作用是,向其提供所需要的特定的用户特征数据后,当前用户模型能够根据用户特征数据反映的用户特性,向该用户提供相应的个性化推荐信息。

在本实施例中,通过不断搜集数据,能够不断积累新的训练数据,这些训练数据可以用于对所述用户模型的训练,从而获得更新的用户模型。本步骤使用当前用户模型一词,其中“当前”即说明用户模型在本实施例中是不断修正、演变的,本步骤使用的用户模型为当前有效的用户模型,但过一段时间,该用户模型可能就已经由于新的训练过程而有所变化。

所述个性化推荐信息,是指所述当前用户模型根据特定访问用户的用户特征数据推算出的向该特定访问用户推荐的信息。所述推荐,主要指在该访问用户的访问界面展示,包括视觉、听觉或者其它可能方式的展示;所述个性化,其含义是指与该用户的用户特征相匹配。

所述个性化推荐信息根据具体情况可以对应不同类型的个性化推荐实体,在本实施例中,假定场景为电商的销售场景,则所述个性化推荐信息可以是如下类型的个性化推荐实体:商品、店铺或者品牌。

例如,某位访问用户正在访问网上书店,根据其用户特征数据反映的该用户的兴趣范围,可以为其推荐相关的书籍商品;某访问用户访问淘宝网站,搜索笔记本,根据其用户特征数据反映的该用户的价格承受能力或者品牌喜好,可以为其推荐符合其用户特征并出售笔记本的网上店铺;某访问用户正在查询购买服装,根据其用户特征反映的该用户的性别、年龄、以及购买能力,可以为其推荐提供符合其性别、年龄以及消费层次的服装品牌。

所述当前用户模型可以包括一个或者多个子模型,分别负责从不同角度为访问用户进行不同方面信息的个性化推荐;并且可以最终在同一个访问界面展现,当然,也可以根据用户访问的具体情况展现使用特定的当前用户模型的子模型,例如,一个已经注册过的用户通过账户登录后,立刻根据其用户特征数据,向其展现其上次登录后新出现的该用户可能关心的商品、店铺或者品牌;或者,用户搜索书籍时,立刻使用负责推荐书籍的当前用户模型的子模型根据用户特征数据为用户推荐适当的书籍。这些子模型使用的具体的用户特征数据,可能分别是该访问用户的所有用户特征数据的一个特定部分。这些不同的子模型也可以视为同一个当前用户模型的不同功能单元。

步骤s103,实时搜集所述访问用户的用户特征数据、为所述访问用户提供 的所述个性化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并形成新增用户模型训练条目。

本步骤用于搜集用户访问、向用户提供个性化推荐信息以及用户对个性化推荐信息进行反馈这一完整的访问-推荐过程形成的所有相关内容,包括:个性化推荐的原始依据,即用户特征数据;为所述访问用户提供的个性化推荐信息;对个性化推荐的反馈,即所述访问用户对何种个性化推荐信息作出了反馈以及具体作出何种反馈。最终将这些内容组合形成数据记录。一次访问-推荐过程形成的所述数据记录可以采用不同的具体形式记录。例如,可以记录为一个完整的数据包,发送到后台,由后台服务器根据模型训练的需求从中抽取出相关数据形成多条新增用户模型训练条目。当然,也可以直接形成新增用户模型训练条目并发送。总之,需要根据用户模型训练的需要以适当的方式搜集和解析一次访问-推荐过程形成的数据记录。

所述新增用户模型训练条目,作为后续的用户模型训练的训练素材。根据需要,所搜集的信息还可以进一步包括获取该记录的时间点、以及资源位信息,所述获取该记录的时间点,即记录形成该新增的用户模型训练条目的信息形成时间;所述资源位信息,即记录相关信息所在的位置,例如,某个具体的个性化推荐信息在浏览器的顶部或者下部,或者侧栏,等等,这些信息对于用户的反馈行为也有重要影响。

实现本步骤,需要在供访问用户使用的浏览器或者app中植入程序,该程序随时搜集所有向用户提供的个性化推荐信息以及用户对个性化推荐信息的反馈操作,将这些信息和先前作为个性化推荐信息已经获得的用户特征数据对应,并通过网络传送到训练用户模型的服务器一端。具体使用的植入程序可以根据不同环境采用不同的类型,例如,采用javascript脚本程序在浏览器中对通过浏览器提供的各种信息以及通过浏览器界面发生的各种操作进行记录。

所述访问用户的反馈操作,包括访问用户对所述个性化推荐信息作出的各种方式的反馈,例如:点击,访问,点赞,收藏,预定,购买等操作。这些操作反应了访问用户对不同的个性化推荐信息的关心程度的差异,这些差异对于调整向用户推荐的个性化信息有重要意义。

记录所述访问用户作出反馈操作的所述个性化推荐信息的方法,可以是在这些信息上加上特定标识,即,在这些个性化推荐信息的记录上加上表示对其 发生了反馈操作的标识,一般称为打标;例如,在记录表格中对应每个性化推荐信息设置有标识是否在其上发生了反馈操作的字段,这个字段也可以直接记录发生的反馈操作是什么,通过这种记录方式,就在记录个性化推荐信息的同时对访问用户的反馈进行了记录。

所述将为访问用户的一次访问-推荐过程形成的上述内容形成新增用户模型训练条目,具体可以采用多种方式,一种比较简单的优选方式是,将这些内容以固定的格式形成日志记录,并随时以日志方式发送,该日志的接收方根据日志格式的规定,将其还原为表格形式或其他数据存储形式,并根据用户模型训练的需要进行解析,抽取出一个或者若干个用户模型训练条目,该用户模型训练条目中记录的用户特征数据,可以作为模型训练的输入数据,该用户模型训练条目记录的个性化推荐信息中,该访问用户没有做出反馈的,可以作为用户训练的负样本,该访问用户做出反馈的,可以作为用户训练的正样本。

步骤s104,将所述新增用户模型训练条目加入训练样本集。

本步骤中,将前一步骤形成的新增用户模型训练条目加入训练样本集。所谓训练样本集,即用于用户模型训练的样本数据的集合;对用户模型进行训练需要搜集大量的用户模型训练条目,从大量的样本数据中才能实现对用户模型的有意义的调整,这些训练样本不断积累,并不断用于用户模型训练,则最终训练获得的用户模型就会更为精确。

在实际实现中,新增用户模型训练条目是通过每一次访问用户的访问过程中形成的所有访问相关数据,一次次累计起来,通过不断积累用户模型训练条目,事实上获得了大数据的效果。

所述训练样本集,存储在服务器一端的训练样本集数据库中;该训练样本集根据模型训练的要求,一般会采用特定的记录格式;所述将新增的用户模型训练条目加入训练样本集的过程,具体包括对原始条目的解析过程,最终将其中的有效数据以符合要求的格式存入训练样本集所在的数据库。

例如,上一步骤形成的新增用户模型训练条目采用日志形式记录,则将所述日志发送到服务器一端,服务器一端以预定的日志格式为依据,对该条日志中记录的内容进行解析,将该用户模型训练条目中的内容按照训练数据需要的形成用户模型训练条目,并记载到训练样本集数据库的相应位置。

步骤s105,以当前训练样本集进行用户模型训练。

所述当前训练样本集,是指在启动用户模型训练时搜集到的所有有效的训练样本组成的数据集合。

在本申请提供的技术方案中,训练数据通过每次用户访问过程不断积累,其训练样本集的内容是一个动态累计的过程。因此,每次启动用户模型训练时,其训练样本集都会发生变化,即样本数据会增加;使用更多的样本数据进行模型训练,则模型的精确度也会提升。当然,训练样本集也可以设定数据淘汰的机制,例如,可以将积累实践超过一定时间的样本数据淘汰;如某些用户购物的相关样本数据以及是一年前的,已经无法准确反映用户的情况,则这些数据可以淘汰掉。

所述用户模型训练样本用于用户模型训练,可以使用将新增的用户模型训练对原有的用户模型进行调整,即进行增量训练,也可以是将新增的用户模型训练样本加入原有的用户模型训练样本中,形成一个全量的用户模型训练样本,并对用户模型从头进行训练,即全量训练。

由于启动用户模型训练后,训练过程需要较长时间,并且占用计算资源,因此,在通常情况下,一般不会每次出现新增用户模型训练样本都启动一次模型训练,而是在符合一定条件的情况下才启动所述模型训练。即在本步骤前,增加一个判断所述新增的用户模型训练样本是否达到预定的阈值的判断过程,若是,则进入本步骤,否则,暂时不进入本步骤。

所述一定条件,可以包括积累数量条件以及积累时间条件,可以考虑上述两个条件任意一者,也可以同时考虑两个阈值条件。

例如,在一个不断产生交易的电商平台中,可以确定适当的时间阈值,例如24小时,当该时间阈值到达后,则启动新一轮用户模型训练,将该段时间内新增的用户模型训练样本用于这一轮训练中。

再如,在一个交易比较少的拍卖平台中,可以确定适当的数量阈值,当新增的用户模型训练样本的条目积累数量超过该阈值时,则启动新一轮的用户模型训练,并将新增的用户模型训练样本用于这一轮训练中。

类似的,对于某个平台,可以同时设置积累时间阈值和积累数量阈值,两者都达到条件,则启动用户模型训练;或者,两者任意一个达到条件,则启动用户模型训练。

所述用户模型训练,在现有技术下可以采用多种方式实现,主要是通过机 器学习方法实现用户模型训练,具体采用的机器学习方法例如可以是逻辑回归方法或者梯度提升决策树方法。以下以逻辑回归方法对用户模型训练过程做简要说明。

所述逻辑回归方法包括:训练数据收集,特征提取,特征筛选,模型训练。

所述训练数据收集即前述步骤形成的用户模型训练样本集。

所述特征提取,即根据上述训练样本集中的数据,收集与拟合目标相关的各种数据。

所述特征筛选,用相关性衡量方法衡量特征(本实施例中来自用户特征数据)与拟合目标之间的相关性程度,并过滤相关性小于给定阈值的特征;例如,本实施例用于服装电商,可以根据训练样本中的已知数据,衡量用户的特定年龄、性别特征与推荐服装品牌之间的相关性,若相关性达到预设的阈值要求,则将年龄,性别特征作为与服装品牌相关的特征。

所述模型训练阶段,基于前述用户模型训练数据,对具有相关性的用户数据拟合回归模型,使得根据回归模型得到的预测值与训练数据中的目标值的差距最小。即:通过不断调整相关参数,使拟合获得的预测值(即本实施例中的个性化推荐信息)与用户模型训练数据中的目标值(即用户做出反馈的个性化推荐信息)尽可能一致。

除了上述逻辑回归方法外,还可以采用梯度提升决策树方法。

上述用户模型训练方法均采用现有技术下成熟的算法,不属于本发明的独创性部分,在此不予以详细描述。

步骤s106,所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

在前一步骤完成用户模型训练后,所获得的用户模型相比原先使用的用户模型,就是更新的用户模型;该更新的用户模型可以马上替代原先的用户模型作为当前用户模型使用。当执行所述步骤s102时,所述当前用户模型就是经过本次更新的用户模型。

采用本方法,可以一边积累数据一边进行模型更新,并在模型更新后立刻投入使用,继而在新的用户模型下积累新的用户模型训练数据,并周而复始,实现数据积累和用户模型的相互之间的正向改善循环,迅速提高用户模型质量,提升个性化推荐信息的精确度。

上述第一实施例中,涉及到作为访问用户的访问界面的客户端,与进行用户模型训练的服务器;两者之间通过网络联系。所述客户端提供访问用户的身份数据等给所述服务器,所述服务器根据这些数据查询存储的用户特征数据并依据用户特征数据形成个性化推荐信息,并将个性化推荐信息发送到客户端供展示;所述客户端搜集访问用户访问-推荐过程中获得的用户特征数据、个性化推荐信息和反馈操作等信息,形成一个新增用户模型训练条目,并发送给服务器,服务器根据不断积累的用户模型训练条目,在适当时机进行用户模型训练,生成更新的当前用户模型,并开始使用当前用户模型。

所述步骤s103的用户模型训练条目的形成过程,可以由客户端完成,也可以是在后台由服务器实时搜集每次访问用户的访问过程产生的数据,这些数据中,个性化推荐信息在发送的同时进行搜集,用户特征数据可以在客户端发送访问用户的身份标识时,查询用户数据库获得,访问用户对个性化推荐信息的反馈,来自客户端提供的相关情况;最终,在服务器一侧将某一次访问-推荐过程形成的上述所有数据集合为一个数据条目,并发送给存储训练样本集的数据库存储。

本申请第二实施例提供一种实现在线个性化推荐的装置;请参看图2。

本实施例提供的在线系统个性化推荐的装置,包括:用户特征数据提取单元201、个性化推荐信息提供单元202、用户模型训练条目形成单元203、训练样本集搜集单元204、用户模型训练单元205、用户模型更新单元206。

所述用户特征数据提取单元201,用于接收访问用户的访问请求,并提取所述访问用户的用户特征数据。所述用户特征数据至少包括:用户身份标识,并包括下列任何用户特征数据中的至少一个:性别,年龄,交易记录。

所述个性化推荐信息提供单元202,用于根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息。所述个性化推荐信息包括下列个性化推荐实体的至少一种:商品、店铺、品牌。

所述用户模型训练条目形成单元203,用于实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并形成新增用户模型训练条目。所述访问用户作出反馈操作包括如下操作之一:点击,访问,点赞,收藏,预定,购买。所述训练数据条目中还可包括以下数据的一种或者两种:获取该 记录的时间点、资源位信息。所述用户模型训练条目优选采用日志方式记录。

所述训练样本集搜集单元204,用于将所述新增用户模型训练条目加入训练样本集。

所述用户模型训练单元205,用于以当前训练样本集进行用户模型训练。所述用户模型训练采用机器学习方法;具体的机器学习方法例如可以采用逻辑回归方法或者梯度提升决策树方法。

所述用户模型更新单元206,用于在所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

在优选实施方案中,该在线系统个性化推荐的装置还包括阈值判断单用,用于判断所述新增的用户模型训练样本是否达到预定的阈值;若是,则启动所述用户模型训练单元205进行用户模型训练。

本申请第三实施例提供一种电子设备,所述电子设备包括:

显示器;

处理器;

存储器,用于存储实现在线系统个性化推荐的方法的程序,该设备通电并运行该在线系统个性化推荐的方法的程序后,执行下述步骤:

接收访问用户的访问请求,并提取所述访问用户的用户特征数据;

根据所述访问用户的用户特征数据,以及当前用户模型,提供个性化推荐信息;

实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户作出反馈操作的所述个性化推荐信息以及所做的反馈操作,并将为访问用户的一次访问-推荐过程形成的上述内容组合为一条新增的用户模型训练条目;

将所述新增的用户模型训练条目加入训练样本集;

以当前训练样本集进行用户模型训练;

所述用户模型训练完成后,将所获得的更新的用户模型作为当前用户模型。

本申请第四实施例提供一种实现上述第一实施例方法的在线个性化推荐的系统;请参看图3。

所述在线个性化的系统,包括在线子系统401、离线子系统402。

所述在线子系统401,用于接收用户的访问请求,并提取用户特征数据,并根据所提取的用户特征数据以及当前用户模型,向提出访问请求的用户提供个性化推荐实体;以及,实时搜集所述访问用户的用户特征数据、为所述访问用户提供的所述个性化推荐信息、所述访问用户对所述个性化推荐信息的反馈信息,形成新增的用户模型训练条目并发送;以及,接收所述离线子系统提供的更新的用户模型。

所述在线子系统实现实时在线的功能,包括界面展示以及客户端的实时数据搜集等,本系统强调对所有训练数据的实时搜集,一次性完整搜集相关数据形成用户模型训练条目,这样就可以避免离线搜集数据需要访问多个数据库以及不能及时搜集到完整数据的弊端。在线子系统除了客户端外,可以包括通过网络与其连接的服务器。

在优选的方案中,所述在线子系统401形成的用户模型训练条目以日志形式记录并发送。

所述离线子系统402,接收所述在线子系统401发送的新增的用户模型训练条目,并将所述新增的用户模型训练条目加入当前训练样本集;采用所述当前训练样本集进行用户模型训练,将训练完成获得的更新的用户模型作为当前用户模型向外发送。

所述离线子系统将所述新增的用户模型训练条目加入当前训练样本集之后,随时判断所述新增的用户模型训练样本是否达到预定的阈值;若是,则开始所述采用所述当前训练样本集进行用户模型训练的过程。

该离线子系统402不处理在线工作,随时可以根据需要启动用户模型训练,不影响在线系统的工作。

本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1