用于信息推送的方法及装置与流程

文档序号:18011826发布日期:2019-06-26 00:12阅读:244来源:国知局
用于信息推送的方法及装置与流程

本发明涉及计算机信息处理领域,具体而言,涉及一种用于信息推送的方法及装置。



背景技术:

数据挖掘与机器学习技术诞生已有几十年,伴随着电商及相关行业的数据爆炸式的增长,如何高效的从海量数据中挖掘并利用好用户行为已经成为一个热点和难点问题。众所周知,电商行业主要由b2c和c2c两种模式构成,而传统的预测模式往往是全品类的sku粒度预测,即使预测准确率有保证,但是产生的利润微薄结果也是事倍功半。

现有的业界处理技术中有如下两种:1,首先选取有交互行为的样本集合,并对该集合的样本分别进行业务处理和模型处理,根据前期分析构造多维的特征向量,之后统计相关指标得到一个特征与购买的相关性,对之前n天有相关性较高(如加入购物车、咨询客服等与购买行为有强相关的)操作的用户集合单独的模型训练与预测。2,更多的挖掘用户特征行为,使用大量的二次组合统计特征,在基础特征群的基础上再衍生出大量的特征群,之后利用机器学习的监督学习方式获取到特征的重要性,更进一步的优化方法如结合深度学习方法、cnn生成特征群,以便得到更好的模型效果。

以上方案对基础特征和样本选取的过程大致相似,均可总结为如下情况:1,特征选取的过程,对于电商类用户行为主要由用户维度、商品维度、品类维度、用户商品交互维度、用户品类交互维度、地理位置维度、交叉组合维度等组成。2,样本选取时,首先因为在过往的用户数据集中,大多数用户是只有行为而真正下单的用户很少,这样就会造成训练的正负样本差异悬殊,此处一般使用过采样与欠采样等方式解决。同时真实的预测一般是对前n天有交互的用户进行预测,所以如果仅仅采用某一段时间的用户进行采样训练便会造成正样本不足,此处一般采用滑动窗口方式获取多组样本集,之后融合多组滑动结果得到最终的训练样本,滑动窗口采样方法最终会获得多组训练样本。从以上两种实现方案可知,常规的实现方法关键点为提取用户行为特征,并结合多种机器学习方法获得一个高准确和高召回的预测模型,但这些方法往往在单个品类下的并没有考虑到品类的差异性,在特征提取和模型融合时也并没有一个适用于全品类精准预测潜在用户的方法。

因此,需要一种新的用于信息推送的方法及装置。

在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。



技术实现要素:

有鉴于此,本发明提供一种用于信息推送的方法及装置,能够最大程度挖掘用户价值,预测用户购买某种商品的概率,能够达成精准推荐和营销的效果,提升公司整体成交总额与利润。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明的一方面,提出一种用于信息推送的方法,该方法包括:将由数据源获取的基础数据进行数据清洗,生成第一数据;提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据;将所述特征数据输入预测模型中确定预测得分;以及通过所述预测得分进行信息推送。

在本公开的一种示例性实施例中,所述将由数据源获取的基础数据进行数据清洗,生成第一数据,包括:将由多个数据源获取的基础数据分别进行数据清洗,生成多个所述第一数据。

在本公开的一种示例性实施例中,所述将所述特征数据输入与预测模型中确定预测得分,包括:所述特征数据输入与其数据源对应的所述预测模型中以确定预测得分。

在本公开的一种示例性实施例中,还包括:通过对负样本进行训练建立所述预测模型。

在本公开的一种示例性实施例中,所述通过对负样本进行训练建立所述预测模型,包括:将所有负样本随机分份生成n份的第一负样本,其中n为正整数;对所有负样本进行放回采样,生成m份的第二负样本,其中m为正整数;通过n份第一负样本与m份第二负样本生成负样本数据;以及通过负样本数据训练建立所述预测模型。

在本公开的一种示例性实施例中,所述通过对负样本进行训练建立所述预测模型,包括:通过梯度提升树与负样本数据,建立m+n份模型;通过梯度提升树进行分类训练,获取分类模型x;通过随机森林结合梯度提升树进行分类训练,获取分类模型y;以及通过分类模型x与分类模型y建立所述预测模型。

在本公开的一种示例性实施例中,在分类训练时,正样本相同,负样本随机为m+n份负样本中的一个。

在本公开的一种示例性实施例中,所述将所述特征数据输入预测模型中确定预测得分,包括:将所述特征数据输入预测模型中,所述预测模型中包括m+n份模型;获取m+n份模型计算生成的m+n份预测数据;以及通过投票选举与平均加权法获得预测得分。

在本公开的一种示例性实施例中,所述通过投票选举与平均加权法获得预测得分,包括:

其中,α+β=1&&α,β>0;

其中,中m份模型中有m1份对样本标记为正样本,n份模型有n1份样本标记为正样本,α,β为权重系数。

在本公开的一种示例性实施例中,还包括:通过滑动窗口获取正样本;以及通过对正样本进行训练建立所述预测模型。

根据本发明的一方面,提出一种用于信息推送的装置,该装置包括:数据清洗模块,用于将由数据源获取的基础数据进行数据清洗,生成第一数据;特征提取模块,用于提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据;数据预测模块,用于将所述特征数据输入预测模型中确定预测得分;以及信息推送模块,用于通过所述预测得分进行信息推送。

在本公开的一种示例性实施例中,还包括:建立模型模块,用于通过对负样本与正样本进行训练建立所述预测模型。

根据本发明的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。

根据本发明的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。

根据本发明的用于信息推送的方法及装置,能够最大程度挖掘用户价值,预测用户购买某种商品的概率,能够达成精准推荐和营销的效果,提升公司整体成交总额与利润。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本发明。

附图说明

通过参照附图详细描述其示例实施例,本发明的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的一种用于信息推送的方法的系统框图。

图2是根据一示例性实施例示出的一种用于信息推送的方法的流程图。

图3是根据另一示例性实施例示出的一种用于信息推送的方法的示意图。

图4是根据另一示例性实施例示出的一种用于信息推送的方法的示意图。

图5是根据一示例性实施例示出的一种用于信息推送的装置的框图。

图6是根据一示例性实施例示出的一种电子设备的框图。

图7示意性示出本公开示例性实施例中一种计算机可读存储介质示意图。

具体实施方式

现在将参考附图更全面地描述示例实施例。然而,示例实施例能够以多种形式实施,且不应被理解为限于在此阐述的实施例;相反,提供这些实施例使得本发明将全面和完整,并将示例实施例的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

应理解,虽然本文中可能使用术语第一、第二、第三等来描述各种组件,但这些组件不应受这些术语限制。这些术语乃用以区分一组件与另一组件。因此,下文论述的第一组件可称为第二组件而不偏离本公开概念的教示。如本文中所使用,术语“及/或”包括相关联的列出项目中的任一个及一或多者的所有组合。

本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的,因此不能用于限制本发明的保护范围。

图1是根据一示例性实施例示出的一种用于信息推送的方法的系统框图。

如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果反馈给终端设备。

需要说明的是,本申请实施例所提供的用于信息推送的方法一般由服务器105执行,相应地,网页生成装置一般设置于客户端101中。

图2是根据一示例性实施例示出的一种用于信息推送的方法的流程图。

如图2所示,在s202中,将由数据源获取的基础数据进行数据清洗,生成第一数据。基础数据可例如为3c品类,例如笔记本、冰箱家电、手机等品类。这些品类均有一个特点,就是回购周期较长,用户在购买之后往往在几个月之内并不会二次购买,针对该问题本文在预测后结合用户回购周期,按需过滤回购周期内且预测概率偏低的用户。

在本申请的一个实施例中,将由多个数据源获取的基础数据分别进行数据清洗,生成多个所述第一数据。数据来源可例如为移动客户端,电脑端,应用端等,不同的来源中的第一数据分别进行数据清理。

在数据清洗处理中,可例如采用四分位法进行处理,即将数据的分布每隔一定间隔点,把数据划分成大小基本接近的集合,分别记为q1,q2,q3,q4,剔除在第三个四分位之上和第一个四分位之下1.5*(q3-q1)的值。

在数据清洗处理中,还可例如在获取的浏览用户中,剔除注册时间超过半年且无加购行为、历史购买记录的用户,之后剔除浏览巨大的且无购买用户(该类用户大多为刷单用户或爬虫用户),最后剔除浏览量与购买量差距悬殊的用户。

在s204中,提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据。

其中,用户特征数据包括:性别、年龄、收入、购买力。

浏览行为特征数据包括:7天内购买过相关品类的个数、购买过优先级为1的相关品类的个数、购买过优先级为2的相关品类的个数、购买过优先级为3的相关品类的个数、商详页pv、有效商详页pv、自营商详页pv、pop商详页pv、自营商详页pv占比、移动端商详页pv占比、pc端商详页pv占比、商详页平均停留时长、移动端商详页平均停留时长、移动端商详页平均停留时长是总平均的倍数、pc端商详页平均停留时长、pc商详页平均停留时长是总平均的倍数、浏览商详页天数、平均每天浏览商详页pv、平均加入购物车次数、加购sku数、平均点击评价页次数、点击评价页sku数、平均商品详情+规格+售后点击次数、商品详情+规格+售后点击sku数、平均商品关注次数、商品关注sku数、平均联系客服次数、联系客服sku数、从购物车进入次数、第一次浏览该品类距离购买时间距离/如果未购买就是第一次浏览品类时间到统计日时间距离、最后一次浏览该品类距离购买时间距离/如果未购买就是第一次浏览品类时间到统计日时间距离、第一次加购该品类距离购买时间距离、最后一次加购该品类距离购买时间距离、第一次从购物车进入该品类商详页到购买时间距离、最后一次从购物车进入该品类商详页到购买时间距离、商详页sku跨度品牌个数、商详页sku跨度价格段个数、浏览sku数目、品牌平均商详页pv=所有商详页pv/商详页品牌个数、品牌平均商详页停留时长、品牌最大商详页pv是品牌平均商详页pv的倍数、品牌最大平均商详页停留时长、倍数=品牌最大平均商详页停留时长/商详页平均停留时长、价格段平均商详页pv、价格段平均商详页停留时长、价格段最大商详页pv、价格段最大商详页pv是价格段平均商详页pv的倍数、价格段最大平均商详页停留时长、倍数=价格段最大平均商详页停留时长/商详页平均停留时长、最大pv和时长的品牌是否一致、最大pv和时长的价格段是否一致。

搜索行为特征数据包括:有效搜索pv、品牌搜索pv、价格段搜索pv、有效品牌搜索pv、有效价格段搜索pv、pc端站内有效搜索pv、pc端站外有效搜索pv、有效搜索跨度天数、平均每天有效搜索pv、移动端有效搜索跨度品牌个数、移动端有效搜索跨度价格段个数、pc端有效搜索跨度品牌个数、pc端有效搜索跨度价格段个数、移动端平均品牌搜索pv、移动端平均价格段搜索pv、pc端平均品牌搜索pv、pc端平均价格段搜索pv、pc端列表页pv、pc端有效列表页pv、pc端有效列表页跨度品牌个数、pc端有效列表页跨度价格段个数、pc端平均品牌列表页pv、pc端平均价格段列表页pv、pc端列表页平均引入商详页pv、pc端搜索页平均引入商详页pv、app端搜索页评价引入商详页pv、pc端列表页平均引入商详页停留时长、pc端搜索页平均引入商详页停留时长、app端搜索页平均引入商详页停留时长、第一次搜索距离购买时间距离、最后一次搜索距离购买时间距离。

时间维度特征数据包括:购买前1天商详页pv占比、购买前1天商详页平均停留时长、购买前1天浏览sku数量、购买前2天商详页pv占比、购买前2天商详页平均停留时长、购买前2天浏览sku数量、购买前3天商详页pv占比、购买前3天商详页平均停留时长、购买前3天浏览sku数量、购买前4天商详页pv占比、购买前4天商详页平均停留时长、购买前4天浏览sku数量、购买前5天商详页pv占比、购买前5天商详页平均停留时长、购买前5天浏览sku数量、购买前6天商详页pv占比、购买前6天商详页平均停留时长、购买前6天浏览sku数量。

其中,sku:stockkeepingunit(库存量单位)。即库存进出计量的基本单元,可以是以件,盒,托盘等为单位。pv:pv(pageview)即页面浏览量,通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。gmv:grossmerchandisevolume,是成交总额(一定时间段内)。

在本申请的一个实施例中,可例如采用逻辑回归基于惩罚项的特征选择法与xgboost树模型对第一数据进行处理生成特征数据。

在本申请中,对于交叉特征本文的特征提取采用如下两种方法:

1)利用逻辑回归基于惩罚项的特征选择法,首先利用带l1惩罚项的回归方法得到特征权值,因为l1惩罚在于保留多个对目标值具有相等相关性的特征中的多个,之后结合l2惩罚共同作用。具体的流程为:当某个特征在l1的取值0,则在l2中选择l1中权值为0且l2系数为特定阈值范围内的特征构成新的一类特征集a,并在a内交叉相乘。l1惩罚是指特征向量中各个元素绝对值之和。l2惩罚:l2惩罚是指特征向量各元素的平方和然后求平方根。

2)结合使用xgboost树模型,xgboost可以输出模型计算的特征重要性,之后对该些特征等量划分,对重要系数相似的特征进行二次交叉。xgboost:xgboost是大规模并行boostedtree的工具,它是目前最快最好的开源boostedtree工具包,比常见的工具包快10倍以上。

衍生特征的特征提取采用如图3所示的方法:衍生特征本文使用gbdt模型,选定迭代次数为n,则模型会产生多棵决策树,假设每棵树有m个叶子结点,则训练数据落在哪一个叶子结点则该维特征为1,否则为0。

在s206中,将所述特征数据输入预测模型中确定预测得分。包括:所述特征数据输入与其数据源对应的所述预测模型中以确定预测得分。还包括,通过历史数据建立所述预测模型,所述历史数据建立模型的过程中,根据数据来源的不同,分别获取数据训练得到模型。

在s208中,通过所述预测得分进行信息推送。可例如,通过预测得分首先得到用户画像,并结合商品的购买分布得到商品画像互相匹配,如用户的购买力在5000-10000之间,且为女性,则系统在预测用户感兴趣的sku时,将提升该区间的商品排名,以提升商品维度的准确率。

根据本发明的用于信息推送的方法,通过对不同来源的基础数据分别处理,获取不同来源数据的特征值,进而根据特征值输入不同的预测模型进行预测的方式,能够最大程度挖掘用户价值,预测用户购买某种商品的概率,能够达成精准推荐和营销的效果,提升公司整体成交总额与利润。

应清楚地理解,本发明描述了如何形成和使用特定示例,但本发明的原理不限于这些示例的任何细节。相反,基于本发明公开的内容的教导,这些原理能够应用于许多其它实施例。

在本公开的一种示例性实施例中,包括:通过对负样本进行训练建立所述预测模型。还包括:通过滑动窗口获取正样本;以及通过对正样本进行训练建立所述预测模型。

模型训练

模型训练第一步为选择训练集,本文首先统计预测品类下的不同时间窗口下的初始训练样本,分别统计15天、9天、7天、5天、3天的训练数据中的样本正负比例,在多个品类中统计可得,7天内的正样本比例最高,且7天真实购买用户接近9天真实购买用户,为了保证训练集与线上预测的样本分布一致,因为采用7天的样本集进行训练,即取预测日之前七天有交互的用户作为训练样本。

因为正样本数不多,本文同样采取图4所示的滑动窗口方法获取更多的正样本,并为保证样本的多样性,可例如选取7个窗口数据。

模型融合

常见的模型融合方法比单模型预测效果要好,在本申请中在传统的模型融合上进行改进,使得预测效果得到进一步提升。

为了不丢失负样本信息,本申请并未采用随机对负样本进行采用的单一方法,而是使用两种采样方法,其一为将所有负样本随机分为若干份,并保证所有样本无交叉数据,假设此处得到n份负样本。其二是参考bagging装袋思想,对所有负样本有放回采样,这里假设分为m份负样本,这样原始数据中有的数据可能会多次出现,有的可能从未出现。

以上方法得到m和n份负样本,之后采用gbdt分类器分别构建m+n份模型,每一份的正样本相同,负样本随机为该m+n中的一份。在分类训练过程中,同样采用两种方案,其一为使用典型的gbdt分类训练,得到分类模型x。其二结合随机森林思想,在gbdt分类过程中,在每一颗迭代树的特征选取时,选择log2k的特征参与训练,其中k为总特征树,这样在计算过程中会大大减少计算时间,这样在训练时对样本和属性同时扰动,可以得到一个泛化能力更强的模型y。gbdt是一种迭代的决策树算法,该算法由多棵决策树组成,所有树的结论累加起来做最终答案。它在被提出之初就和svm一起被认为是泛化能力较强的算法。

以上两种训练方式x和y中均得到的m和n份模型,最终预测时,结合使用投票选举与平均加权法获得最终的预测概率值,假设x模型中m份无放回随机模型有m1份对样本标记为正样本,则我们的到预测概率m1/m,n份放回采样模型有n1份样本标记为正样本,得到概率n1/n,则概率为:

其中,α+β=1&&α,β>0;

其中,中m份模型中有m1份对样本标记为正样本,n份模型有n1份样本标记为正样本,α,β为权重系数。

y模型的预测方法与x相同,假设预测得分为y,则最终的预测分数为γx+σy,其中,γ,σ为x,y模型的权重,可根据实际情况进行设置,优选的γ=σ=0.5。

结果过滤

在获得了融合后的预测输出之后,考虑到一些客户的实际情况,这里需要对最终的结果进行过滤,此处主要分为以下步骤。

1)过滤大客户,大客户主要是一次性采购大量商品的用户,如政府和企业用户,该类用户的购买频率往往比较高,可能在一个月内购买多次,在预测该类用户时,如果存在该类用户,会对验证结果造成影响,因此需要剔除,根据统计分布得到最终的过滤规则,此处的剔除规则是在过去12个月之内购买总数超过24个的用户。

2)过滤回购周期以内的用户集,因为3c品类的特殊性,用户在购买了一个品类之后,往往在一段时间内不会进行二次购买。然而这也只是一种概率事件,并非绝对事件,因此此处仅仅是过滤在回购周期内有购买行为,且模型预测概率低于固定阈值的用户。统计品类回购周期的方法是分别对所有用户的订单行为统计三级品类订单,计算非当天情况下大于或等于两个sku的购买时间间距,并取平均值。

3)结合用户画像精准预测用户sku兴趣度,计算用户画像,用户画像由大数据团队同步导入,再结合商品画像,商品画像计算规则由系统统计得到,具体的计算规则为统计一年内sku的购买人群、年龄段分布,并结合商品价位,之后与用户画像进行匹配,匹配度高的优先推荐,以提高sku的准确率。

经过以上几步处理之后,最终得到的预测分值便为预测的高潜用户的概率。

根据本发明的用于信息推送的方法,结合电商用户在多端特定品类下的用户行为轨迹,在特征提取上采用多种创新方法,预测过程基于本文提出的提升树的融合方法,最后结合海量的历史用户数据进行反向过滤,在购物平台上的多个品类(例如笔记本、高档音响、耳机等品类)上进行高潜用户的预测,采用人工干预方式、线上效果验证等多种方法进行验证,与传统统计方式和其他预测方法相比准确率与召回率大幅度提升,其中准确率从平均5%提示至8%,召回率从平均7%提示至平均11%。同时在干预组与对照组的ab实验中,日平均拉升gmv20%。

本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由cpu执行的计算机程序。在该计算机程序被cpu执行时,执行本发明提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。

此外,需要注意的是,上述附图仅是根据本发明示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。

下述为本发明装置实施例,可以用于执行本发明方法实施例。对于本发明装置实施例中未披露的细节,请参照本发明方法实施例。

图5是根据一示例性实施例示出的一种用于信息推送的装置的框图。用于信息推送的装置50包括:

数据清洗模块502用于将由数据源获取的基础数据进行数据清洗,生成第一数据。

特征提取模块504用于提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据。

数据预测模块506用于将所述特征数据输入预测模型中确定预测得分。

信息推送模块508用于通过所述预测得分进行信息推送。

在本公开的一种示例性实施例中,还包括:建立模型模块(图中未示出)用于通过对负样本与正样本进行训练建立所述预测模型。

根据本发明的用于信息推送的装置,通过对不同来源的基础数据分别处理,获取不同来源数据的特征值,进而根据特征值输入不同的预测模型进行预测的方式,能够最大程度挖掘用户价值,预测用户购买某种商品的概率,能够达成精准推荐和营销的效果,提升公司整体成交总额与利润。

图6是根据一示例性实施例示出的一种电子设备的框图。

下面参照图6来描述根据本发明的这种实施方式的电子设备200。图6显示的电子设备200仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示,电子设备200以通用计算设备的形式表现。电子设备200的组件可以包括但不限于:至少一个处理单元210、至少一个存储单元220、连接不同系统组件(包括存储单元220和处理单元210)的总线230、显示单元240等。

其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元210执行,使得所述处理单元210执行本说明书上述电子处方流转处理方法部分中描述的根据本发明各种示例性实施方式的步骤。例如,所述处理单元210可以执行如图2中所示的步骤。

所述存储单元220可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)2201和/或高速缓存存储单元2202,还可以进一步包括只读存储单元(rom)2203。

所述存储单元220还可以包括具有一组(至少一个)程序模块2205的程序/实用工具2204,这样的程序模块2205包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。

总线230可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、外围总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。

电子设备200也可以与一个或多个外部设备300(例如键盘、指向设备、蓝牙设备等)通信,还可与一个或者多个使得用户能与该电子设备200交互的设备通信,和/或与使得该电子设备200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口250进行。并且,电子设备200还可以通过网络适配器260与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与电子设备200的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本公开实施方式的上述电子处方流转处理方法。

图7示意性示出本公开示例性实施例中一种计算机可读存储介质示意图。

参考图7所示,描述了根据本发明的实施方式的用于实现上述方法的程序产品400,其可以采用便携式紧凑盘只读存储器(cd-rom)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。

所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。

可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:将由数据源获取的基础数据进行数据清洗,生成第一数据;提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据;将所述特征数据输入预测模型中确定预测得分;以及通过所述预测得分进行信息推送。

本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。

通过以上的实施例的描述,本领域的技术人员易于理解,这里描述的示例实施例可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、移动终端、或者网络设备等)执行根据本发明实施例的方法。

以上具体地示出和描述了本发明的示例性实施例。应可理解的是,本发明不限于这里描述的详细结构、设置方式或实现方法;相反,本发明意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。

此外,本说明书说明书附图所示出的结构、比例、大小等,均仅用以配合说明书所公开的内容,以供本领域技术人员了解与阅读,并非用以限定本公开可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本公开所能产生的技术效果及所能实现的目的下,均应仍落在本公开所公开的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“第一”、“第二”及“一”等的用语,也仅为便于叙述的明了,而非用以限定本公开可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当也视为本发明可实施的范畴。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1