数据处理分析的方法和装置与流程

文档序号:26283157发布日期:2021-08-17 13:37阅读:63来源:国知局
数据处理分析的方法和装置与流程

本发明涉及计算机技术领域,尤其涉及一种数据处理分析的方法和装置。



背景技术:

在电商场景中,如何使用数据驱动为我们的决策者提供更加有帮助的信息,一直是近几年来的热点,随着大数据的积累,我们通过大数据加机器学习技术已经能够在很多场景下做到数据驱动。而对于电子商务领域来说,数据驱动能使我们更加了解我们的用户,从而为我们的用户制定更加精细的营销方案,例如针对特定用户的产品推荐。

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:

由于现有技术在针对网购用户进行营销方案制定时缺乏对用户下次购物时长的预估,因而无法对用户下次在有限时长内的购物过程做出整体规划与把控,使得营销方案的针对性和准确度有待加强。



技术实现要素:

有鉴于此,本发明实施例提供一种数据处理分析的方法和装置,能够预测用户下一次购物时长,从而在用户有限的购物时间做出更有针对性的定制化商品推荐等服务。

为实现上述目的,根据本发明实施例的一个方面,提供了一种数据处理分析的方法。

根据本发明实施例的数据处理分析的方法,包括:

构造与用户相关的训练数据库和预测数据库;

从所述训练数据库提取与所述用户相关的行为特征识别数据;

对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数;

基于所述优化目标函数建立第一预测模型;以及

使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

可选地,所述行为特征识别数据包括以下中的一个或多个:

用户基础特征,用户聚类群特征,用户商品交互特征以及用户文本特征。

可选地,在所述用户商品交互特征中对与所述用户相关的商品进行了与时间相关的id编码。

可选地,所述用户聚类群特征是与所述用户相关的单层聚类特征或多层聚类特征。

可选地,使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长进一步包括:

构造与用户相关的验证数据库;

使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型;以及

使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

根据本发明实施例的一个方面,提供了一种数据处理分析的装置。

根据本发明实施例的数据处理分析的装置,包括:

数据库构造模块,用于构造与用户相关的训练数据库和预测数据库;

特征组提取模块,用于从所述训练数据库提取与所述用户相关的行为特征识别数据;

优化目标函数拟合模块,用于对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数;

模型建立模块,用于基于所述优化目标函数建立第一预测模型;以及

购物时长预测模块,用于使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

可选地,所述行为特征识别数据包括以下中的一个或多个:

用户基础特征,用户聚类群特征,用户商品交互特征以及用户文本特征。

可选地,数据处理分析的装置进一步包括:

id编码模块,用于在所述用户商品交互特征中对与所述用户相关的商品进行了与时间相关的id编码。

可选地,所述用户聚类群特征是与所述用户相关的单层聚类特征或多层聚类特征。

可选地,

所述数据库构造模块,还用于构造与用户相关的验证数据库;

所述模型建立模块,还用于使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型;以及

所述购物时长预测模块,还用于使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

根据本发明实施例的另一个方面,提供了一种数据处理分析的电子设备。

根据本发明实施例的数据处理分析的电子设备,包括:

一个或多个处理器;

存储装置,用于存储一个或多个程序,

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例第一方面提供的数据处理分析的方法。

根据本发明实施例的另一个方面,提供了一种计算机可读介质。

根据本发明实施例的计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现本发明实施例第一方面提供的数据处理分析的方法。

上述发明中的一个实施例具有如下优点或有益效果:因为采用预测用户下一次购物时长的技术手段,所以克服了无法对用户下次在有限时长内的购物过程做出整体规划与把控的技术问题,进而达到预判用户下次购物有无目的性并提高商品推荐方案的针对性和准确度的技术效果,并进一步为其他基于电子商务的优化方法提供了有效的参数。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明,不构成对本发明的不当限定。其中:

图1是根据本发明实施例的数据处理分析的方法的主要流程的示意图;

图2是根据本发明实施例的数据库流程的示意图;

图3是根据本发明实施例的模型整体流程的示意图;

图4是根据本发明实施例的另一种数据处理分析的方法的流程的示意图;

图5是根据本发明实施例的数据处理分析的装置的主要模块的示意图;

图6是本发明实施例可以应用于其中的示例性系统架构图;

图7是适于用来实现本发明实施例的终端设备或服务器的计算机系统的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

根据本发明实施例的一个方面,提供了一种数据处理分析的方法。

图1是根据本发明实施例的数据处理分析的方法的主要流程的示意图,如图1所示,根据本发明实施例的数据处理分析的方法包括步骤s101、s102、s103、s104和s105。

步骤s101:构造与用户相关的训练数据库和预测数据库。

本申请中的数据库可以基于电商平台的后台数据进行构造。因为对于电商场景来说,计算机能够从后台数据中获取用户和时间相关的行为数据进而可以根据不同需求构造特定的数据库。用户在电商网站购物的时候往往会伴随着,浏览,点击,加购物车等行为,与此同时的还有用户的评论信息,这些对我们建模都是有帮助的。在一种实施方式中,电商平台的后台数据可以通过用户所使用的移动终端获得,例如,台式计算设备、膝上型计算设备、至少部分专用于自动助理的独立硬件设备、平板计算设备、移动电话计算设备、用户的车辆的计算设备(例如,车载通信系统、车载娱乐系统、车载导航系统)或包括计算设备的用户的可穿戴装置(例如,具有计算设备的用户的手表、具有计算设备的用户的眼镜、虚拟或增强现实计算设备)。可以提供附加和/或替选客户端计算设备。

在一种实施方式中,与用户相关的训练数据库用于为建立预测模型提供学习数据,与用户相关的预测数据库用于作为训练好的模型的输入进而预测所述用户的下一次或几次购物时长。“购物时长”是指用户在网购平台上所滞留的时间,即,从用户进入网购平台到离开网购平台的时间。“与用户相关的预测购物时长”是指根据本申请所提供的方法预测得到的所述用户下一次进入网购平台到离开网购平台的时间的预测时间长度值,其可以使用任意时间单位,例如分钟、秒等。因此,本申请中所涉及的与“购物时长”这个概念相关的术语都应在此基础上结合场景做出相应解释。“购物时长”这个指标的提出可以进一步衍生出更多的细分指标,包括但不限于从用户浏览特定商品到下单期间的时长,或本次购物结束到下次购物开始之间的时间间隔等。

步骤s102:从所述训练数据库提取与所述用户相关的行为特征识别数据。

示例性地,对于电商场景来说,我们能拿到用户和时间相关的行为数据,用户在电商网站购物的时候往往会伴随着,浏览,点击,加购物车等行为,与此同时的还有用户的评论信息,这些对我们建模都是有帮助的。

对于我们建模来说,首先我们需要定义一个优化的目标,即我们定义用户从进入网购平台到离开网购平台的时间段定义为我们的优化目标函数,那么很明显,我们的优化目标函数是一个连续的值,因此我们可以将问题定义为一个回归类的问题,因此我们可以把我们预测出来的购物时长ypre和我们用户实际的购物时长yind的差值做为我们模型的损失,也就是我们模型所需要优化的目标,因此我们得出目标函数这样我们就能根据该优化目标函数进行进一步建模了。

示例性地,我们的模型是为了对用户下一次的购物所花费的时长进行预测,那么我们可以理解这很大一部是由于用户的购物习惯所决定的,有些用户偏向于逛网购平台,没有太大的目的性,这类用户往往每次购物所需要花费的时间都是很长,而对于某些带有很强目的性购物的用户来说,往往花费的时间相对较短,接着我们可以再细分下,对于带有目的性购物的用户来说,习惯在网购平台购买衣服的用户,和习惯在网购平台购买手机等电子产品的用户,每次所花费的时间又不太一样。因此我们可以分析出,相同类型的用户每次购物所花费的时间长短很可能是相似的,所以我们首先可以考虑使用聚类算法对我们的用户群体做一个聚类,这里使用k-means聚类算法对我们的用户进行一个聚类,通过计算用户间的相似性来对用户进行一个聚类,这里我们通过欧几里得距离进行计算这里设置一个超参数k即我们需要对用户分多少类,后续可以进行调整。

在我们对用户进行聚类之后,我们可以根据我们的聚类结果进行相应的聚合特征提取,同时我们也能将聚类的结果作为我们模型的输入。在对特征提取方案进行介绍前,我们首先介绍下关于本建模方案的建模数据库构建方式。对于我们网购平台原始的数据库来说我们能够拿到用户在一段时间内原始行为数据,那么我们的目标是为了预测用户未来一次的购物时长,时间相关,用户粒度,同时对于我们本次建模来说我们不需要人工线下打标,我们通过线上取用户的购物时长就能得到我们模型训练的标签。而对于我们数据挖掘建模来说,我们需要三份数据库,训练集,验证集,预测集,预测集即我们线上真实的应用场景,因此我们可以通过训练集对我们的模型进行训练,在验证集上对我们的模型进行验证调整,当达到一定效果后我们可以进行线上的预测。

下面结合附图2,对线下的训练集以及验证集的划分进行介绍。图2是根据本发明实施例的数据库流程的示意图。从在线用户行为数据库240得到的训练数据库210、验证数据库220和预测数据库230可以是连续三个时间单位的数据,例如,与用户有关的6月、7月和8月的行为数据。为了建立对用户购物时长的预测模型,从训练数据库210中得到与用户有关的所提取的特征211,对所述所提取的特征211进行拟合得到优化目标函数212。可选地,可以利用验证数据库220对此时的预测模型进行验证,从验证数据库220中得到与用户有关的所提取的特征221,对所述所提取的特征221进行拟合得到优化目标函数222,并基于此对模型进行调整。最后,可以基于经调整或未经调整的模型在预测数据库230的基础上进行预测,即,从预测数据库230中得到与用户有关的所提取的特征231,对所述所提取的特征231进行拟合得到优化目标函数232。

可选地,所述行为特征识别数据包括以下中的一个或多个:用户基础特征,用户聚类群特征,用户商品交互特征以及用户文本特征。

示例性地,数据库构造完毕后我们就可以开始特征的提取,这里我们可以将特征分为几大类,用户特征,用户聚类群特征,用户商品交互特征。首先对于用户特征来说,我们能够拿到基础特征,如用户的年龄,性别,购买力,接着我们可以通过对业务的分析,首先我们需要预测的是用户在未来一次的购物时间段的长短,那么肯定是和用户历史每次购物时长是强相关的,我们可以根据这个强相关特征进行特征的衍生,因此我们可以提取,用户最后一次购物的时间长短,用户历史购物时间的平均长短,用户的历史总购物时长,以及用户历史购物时长的方差,同样我们还能根据对时间的交互进步提取其他特征,如用户每次购物间隔的天数,用户最后一次购物的时间是哪一天等等。接着是用户的聚类群特征,在前面我们已经对用户进行了聚类操作,那么我们便能根据我们对用户进行聚类后的结果提取一些对于聚类出来的类别的聚合特征,如该用户类别下的历史平均每次购物时长等等,最简单的做法我们可以在上一步提到的用户特征的提取的基础上再做一层聚合操作。这样我们就能提取出丰富的关于用户类别的聚合特征。接着是我们的用户与商品交互特征,这部分特征的提取我们需要对用户和商品进行一个交互,如用户每次购物所看的商品数量,用户每次购物所看的商品类别数量最多的是哪个,用户总浏览次数topk的商品类别,以及用户每次从浏览到加购物车再到下单所用的时间,同时间我们还能再做细些,如用户最后一次所浏览的商品所用的时间。以及用户第一次浏览商品所用的时间。接着我们可以对用户浏览过的商品id进行一个结合,使用类似tf-idf的文本转换手段进行相应的转换,我们可以把用户所浏览过的商品id看成是一条文本序列,因此我们就能通过该方法学习用户所浏览过的商品id之间的关系,进而提供更加丰富的用户商品交互特征,为我们的建模带来帮助。

步骤s103:对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数。

可选地,在所述用户商品交互特征中对与所述用户相关的商品进行了与时间相关的id编码。

在一种实施方式中,对用户有过行为特征识别的商品id,本专利提出一种新型的编码方式,首先我们编码的目的是为了使商品id这种类繁多的类别特征处理成我们模型可学习的特征,同时正因为该种类别种类繁多,对于一个电商平台来说,包含了几十万甚至上百万的类别特征,因此该种类别特征同样包含了非常丰富的信息。下面介绍本专利结合该场景下提出的一种编码方式,首先对于用户每次在电商耗费时间来说,一定都和某个商品发生了交互行为,那么对于某个商品x来说,假设浏览过它的用户列表为[u1,u2,u3,…un],然后每个用户在该商品上所耗费的时间和上面的用户列表相对应[t1,t2,t3,…tn],那么我们就将该商品的值定义为这样我们就将类别的商品id转换为数值了。同时类似的我们可以通过该种方式对我们的商品类别id,我们的商品品牌id也做同样的编码操作。该种方式不但捕获了我们包含丰富信息的id特征,同时还和我们的时长做了一个交互,对我们的建模预测非常有利。

在一种实施方式中,对于我们建模另外一块重要的内容便是用户的评论文本数据,用户的评论文本来说也是表征用户的一个重要方面,用户对于商品的满意度,用户对于平台的满意度,这些都能间接的影响我们预测用户下一次购物的时长。那么我们如何对这些文件进行处理,这里提出一种向量化这些文本的做法,通过结合tf-idf加word2vec的做法,对于我们原始文本,我们首先进行特殊符号清洗,外加切词处理,接着我们将切分后的文本进行word2vec转换以及tf-idf转换,我们将文本通过这两种手段分别向量化,接着我们将分别向量化后的结果进行一个拼接,得到了我们最终的文本。

可选地,所述用户聚类群特征是与所述用户相关的单层聚类特征或多层聚类特征。

当我们对特征提取完毕后,接着我们可以使用lightgbm对我们的模型进行训练即对我们的特征进行拟合,如之前我们所提的数据库划分一样,我们在训练集中对我们的模型进行训练,模型损失函数和评价函数一致即我们上面所提的mse损失函数。我们可在验证集中对我们模型进行预测,并且进行相应的参数调整,因为本模型使用的是树模型,如树的叶子节点个数等等。当我们模型达到上线要求后,便可以在线对我们用户的下一次购物的时间长短进行预测,进而我们平台可以根据预测结果制定更加精细的营销策略。

本发明目的在于提供一种预测用户每次购物时长的建模解决方案,填补目前对用户购物时长建模探索这一块的空白,为实现智能购物做贡献。

步骤s104:基于所述优化目标函数建立第一预测模型。

结合幅图3对模型整体流程进行简要描述。图3是根据本发明实施例的模型整体流程的示意图。

在一种实施方式中,从原始数据301中提取用户基础特征302、用户聚类群特征303、用户文本特征304以及用户商品交互特征305。其中,本申请还提供了一种对用户商品交互特征305中的商品特征进行id编码的方法得到id编码特征306,其主要目的是将商品表示为时间相关的特征,这是因为我们的优化目标函数是以时间为单位的,这种方法使得商品的表示与优化目标函数强相关,进一步加强了预测结果的准确性。之后,对用户基础特征302、用户聚类群特征303、用户文本特征304以及用户商品交互特征305和/或id编码特征306进行拟合得到总特征307。将总特征307作为lightgbm308的输入,得到结果作为验证集309的输入。其中,lightgbm是一种常见的机器学习算法。

此步骤可以如上述实施例所述,上述实施例只是示例性的,并不对步骤做出限定。

步骤s105:使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

可选地,使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长进一步包括:构造与用户相关的验证数据库;使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型;以及使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

在一种实施方式中,“构造与用户相关的验证数据库”的步骤可以在步骤s101中完成,即构造与用户相关的训练数据库、验证数据库和预测数据库。在一种实施方式中,“使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型”的步骤可以在步骤s104中,或其后完成,目的在于使用与所述训练数据库不同的验证数据库来验证所述第一预测模型的准确性并根据验证结果对所述第一预测模型进行微调得到相较于所述第一预测模型更加准确的第二预测模型。在得到所述第二预测模型的基础上,使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。示例性地,与用户相关的训练数据库、验证数据库和预测数据库可以相应地分别为电商平台获取并存储的6月份数据、7月份数据和8月份数据。也就是说,在这个示例中,可以使用训练数据库(6月份数据)进行建模,使用验证数据库(7月份数据)对所建立的模型进行验证并调整,最后用模型基于预测数据库(8月份数据)对用户下次购物时长进行预测。

在电商场景中,如何使用数据驱动为我们的决策者提供更加有帮助的信息,一直是近几年来的热点,随着大数据的积累,我们通过大数据加机器学习技术已经能够在很多场景下做到数据驱动。例如,店铺销量预测。也就是,我们能够使用店铺过往的数据,外加用户的行为数据,对我们的店铺销量进行预测,如用户购买预测,我们可以通过用户的行为特征识别数据对用户在未来一天或者一个月是否会发生购买行为进行预测,如用户的点击预测,我们可以对用户是否会点击某个商品进行预测。

本发明实施例在数据驱动的大背景下,探索使用机器学习模型进行新的预测场景探索,对用户未来一次的购物所花费的时长进行预测,从而使我们能够提前预知用户下一次会在该网购平台所滞留的时长,为我们制定更加精细化的运营策略提供帮助。

根据本发明实施例的技术方案具有如下优点或有益效果:因为采用预测用户下一次购物时长的技术手段,所以克服了无法对用户下次在有限时长内的购物过程做出整体规划与把控的技术问题,进而达到预判用户下次购物有无目的性并提高商品推荐方案的针对性和准确度的技术效果,并进一步为其他基于电子商务的优化方法提供了有效的参数。

根据本发明实施例的另一个方面,提供了一种数据处理分析的方法。

图4是根据本发明实施例的另一种数据处理分析的方法的流程的示意图,如图4所示,根据本发明实施例的数据处理分析的方法包括步骤s401、s402、s403、s404、s405和s406。

步骤s401:构造与用户相关的训练数据库、验证数据库和预测数据库。

步骤s402:从所述训练数据库提取与所述用户相关的行为特征识别数据。

可选地,所述行为特征识别数据包括以下中的一个或多个:用户基础特征,用户聚类群特征,用户商品交互特征以及用户文本特征。

可选地,在所述用户商品交互特征中对与所述用户相关的商品进行了与时间相关的id编码。

可选地,所述用户聚类群特征是与所述用户相关的单层聚类特征或多层聚类特征。

步骤s403:对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数。

步骤s404:基于所述优化目标函数建立第一预测模型。

步骤s405:使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型。

步骤s406:使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

根据本发明实施例的技术方案具有如下优点或有益效果:因为采用预测用户下一次购物时长的技术手段,所以克服了无法对用户下次在有限时长内的购物过程做出整体规划与把控的技术问题,进而达到预判用户下次购物有无目的性并提高商品推荐方案的针对性和准确度的技术效果,并进一步为其他基于电子商务的优化方法提供了有效的参数。

根据本发明实施例的再一个方面,提供了一种数据处理分析的装置。

图5是根据本发明实施例的数据处理分析的装置的主要模块的示意图,如图5所示,根据本发明实施例的数据处理分析的装置500包括数据库构造模块501、特征组提取模块502、优化目标函数拟合模块503、模型建立模块504和购物时长预测模块505。

数据库构造模块501,用于构造与用户相关的训练数据库和预测数据库;

特征组提取模块502,用于从所述训练数据库提取与所述用户相关的行为特征识别数据;

优化目标函数拟合模块503,用于对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数;

模型建立模块504,用于基于所述优化目标函数建立第一预测模型;以及

购物时长预测模块505,用于使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

可选地,所述行为特征识别数据包括以下中的一个或多个:用户基础特征,用户聚类群特征,用户商品交互特征以及用户文本特征。

可选地,所述用户聚类群特征是与所述用户相关的单层聚类特征或多层聚类特征。

可选地,根据本发明实施例的数据处理分析的装置500进一步包括:

id编码模块506,用于在所述用户商品交互特征中对与所述用户相关的商品进行了与时间相关的id编码。

可选地,

所述数据库构造模块501,还用于构造与用户相关的验证数据库;

所述模型建立模块504,还用于使用所述验证数据库对所述第一预测模型进行验证并调整,得到第二预测模型;以及

所述购物时长预测模块505,还用于使用所述第二预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

根据本发明实施例的技术方案具有如下优点或有益效果:因为采用预测用户下一次购物时长的技术手段,所以克服了无法对用户下次在有限时长内的购物过程做出整体规划与把控的技术问题,进而达到预判用户下次购物有无目的性并提高商品推荐方案的针对性和准确度的技术效果,并进一步为其他基于电子商务的优化方法提供了有效的参数。

图6示出了可以应用本发明实施例的数据处理分析方法或数据处理分析装置的示例性系统架构600。

如图6所示,系统架构600可以包括终端设备601、602、603,网络604和服务器605。网络604用以在终端设备601、602、603和服务器605之间提供通信链路的介质。网络604可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备601、602、603通过网络604与服务器605交互,以接收或发送消息等。终端设备601、602、603上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。

终端设备601、602、603可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。

服务器605可以是提供各种服务的服务器,例如对用户利用终端设备601、602、603所浏览的购物类网站提供支持的后台管理服务器(仅为示例)。后台管理服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如目标推送信息、产品信息--仅为示例)反馈给终端设备。

需要说明的是,本发明实施例所提供的数据处理分析方法一般由服务器605执行,相应地,数据处理分析装置一般设置于服务器605中。

应该理解,图6中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

下面参考图7,其示出了适于用来实现本发明实施例的终端设备的计算机系统700的结构示意图。图7示出的终端设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。

如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行各种适当的动作和处理。在ram703中,还存储有系统700操作所需的各种程序和数据。cpu701、rom702以及ram703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。

以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(cpu)701执行时,执行本发明的系统中限定的上述功能。

需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的模块也可以设置在处理器中,例如,可以描述为:一种处理器包括数据库构造模块、特征组提取模块、优化目标函数拟合模块、模型建立模块和购物时长预测模块。其中,这些模块的名称在某种情况下并不构成对该模块本身的限定,例如,模型建立模块还可以被描述为“用于基于所述优化目标函数建立第一预测模型的模块”。

作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备包括:构造与用户相关的训练数据库和预测数据库;从所述训练数据库提取与所述用户相关的行为特征识别数据;对所述行为特征识别数据进行拟合得到与用户购物时长相关的优化目标函数;基于所述优化目标函数建立第一预测模型;以及使用所述第一预测模型基于所述预测数据库得到与所述用户相关的预测购物时长。

根据本发明实施例的技术方案具有如下优点或有益效果:因为采用预测用户下一次购物时长的技术手段,所以克服了无法对用户下次在有限时长内的购物过程做出整体规划与把控的技术问题,进而达到预判用户下次购物有无目的性并提高商品推荐方案的针对性和准确度的技术效果,并进一步为其他基于电子商务的优化方法提供了有效的参数。

上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1