一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统的制作方法

文档序号:36407753发布日期:2023-12-16 16:20阅读:29来源:国知局
一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统的制作方法

本发明涉及跨境电商领域,具体地说,涉及一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统。


背景技术:

1、跨境电子商务是指分属不同关境的交易主体,通过电子商务平台达成交易、进行电子支付结算,并通过跨境电商物流及异地仓储送达商品,从而完成交易的一种国际商业活动。国家大力部署推进物流枢纽布局建设,促进提高国民经济运行质量和效率。跨境电子商务作为推动经济一体化、贸易全球化的技术基础,具有非常重要的战略意义。跨境电子商务不仅冲破了国家间的障碍,使国际贸易走向无国界贸易,同时它也正在引起世界经济贸易的巨大变革。对企业来说,跨境电子商务构建的开放、多维、立体的多边经贸合作模式,极大地拓宽了进入国际市场的路径,大大促进了多边资源的优化配置与企业间的互利共赢;对于消费者来说,跨境电子商务使他们非常容易地获取其他国家的信息并买到物美价廉的商品。但目前现有国际中的跨境电子商务一体化运维问题中人工操作复杂,同一性存在差异,系统分布不灵活和产品信用难以区分等问题仍然存在,本发明将云平台和智能算法与跨境电子商务相结合,实现跨境电商的整体性系统控制和不同地区的产品信用追踪。其应用层面广,经济成本低,可以推广至社会应用,丰富跨境自由贸易体系,带来良好的社会和经济效益。


技术实现思路

1、本发明的目的在于提供一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统,以解决上述背景技术中提出的问题。

2、为实现上述目的,提供了一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统,包括跨境电商产品云平台模块、跨境电商产品信用等级分类模块和跨境电商产品售后模块。

3、s1.对跨境电商产品的生产厂家及代理销售商进行信息溯源,初步评定厂家的信用状态;

4、s2.标记同一产品在不同国际区域的销售对比信息,构建跨境产品的系统数据库,基于系统数据库,用户界面和云服务搭建分布式的云平台和跨境电商网络代理的访问权限,保证信息安全;

5、s3.将交易过程中的产品处理问题记录在系统数据库中,将单位时间段内的同一产品的交易评价信息基于随机梯度提升树算法进行多角度的产品厂家信用分类;

6、s4.基于产品厂家信用分类的结果,结合买家评价等级构建动态的信用评估模型,在系统数据库中记录买家信息,追踪售后评价和言论,验证产品厂家的信用分类情况与信用评估模型的匹配度,反演买家信息,与买家进行沟通,如果存在买家恶意评价的现象,则剔除相应的记录,保证相对客观的信用信息;

7、s5.实时更新系统数据,将单位时间段内的信息信息更新至用户界面,为买家提供选购依据,为跨境电商提供信用约束和出售服务;

8、进一步的,所述s1中信息溯源包括跨境电商产品的生产厂家及代理销售商的注册商标,品牌信息和运营资质的一种或多种组合;

9、进一步的,所述s2中系统数据库,主要是以处理非关系型和关系型数据库的mongodb技术进行搭建;

10、进一步的,所述s3中单位时间段内的同一产品的交易评价信息基于随机梯度提升树算法进行多角度的产品厂家信用分类,详细过程如下:

11、使用改进的随机梯度提升树算法(grandient boosting decision tree简称gbdt),即梯度提升决策树,用于回归和分类研究的机器学习算法,求得一个模型使它对输入变量的预测值f(x)逼近它的真实值y,采用贪心的策略,每次训练一个弱分类模型,让每一个基模型的预测值hm(x)逼近它需要预测的部分真实值,然后把这些基模型的预测值加权组合;每个弱分类模型的结构是一棵二叉决策树,在训练弱分类模型的过程中,模型学习真实值y与上一轮迭代后的预测值fm-1(x)之差,即拟合残差,残差y-fm-1(x)是立方损失函数的反向梯度,如下式所示:

12、

13、其中,x表示产品数据库的属性变量,拟合残差后,之前的迭代预测值fm-1(x)加上本轮拟合残差的hm(x)得到的fm(x),可使平方误差损失函数降低,最终可使得整体模型的预测值f(x)逼近真实值y,此时每个基模型拟合的是损失函数的反向梯度,经过输入、训练和迭代后得到标准模型。本发明使用改进的随机梯度提升树算法,残差y-fm-1(x)使用立方损失函数的反向梯度,相比于传统随机梯度提升树算法,模拟预测值迭代更快,增加了算法效率。

14、在梯度下降法求解的过程中,设置学习率v,更容易接近真实值,当v降低时,基模型的数目相应的要増大,从而提高模型的准确率。梯度提升决策树的训练算法如下所示:

15、输入给定的训练集一个可微的损失函数l(y,f(x)),迭代的次数m(即决策树的数目/基模型的个数);

16、(1)用一个常量γ0初始化模型:

17、

18、其中f0(x)为初始化模型;为取最小值时对应的变量点x;yi为给定的训练集中的元素。

19、(2)对于m=1to m:

20、计算伪残差rmin如下:

21、

22、根据训练集构建一个弱学习器hm(x)来拟合伪残差;

23、通过如下的一维优化来计算乘子γm:

24、

25、v表示学习率,更新模型的计算公式如下:

26、fm=fm-1(x)+vγmhm(x) 0<v≤1

27、(3)输出fm(x)表示由一系列弱的决策树模型组合而成的强分类器的预测。

28、使用一个面向不平衡数据的gbdt级联分类预测模型,模型构建过程中,组合多个学习器f(x)构成层级分类器g(x),串联多个g(x)的正例输出结果构成级联分类器g(x)。

29、级联分类器是在每层分类器设置不同阈值划分样本并进行分类训练。若通过前一层分类器的测试样本满足下一层级阈值标准,则可进入下一层分类器测试,依次类推。

30、分类模型的输入为原始数据集s={x,y},其中x为买家信用评价等级,x={d,h,l,c},y为买家信用表现的二分类标签。分类模型的每层输出为预测产品厂家信用z为综合层级输出得到的预测产品厂家信用。

31、将同一产品的交易评价信息按层级时间标准划分为负样本和正样本。评价数据表现出标签不平衡的问题。采用随机欠采样方法实现正、负样本平衡,具体方法为:对于每一层级i(i∈[1,m]),对数据进行随机欠采样,进而得到k个相互独立的正负样本平衡的数据集,每个数据集记为si,j(j为数据集编号),训练得到k个gbdt学习器fi,j(x)(i∈[1,m],j∈[1,k],组合k个gbdt学习器的结果得到最终分类结果。

32、采用gbdt作为学习器f(x),gbdt是一种基于cart(分类与回归决策树)的集成学习模型。该模型串行训练1组弱学习器(cart决策树),将预测延误时间逐步拟合逼近真实值。对于二分类模型,对样本进行正、负分类,采用sigmoid函数计算得到类别。

33、输入样本集为si,j=(x,yi)i∈[1,m],j∈[1,k]。其中,x为输入特征,x={d,h,l,c};yi为对应样本x的实际延误标签。对第i层级含有n个样本的数据集训练学习器。gbdt模型的构建步骤f(x)如下:

34、步骤1,初始化学习器f(x),并采用对数损失函数,调整决策树参数使得损失函数l(yi,f(x))达到最小。

35、

36、其中,为模型对样本x的预测延误标签;θ1为决策树参数;

37、步骤2,利用损失函数的负梯度γi拟合残差,调整决策树的参数目标使损失函数达到最小,并更新模型f(x)。

38、

39、其中,θ2为决策树参数;

40、步骤3,重复步骤2完成l-1次迭代,并通过sigmoid函数完成概率计算,实现类别判别:

41、

42、其中,σ为常量;θ1为决策树参数;

43、gbdt多分类即对含有多个分类标签的样本进行分类。相较于gbdt多分类,gbdt级联分类预测模型在各层级分别进行类别数据的平衡处理,各层级之间彼此独立,可以同时训练。当预测产品厂家信用大于该层级标准时,层级分类器预测输出正例,进入下一层级分类器进行预测;若层级分类器预测输出负例,则终止计算。通过正例串联各层级分类器预测结果,得到预测产品厂家信用。

44、进一步的,所述s4中结合买家评价等级构建动态的信用评估模型,详细过程如下:

45、使用logistic回归模型进行动态信用评估模型的构建,在企业信用评估的实践中,该模型内部所包含的线性结构使其具有良好的稳定性和可解释性;假设在跨境电商产品交易中,有n个买家,x=(x1,x2,…,xm)影响买家信用表现的特征变量,m为变量的个数,根据买家的信用表现给每个买家打上一个标签v,其中v表示买家信用表现是否正常的二分类变量;若要评估某个买家的信用表现为发生违约的可能性大小,则需要计算模型的预测结果为v=1的发生概率p,p=f(v=1|x1,x2,…,xm),逻辑回归logit(p)的具体表达式为:

46、

47、其中,(β0,β1,β2,…,βm)为模型的待定系数,exp(β0+β1x1+β2x2+…+βmxm)表示期望的计算;

48、采用极大似然估计法求解式中的待定系数,由此可求出买家信用表现的发生概率p(v=1|x):

49、

50、p(v=0|x)=1-θ

51、可以把v的概率函数合并为:

52、

53、依据伯努利分布,极大似然函数l(β,x)写为:

54、

55、则对数似然函数lnl(β,x))为:

56、

57、其中,θi表示待计算的未知参数,对于logistic回归,得到ln(l(β,x)):

58、

59、其中,x1,x2,xi为伯努利分布参数。

60、在实际的由买家评价等级构建动态的信用评估模型问题中,大部分交易过程记录很难满足有概率分布的前提假设,而logistic回归模型没有过于严格的限定条件,拥有良好的可解释性。

61、进一步的,所述s4中验证产品厂家的信用分类情况与信用评估模型的匹配度,反演买家评价信息,详细过程如下:

62、使用改进的bp神经网络算法对买家信息进行反演,它可以逼近任意函数,同时,可以根据实际情况设置中间层的数量、各层处理单元的数目、网络的学习因子等,具有较大的灵活性,使用bp神经网络算法对买家信息进行反演:

63、令训练样本集为x=[x1,x2,…,xj],对任意样本集xk=[xk1,xk2,…,xkm],得到实际输出yk=[yk1,yk2,…,ykp]t,其期望输出为dk=[dk1,dk2,…,dkp]t。

64、bp神经网络的正向传播中,从初始输入至i层可有:

65、

66、其中,表示逻辑计算的权重,从i层到j层的传播过程为:

67、

68、其中,为bp神经网络正向传播至i层时的输出数据,xkm为样本值,wmi为从初始输入至i层的传播路径,wij为从i层至j层的传播路径,为bp神经网络从初始输入至i层的正向传播速度,为bp神经网络从i层至j层的正向传播速度,f(*)为bp神经网络算法对买家信息反演结果,以下层均以此类推。

69、从j层到p层的传播过程为:

70、

71、则可以得到预测输出:

72、

73、

74、其中,为bp神经网络初始输出数据,为bp神经网络正向传播至i层时的输出数据,xkm为样本值,wio为初始输入传播路径,wmi为从初始输入至i层的传播路径,为bp神经网络从初始输入至i层的正向传播速度,f(*)为bp神经网络算法对买家信息反演结果;经过多次的误差计算和网络迭代实现bp神经网络的反向误差信号传播,根据以上原理对买家评价数据集进行训练,得到反演买家信息结果,如果存在买家恶意评价的现象,则剔除相应的记录,保证相对客观的信用信息;

75、其误差为:

76、ekp(n)=dkp(n)-ykp(n)

77、其中ykp(n)为样本的实际输出,dkp(n)为样本的期望输出,定义误差能量为

78、那么神经元的误差总和为:

79、

80、bp神经网络中正向过程是信号向前传播的过程,为了使其得到的误差最小,则需要反向传播误差信号,对该模型进行反馈。其误差反向传播过程如下:bp神经网络中隐层j与输出层p之间的修正量,bp算法中权重的修正量与误差的权重的偏微分成正比,即:

81、

82、其中e(n)为神经元的误差总和,wio(n)为从i层至o层的传播路径,λ为常量。

83、且有:

84、

85、

86、其中ykp(n)为样本的实际输出,ekp(n)为误差,为bp神经网络正向传播至o层时的输出数据。

87、可以得到:

88、

89、其梯度为:

90、

91、根据激励函数f(x)的计算式:

92、

93、可以得到:

94、

95、因此可以得到:

96、

97、所以,修正量wko(n)可以表示为:

98、

99、由此可以得到迭代公式:

100、wio(n+1)=wio(n+δwio(n)

101、同理可得隐藏层i到隐藏层j的权值修正为:

102、wij(n+1)=wij(n)+δwij(n)

103、隐藏层m到隐藏层i的权值修正为:

104、wmi(n+1)=wmi(n)+δwmi(n)

105、即可实现bp神经网络的反向误差信号传播。根据以上原理对买家评价数据集进行训练,得到反演买家信息结果,如果存在买家恶意评价的现象,则剔除相应的记录,保证相对客观的信用信息。

106、本发明有益效果:本发明阐述了一种基于随机梯度提升树算法的跨境电商产品信用标记与售后系统,包括跨境电商产品云平台模块、跨境电商产品信用等级分类模块和跨境电商产品售后模块,对跨境电商产品的生产厂家及代理销售商进行信息溯源,包括跨境电商产品的生产厂家及代理销售商的注册商标,品牌信息和运营资质等,初步评定厂家的信用状态,标记同一产品在不同国际区域的销售对比信息,以处理非关系型和关系型数据库的mongodb技术搭建跨境产品的系统数据库,基于系统数据库,用户界面和云服务搭建分布式的云平台和跨境电商网络代理的访问权限,保证信息安全,将交易过程中的产品处理问题记录在系统数据库中,将单位时间段内的同一产品的交易评价信息基于改进的gbdt算法进行多角度的产品厂家信用分类,残差y-fm-1(x)使用立方损失函数的反向梯度,相比于传统随机梯度提升树算法,模拟预测值迭代更快,增加了算法效率,并基于产品厂家信用分类的结果,使用logistic回归模型结合买家评价等级进行动态信用评估模型的构建,在系统数据库中记录买家信息,追踪售后评价和言论,验证产品厂家的信用分类情况与信用评估模型的匹配度,使用bp神经网络算法对买家信息进行反演,反演买家信息,与买家进行沟通,如果存在买家恶意评价的现象,则剔除相应的记录,保证相对客观的信用信息,实时更新系统数据,将单位时间段内的信息更新至用户界面,为买家提供选购依据,为跨境电商提供信用约束和出售服务。本发明针对现有国际中的跨境电子商务一体化运维问题中人工操作复杂,同一性存在差异,系统分布不灵活和产品信用难以区分等问题,将云平台和智能算法与跨境电子商务相结合,实现跨境电商的整体性系统控制和不同地区的产品信用追踪。其应用层面广,经济成本低,可以推广至社会应用,丰富跨境自由贸易体系,带来良好的社会和经济效益。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1