对象参数权重确定方法、装置、电子设备及可读存储介质与流程

文档序号:16329885发布日期:2018-12-19 06:08阅读:181来源:国知局
对象参数权重确定方法、装置、电子设备及可读存储介质与流程

本公开涉及数据挖掘技术领域,具体涉及一种对象参数权重确定方法、装置、电子设备及可读存储介质。

背景技术

随着信息技术的发展,互联网已经深入到各个领域。网络上出现了众多的购物平台、外卖平台、租房平台、打车平台等信息平台。这些信息平台上的信息、产品或服务的提供方(简称为商户)会提供各种各样的信息、产品或服务。这些信息、产品或服务种类繁多,信息量大,且经常变化,若要从中挖掘出有价值的内容并非易事。

例如,相关技术中,信息平台对对象(例如,商户)进行信息标注或数据标注的技术一般是基于对象画像的特点人工设计方式或者机器学习方式。但是,这两种方式在实现过程中均会遇到问题。



技术实现要素:

在实际应用中,发明人发现:相关技术中,基于对象画像的特点人工设计规则或权重对对象进行信息标注或数据标注的方案对于人工经验严重依赖,容易设计错误,进而导致标注的信息或数据的错误,对信息平台造成损失。另一方面,通过机器学习建模学习到权重进而对对象进行信息标注或数据标注的方案则需要大量的历史标注数据作为支撑,每个对象应该标注什么样的信息或收据没有统一的标准,只能依靠运营人员基于经验进行标注,但是,这种标注数据很少,难以直接建模。

为了解决相关技术中的问题,本公开实施例提供一种对象参数权重确定方法、装置、电子设备及可读存储介质。

第一方面,本公开实施例中提供了一种对象参数权重确定方法,包括:

获取多个对象的已标注对象数据,其中,所述对象数据表示对象的特征,并且所述对象数据为至少一个参数及其对应的参数权重的乘积之和;

基于所述多个对象的已标注对象数据,生成由所述多个对象分别组成的多个对象对的对象关系数据,其中,所述对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系;

根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重。

结合第一方面,本公开在第一方面的第一种实现方式中,所述根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重,包括:

在对象的参数的预设参数权重取值范围内,根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重。

结合第一方面或第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,所述组成对象对的两个对象的对象数据之间的特定关系是组成对象对的两个对象的对象数据之间的大小关系。

结合第一方面的第二种实现方式,本公开在第一方面的第三种实现方式中,所述根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重,包括:

将所述多个对象对的对象关系数据作为训练数据,利用最小错误率模型训练所述组成对象对的对象的参数的参数权重,以确定最优参数权重。

结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,所述最小错误率模型如下:

其中,si是第i个对象的对象数据,fij是第i个对象的第j个参数,wj是第i个对象的第j个参数的参数权重,fij′是第i个对象的第j’个参数,wj′是第i个对象的第j’个参数的参数权重,const是常数,i、j、i’、j’和n是正整数,

其中,所述将所述多个对象对的对象关系数据作为训练数据,利用最小错误率模型训练所述组成对象对的对象的参数的参数权重,以确定最优参数权重,包括:

利用所述最小错误率模型执行循环迭代过程:每轮迭代中仅调整第i个对象的第j个参数fij的参数权重wj,固定第i个对象的第j个参数fij之外的全部参数fij′的对应的参数权重wj′,并且对第i个对象的参数fij之外的全部参数fij′与对应的参数权重wj′的乘积求和的结果是常数;

确定根据所述循环迭代过程得到组成对象对的对象的对象数据之间的大小关系是否符合所述对象的已标注对象数据之间的大小关系;

根据组成对象对的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系符合组成对象对的对象的已标注对象数据之间的大小关系的确定结果,优化组成对象对的对象的参数的参数权重的取值范围;

根据所述循环迭代过程依次优化组成对象对的对象的全部参数的参数权重的取值范围,确定组成对象对的对象的全部参数的最优参数权重。

第二方面,本公开实施例中提供了一种对象参数权重确定装置,包括:

获取模块,被配置为获取多个对象的已标注对象数据,其中,所述对象数据表示对象的特征,并且所述对象数据为至少一个参数及其对应的参数权重的乘积之和;

生成模块,被配置为基于所述多个对象的已标注对象数据,生成由所述多个对象分别组成的多个对象对的对象关系数据,其中,所述对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系;

计算模块,被配置为根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重。

结合第二方面,本公开在第二方面的第一种实现方式中,所述计算模块被配置为:

在对象的参数的预设参数权重取值范围内,根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重。

结合第二方面或第二方面的第一种实现方式,本公开在第二方面的第二种实现方式中,所述组成对象对的两个对象的对象数据之间的特定关系是组成对象对的两个对象的对象数据之间的大小关系。

结合第二方面的第二种实现方式,本公开在第二方面的第三种实现方式中,所述计算模块被配置为:

将所述多个对象对的对象关系数据作为训练数据,利用最小错误率模型训练所述组成对象对的对象的参数的参数权重,以确定最优参数权重。

结合第二方面的第三种实现方式,本公开在第二方面的第四种实现方式中,所述最小错误率模型如下:

其中,si是第i个对象的对象数据,fij是第i个对象的第j个参数,wj是第i个对象的第j个参数的参数权重,fij′是第i个对象的第j’个参数,wj′是第i个对象的第j’个参数的参数权重,const是常数,i、j、i’、j’和n是正整数,

其中,所述计算模块包括:

循环迭代子模块,被配置为利用所述最小错误率模型执行循环迭代过程:每轮迭代中仅调整第i个对象的第j个参数fij的参数权重wj,固定第i个对象的第j个参数fij之外的全部参数fij′的对应的参数权重wj′,并且对第i个对象的参数fij之外的全部参数fij′与对应的参数权重wj′的乘积求和的结果是常数;

第一确定子模块,被配置为确定根据所述循环迭代过程得到组成对象对的对象的对象数据之间的大小关系是否符合所述对象的已标注对象数据之间的大小关系;

优化范围子模块,被配置为根据组成对象对的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系符合组成对象对的对象的已标注对象数据之间的大小关系的确定结果,优化组成对象对的对象的参数的参数权重的取值范围;

第二确定子模块,被配置为根据所述循环迭代过程依次优化组成对象对的对象的全部参数的参数权重的取值范围,确定组成对象对的对象的全部参数的最优参数权重。

第三方面,本公开实施例中提供了一种电子设备,包括存储器和处理器;其中,

所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面、第一方面的第一种实现方式至第四种实现方式任一项所述的方法。

第四方面,本公开实施例中提供了一种可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面、第一方面的第一种实现方式至第四种实现方式任一项所述的方法。

本公开实施例提供的技术方案可以包括以下有益效果:

根据本公开实施例提供的技术方案,通过获取多个对象的已标注对象数据,其中,所述对象数据表示对象的特征,并且所述对象数据为至少一个参数及其对应的参数权重的乘积之和;基于所述多个对象的已标注对象数据,生成由所述多个对象分别组成的多个对象对的对象关系数据,其中,所述对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系;根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重,从而可以通过少量对象的已标注对象数据,生成大量的对象对的对象关系数据,因此,解决了难以获取已标注对象数据的问题。而且,可以基于大量的对象对的对象关系数据计算各个对象的参数的参数权重,解决了对人工经验过于强烈依赖的问题。因此,本公开的实施方式在人工经验与已标注对象数据之间进行有效的权衡,充分利用人工经验与已标注对象数据的优势,同时降低了对已标注对象数据的要求,极大地提高了对象数据运营方的效率以及效益。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:

图1示出根据本公开一实施方式的对象参数权重确定方法的流程图;

图2示出根据图1所示实施方式的步骤s103的一个示例的流程图;

图3示出根据本公开一实施方式的对象参数权重确定装置的结构框图;

图4示出根据图3所示实施方式的计算模块303的一个示例的结构框图;

图5示出用于说明根据本公开一实施方式的最小错误率算法的一个示例;

图6示出根据本公开一实施方式的电子设备的结构框图;

图7是适于用来实现根据本公开一实施方式的对象参数权重确定方法的计算机系统的结构示意图。

具体实施方式

下文中,将参考附图详细描述本公开的示例性实施方式,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施方式无关的部分。

在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。

另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。

图1示出根据本公开一实施方式的对象参数权重确定方法的流程图。如图1所示,所述对象参数权重确定方法包括以下步骤s101-s103:

在步骤s101中,获取多个对象的已标注对象数据,其中,对象数据表示对象的特征,并且对象数据为至少一个参数及其对应的参数权重的乘积之和。

在步骤s102中,基于多个对象的已标注对象数据,生成由多个对象分别组成的多个对象对的对象关系数据,其中,对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系。

在步骤s103中,根据多个对象对的对象关系数据计算组成对象对的对象的参数的参数权重。

在相关技术中,对对象进行信息标注或数据标注的方案可以基于对象画像的特点人工设计规则或权重,对各个参数的权重可以由人工经验去判断。在本公开的实施例中,可以将对象数据实现为至少一个参数及其对应的参数权重的乘积之和。在本公开的一个实施例中,已标注对象数据可以是通人工标注方式、默认标注方式、算法标注方式等方式中的任一种为对象标注的数据。

以在线上餐饮外卖平台上确定各个商户的用户补贴值为例,对象为商户,对象数据表示用户补贴值(即,对象的特征的一个示例),对象数据的参数为商户影响因子,参数权重为商户影响因子的权重。在该示例中,可以构建如下公式:

商户的用户补贴值=商户影响因子1*权重1+商户影响因子2*权重2+商户影响因子3*权重3……

其中,商户的影响因子可以通过商户画像得到,不同的商户影响因子具有对应的权重。

在本公开的实施例中,获取多个对象的已标注对象数据可以指的是通过人工方式对一定数量的(少量的)对象标注对象数据。例如,在线上餐饮外卖平台上以人工方式确定例如100家商户的用户补贴值。

在本公开的实施例中,基于多个对象的已标注对象数据,生成由多个对象分别组成的多个对象对的对象关系数据指的是多个对象中的每两个对象可以构成一个对象对,每个对象对中的两个对象的对象数据之间可以存在特定关系,因此可以生成多个对象对的对象关系数据。在一个实施例中,组成对象对的两个对象的对象数据之间的特定关系是组成对象对的两个对象的对象数据之间的大小关系。在一个示例中,当在线上餐饮外卖平台上以人工方式确定了例如100家商户的用户补贴值时,可以生成4950个商户对,因此也就得到4950个商户补贴关系数据(即,对象关系数据)。在此示例中,4950个商户补贴关系数据表示4950个商户对中的各个商户对中的两个商户的补贴值之间的特定关系,例如,商户补贴大小关系。即,可以基于少量的对象的已标注对象数据,生成大量的由这些对象分别组成的对象对的对象关系数据,因此解决了对象的已标注对象数据难以获取的问题。商户补贴大小关系可以表示例如“餐厅a应该比餐厅b有更多的补贴”、“餐厅c的补贴不应该比餐厅a的补贴少”之类的信息。从此示例可以看出,可以通过少量的商户的人工标注补贴值,产生大量的商户对的“商户补贴大小关系”。在另一个实施例中,可以将根据少量商户的已标注补贴值获得的大量商户对的“商户补贴大小关系”作为机器学习的训练数据,因此,可以解决难以获取已标注的商户补贴值的问题。

在本公开的实施例中,对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系不限于对象数据之间的大小关系,还可以是可相互计算得到的关系,例如,成比例的关系,通过特定算式得到的关系等。根据本公开实施方式的教导,本领域技术人员可以理解对象数据之间可以存在各种关系。

在本公开的实施例中,根据多个对象对的对象关系数据计算组成对象对的对象的参数的参数权重可以包括:在对象的参数的预设参数权重取值范围内,根据多个对象对的对象关系数据计算组成对象对的对象的参数的参数权重。即,可以基于对权重的人工经验,限制权重的取值范围,这样可以节省计算量,并且可以在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重。而且,在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重在实际应用中更有说服力,并且易于被实际应用领域的相关人员理解和解释。另外,在本实施例中,组成对象对的两个对象的对象数据之间的特定关系可以是组成对象对的两个对象的对象数据之间的大小关系。

在本公开的实施例中,步骤s103包括:将多个对象对的对象关系数据作为训练数据,利用最小错误率模型训练组成对象对的对象的参数的参数权重,以确定最优参数权重。在本公开实施例中,采用最小错误率模型的目的是针对对象对中的对象找到一组最优权重组合,最大限度地“迎合”对象对中的对象的已经标注的对象数据的特定关系(例如,大小关系),使错误的“特定关系”发生次数最少。即,当计算参数及其对应的计算出的权重的乘积之和所得到的对象数据不满足对象的已标注对象数据之间的特定关系时,根据本公开实施方式计算出的权重就需要进一步优化。本领域技术人员可以理解,最小错误率模型仅仅是示例,本领域技术人员可以采用其他模型来训练参数权重。

在一个示例中,以在线上餐饮外卖平台上确定各个商户的用户补贴值为例说明对象的参数。在此示例中,对象的参数可以是商户的以下表1中的属性(或称为影响因子)。

表1

本领域技术人员可以理解,以上属性仅仅是示例,属性可以不断改变、扩充和优化。

以下将参照图2来进一步描述一个最小错误率模型的示例以及在本公开的实施方式中应用该最小错误率模型的方式。图2示出根据图1所示实施方式的步骤s103的一个示例的流程图。

在本公开的实施例中,最小错误率模型如下:

其中,si是第i个对象的对象数据,fij是第i个对象的第j个参数,wj是第i个对象的第j个参数的参数权重,fij′是第i个对象的第j’个参数,wj′是第i个对象的第j’个参数的参数权重,const是常数,i、j、i’、j’和n是正整数。

在此实施例中,如图1所示的步骤s103包括步骤s201-s204。

在步骤s201中,利用所述最小错误率模型执行循环迭代过程:每轮迭代中仅调整第i个对象的第j个参数fij的参数权重wj,固定第i个对象的第j个参数fij之外的全部参数fij′的对应的参数权重wj′,并且对第i个对象的参数fij之外的全部参数fij′与对应的参数权重wj′的乘积求和的结果是常数。

在步骤s202中,确定根据所述循环迭代过程得到组成对象对的对象的对象数据之间的大小关系是否符合对象的已标注对象数据之间的大小关系。

在步骤s203中,根据组成对象对的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系符合组成对象对的对象的已标注对象数据之间的大小关系的确定结果,优化组成对象对的对象的参数的参数权重的取值范围。

在步骤s204中,根据所述循环迭代过程依次优化组成对象对的对象的全部参数的参数权重的取值范围,确定组成对象对的对象的全部参数的最优参数权重。

在此实施例中,通过此“最小错误率模型”找到一组最优权重组合,最大限度地“迎合”对象对中的对象的已经标注的对象数据的大小关系,使错误的“大小关系”发生次数最少。

在此实施例中,确定组成对象对的对象的全部参数的最优参数权重的过程是一个循环迭代过程:每轮迭代中只调整一个权重,如wj,而固定其他权重,如wj′,每一个对象的对象数据表示为一条斜率为fij的直线。以下参照图5进行进一步描述。

如图5所示,横坐标s表示对象数据,纵坐标wj表示可调整的权重。每一直线表示一个对象的对象数据随权重wj的变化趋势,实线圆圈圈出的点为两条直线的交点,虚线圆圈圈出的点为两条直线的交点所指示的权重wj所表示的虚线与其他直线的交点。只有越过两条直线交点的位置才会使一个对象对中的两个对象的对象数据大小关系发生变化。因此,在一个实施例中,没有必要尝试所有权重wj的可能值,只需要根据这些直线交点所指示的对象数据找到令对象对中的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系与对象对中的对象的已标注对象数据之间的大小关系一致的权重即可。通过这种方式,可以极大地降低权重取值搜索范围,而且依次优化组成对象对的对象的全部参数的参数权重的取值范围,最终可以得到所有权重的最优值。

在本公开的实施例中,可以基于人工经验,限制各个权重的取值范围,因此根据本公开的对象参数权重确定技术方案不同于常见的机器学习技术方案,它能将人基于业务的历史经验加入到模型的求解过程当中,而不只是一个纯自动化的过程,因此,根据本公开的对象参数权重确定技术方案所确定的权重相较于根据纯自动化的机器学习技术方案确定的权重具有更合理的解释,便于本领域技术人员理解。各个权重的搜索范围可以限制在有限的区间中,这些区间的设定表示人的主观经验对权重重要性的评价。在以上优化权重的过程中,只需要将权重的限制区间加入到算法过程中,每次只优化符合区间取值范围内的相对最优解即可。

在本公开实施例中,限制权重的取值范围,可以节省计算量,并且可以在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重。而且,在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重在实际应用中更有说服力,并且易于被实际应用领域的相关人员理解和解释。而且,本公开实施方式的技术方案在人工经验与标注对象数据之间进行了有效的权衡,充分利用人工经验与对象数据标注的优势,同时降低对标注对象数据的要求,因此极大地提高了效率与资源利用率。

当将本公开实施方式的技术方案应用于在线上餐饮外卖平台上确定各个商户的用户补贴值的情况中时,实验数据表明,本公开实施方式的技术方案使得商户的补贴有所降低,平均客单价有所提升,系统开发周期大大缩短。

根据本公开实施例提供的技术方案,通过获取多个对象的已标注对象数据,其中,所述对象数据表示对象的特征,并且所述对象数据为至少一个参数及其对应的参数权重的乘积之和;基于所述多个对象的已标注对象数据,生成由所述多个对象分别组成的多个对象对的对象关系数据,其中,所述对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系;根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重,从而可以通过少量对象的已标注对象数据,生成大量的对象对的对象关系数据,因此,解决了难以获取已标注对象数据的问题。而且,可以基于大量的对象对的对象关系数据计算各个对象的参数的参数权重,解决了对人工经验过于强烈依赖的问题。因此,本公开的实施方式在人工经验与已标注对象数据之间进行有效的权衡,充分利用人工经验与已标注对象数据的优势,同时降低了对已标注对象数据的要求,极大地提高了对象数据运营方的效率以及效益。

以下参照图3来说明根据本公开实施方式的对象参数权重确定装置。图3示出根据本公开一实施方式的对象参数权重确定装置的结构框图。如图3所示,所述对象参数权重确定装置包括获取模块301、生成模块302和计算模块303。

获取模块301被配置为获取多个对象的已标注对象数据,其中,对象数据表示对象的特征,并且对象数据为至少一个参数及其对应的参数权重的乘积之和。

生成模块302被配置为基于多个对象的已标注对象数据,生成由多个对象分别组成的多个对象对的对象关系数据,其中,对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系。

计算模块303被配置为根据多个对象对的对象关系数据计算组成对象对的对象的参数的参数权重。

在相关技术中,对对象进行信息标注或数据标注的方案可以基于对象画像的特点人工设计规则或权重,对各个参数的权重可以由人工经验去判断。在本公开的实施例中,可以将对象数据实现为至少一个参数及其对应的参数权重的乘积之和。在本公开的一个实施例中,已标注对象数据可以是通人工标注方式、默认标注方式、算法标注方式等方式中的任一种为对象标注的数据。

以在线上餐饮外卖平台上确定各个商户的用户补贴值为例,对象为商户,对象数据表示用户补贴值(即,对象的特征的一个示例),对象数据的参数为商户影响因子,参数权重为商户影响因子的权重。在该示例中,可以构建如下公式:

商户的用户补贴值=商户影响因子1*权重1+商户影响因子2*权重2+商户影响因子3*权重3……

其中,商户的影响因子可以通过商户画像得到,不同的商户影响因子具有对应的权重。

在本公开的实施例中,获取多个对象的已标注对象数据可以指的是通过人工方式对一定数量的(少量的)对象标注对象数据。例如,在线上餐饮外卖平台上以人工方式确定例如100家商户的用户补贴值。

在本公开的实施例中,基于多个对象的已标注对象数据,生成由多个对象分别组成的多个对象对的对象关系数据指的是多个对象中的每两个对象可以构成一个对象对,每个对象对中的两个对象的对象数据之间可以存在特定关系,因此可以生成多个对象对的对象关系数据。在一个实施例中,组成对象对的两个对象的对象数据之间的特定关系是组成对象对的两个对象的对象数据之间的大小关系。在一个示例中,当在线上餐饮外卖平台上以人工方式确定了例如100家商户的用户补贴值时,可以生成4950个商户对,因此也就得到4950个商户补贴关系数据(即,对象关系数据)。在此示例中,4950个商户补贴关系数据表示4950个商户对中的各个商户对中的两个商户的补贴值之间的特定关系,例如,商户补贴大小关系。即,可以基于少量的对象的已标注对象数据,生成大量的由这些对象分别组成的对象对的对象关系数据,因此解决了对象的已标注对象数据难以获取的问题。商户补贴大小关系可以表示例如“餐厅a应该比餐厅b有更多的补贴”、“餐厅c的补贴不应该比餐厅a的补贴少”之类的信息。从此示例可以看出,可以通过少量的商户的人工标注补贴值,产生大量的商户对的“商户补贴大小关系”。在另一个实施例中,可以将根据少量商户的已标注补贴值获得的大量商户对的“商户补贴大小关系”作为机器学习的训练数据,因此,可以解决难以获取已标注的商户补贴值的问题。

在本公开的实施例中,对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系不限于对象数据之间的大小关系,还可以是可相互计算得到的关系,例如,成比例的关系,通过特定算式得到的关系等。根据本公开实施方式的教导,本领域技术人员可以理解对象数据之间可以存在各种关系。

在本公开的实施例中,计算模块303被配置为:在对象的参数的预设参数权重取值范围内,根据多个对象对的对象关系数据计算组成对象对的对象的参数的参数权重。即,可以基于对权重的人工经验,限制权重的取值范围,这样可以节省计算量,并且可以在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重。而且,在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重在实际应用中更有说服力,并且易于被实际应用领域的相关人员理解和解释。另外,在本实施例中,组成对象对的两个对象的对象数据之间的特定关系可以是组成对象对的两个对象的对象数据之间的大小关系。

在本公开的实施例中,计算模块303被配置为:将多个对象对的对象关系数据作为训练数据,利用最小错误率模型训练组成对象对的对象的参数的参数权重,以确定最优参数权重。在本公开实施例中,采用最小错误率模型的目的是针对对象对中的对象找到一组最优权重组合,最大限度地“迎合”对象对中的对象的已经标注的对象数据的特定关系(例如,大小关系),使错误的“特定关系”发生次数最少。即,当计算参数及其对应的计算出的权重的乘积之和所得到的对象数据不满足对象的已标注对象数据之间的特定关系时,根据本公开实施方式计算出的权重就需要进一步优化。本领域技术人员可以理解,最小错误率模型仅仅是示例,本领域技术人员可以采用其他模型来训练参数权重。

在一个示例中,以在线上餐饮外卖平台上确定各个商户的用户补贴值为例说明对象的参数。在此示例中,对象的参数可以是商户的以下表1中的属性(或称为影响因子)。

表1

本领域技术人员可以理解,以上属性仅仅是示例,属性可以不断改变、扩充和优化。

以下将参照图4来进一步描述一个最小错误率模型的示例以及在本公开的实施方式中应用该最小错误率模型的方式。图4示出根据图3所示实施方式的计算模块303的一个示例的流程图。

在本公开的实施例中,最小错误率模型如下:

其中,si是第i个对象的对象数据,fij是第i个对象的第j个参数,wj是第i个对象的第j个参数的参数权重,fij′是第i个对象的第j’个参数,wj′是第i个对象的第j’个参数的参数权重,const是常数,i、j、i’、j’和n是正整数。

在此实施例中,如图3所示的计算模块303包括循环迭代子模块401、第一确定子模块402、优化范围子模块403和第二确定子模块404。

循环迭代子模块401被配置为利用所述最小错误率模型执行循环迭代过程:每轮迭代中仅调整第i个对象的第j个参数fij的参数权重wj,固定第i个对象的第j个参数fij之外的全部参数fij′的对应的参数权重wj′,并且对第i个对象的参数fij之外的全部参数fij′与对应的参数权重wj′的乘积求和的结果是常数。

第一确定子模块402被配置为确定根据所述循环迭代过程得到组成对象对的对象的对象数据之间的大小关系是否符合所述对象的已标注对象数据之间的大小关系。

优化范围子模块403被配置为根据组成对象对的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系符合组成对象对的对象的已标注对象数据之间的大小关系的确定结果,优化组成对象对的对象的参数的参数权重的取值范围。

第二确定子模块404被配置为根据所述循环迭代过程依次优化组成对象对的对象的全部参数的参数权重的取值范围,确定组成对象对的对象的全部参数的最优参数权重。

在此实施例中,通过此“最小错误率模型”找到一组最优权重组合,最大限度地“迎合”对象对中的对象的已经标注的对象数据的大小关系,使错误的“大小关系”发生次数最少。

在此实施例中,确定组成对象对的对象的全部参数的最优参数权重的过程是一个循环迭代过程:每轮迭代中只调整一个权重,如wj,而固定其他权重,如wj′,每一个对象的对象数据表示为一条斜率为fij的直线。以下参照图5进行进一步描述。

如图5所示,横坐标s表示对象数据,纵坐标wj表示可调整的权重。每一直线表示一个对象的对象数据随权重wj的变化趋势,实线圆圈圈出的点为两条直线的交点,虚线圆圈圈出的点为两条直线的交点所指示的权重wj所表示的虚线与其他直线的交点。只有越过两条直线交点的位置才会使一个对象对中的两个对象的对象数据大小关系发生变化。因此,在一个实施例中,没有必要尝试所有权重wj的可能值,只需要根据这些直线交点所指示的对象数据找到令对象对中的对象的基于所述最小错误率模型计算出的对象数据之间的大小关系与对象对中的对象的已标注对象数据之间的大小关系一致的权重即可。通过这种方式,可以极大地降低权重取值搜索范围,而且依次优化组成对象对的对象的全部参数的参数权重的取值范围,最终可以得到所有权重的最优值。

在本公开的实施例中,可以基于人工经验,限制各个权重的取值范围,因此根据本公开的对象参数权重确定技术方案不同于常见的机器学习技术方案,它能将人基于业务的历史经验加入到模型的求解过程当中,而不只是一个纯自动化的过程,因此,根据本公开的对象参数权重确定技术方案所确定的权重相较于根据纯自动化的机器学习技术方案确定的权重具有更合理的解释,便于本领域技术人员理解。各个权重的搜索范围可以限制在有限的区间中,这些区间的设定表示人的主观经验对权重重要性的评价。在以上优化权重的过程中,只需要将权重的限制区间加入到算法过程中,每次只优化符合区间取值范围内的相对最优解即可。

在本公开实施例中,限制权重的取值范围,可以节省计算量,并且可以在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重。而且,在限制权重的取值范围内快速地确定组成对象对的对象的参数的参数权重在实际应用中更有说服力,并且易于被实际应用领域的相关人员理解和解释。而且,本公开实施方式的技术方案在人工经验与标注对象数据之间进行了有效的权衡,充分利用人工经验与对象数据标注的优势,同时降低对标注对象数据的要求,因此极大地提高了效率与资源利用率。

当将本公开实施方式的技术方案应用于在线上餐饮外卖平台上确定各个商户的用户补贴值的情况中时,实验数据表明,本公开实施方式的技术方案使得商户的补贴有所降低,平均客单价有所提升,系统开发周期大大缩短。

根据本公开实施例提供的技术方案,通过获取模块,被配置为获取多个对象的已标注对象数据,其中,对象数据表示对象的特征,并且对象数据为至少一个参数及其对应的参数权重的乘积之和;生成模块,被配置为基于多个对象的已标注对象数据,生成由多个对象分别组成的多个对象对的对象关系数据,其中,对象关系数据表示组成对象对的两个对象的对象数据之间的特定关系;计算模块,被配置为根据所述多个对象对的对象关系数据计算所述组成对象对的对象的参数的参数权重,从而可以通过少量对象的已标注对象数据,生成大量的对象对的对象关系数据,因此,解决了难以获取已标注对象数据的问题。而且,可以基于大量的对象对的对象关系数据计算各个对象的参数的参数权重,解决了对人工经验过于强烈依赖的问题。因此,本公开的实施方式在人工经验与已标注对象数据之间进行有效的权衡,充分利用人工经验与已标注对象数据的优势,同时降低了对已标注对象数据的要求,极大地提高了对象数据的运营方的效率以及效益。

本公开还公开了一种电子设备,图6示出根据本公开一实施方式的电子设备的结构框图,如图6所示,所述电子设备600包括存储器602和处理器601;其中,

所述存储器602用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器601执行以实现前述各方法步骤中的全部或部分步骤。

图7是适于用来实现根据本公开一实施方式的对象参数权重确定方法的计算机系统的结构示意图。

如图7所示,计算机系统700包括中央处理单元(cpu)701,其可以根据存储在只读存储器(rom)702中的程序或者从存储部分708加载到随机访问存储器(ram)703中的程序而执行上述图1-2所示的实施方式中的各种处理。在ram703中,还存储有系统700操作所需的各种程序和数据。cpu701、rom702以及ram703通过总线704彼此相连。输入/输出(i/o)接口705也连接至总线704。

以下部件连接至i/o接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至i/o接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。

特别地,根据本公开的实施方式,上文参考图1描述的方法可以被实现为计算机软件程序。例如,本公开的实施方式包括一种计算机程序产品,其包括有形地包含在及其可读介质上的计算机程序,所述计算机程序包含用于执行前述对象参数权重确定方法的程序代码。在这样的实施方式中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。

附图中的流程图和框图,图示了按照本公开各种实施方式的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,路程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本公开实施方式中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

作为另一方面,本公开还提供了一种可读存储介质,该可读存储介质可以是上述实施方式中所述装置中所包含的可读存储介质;也可以是单独存在,未装配入设备中的可读存储介质。可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。

以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1