动态增减方法及装置与流程

文档序号:17665047发布日期:2019-05-15 22:38阅读:226来源:国知局

本申请涉及数据处理领域,具体而言,涉及一种动态增减方法及装置。



背景技术:

相关技术中在进行训练数据时,由于没有很好的数据动态删减机制,用于训练的数据总量只增不减,或者在发生数据增加或减少时需要重新训练所有数据集,导致数据总量越来越多,模型更新效率低下,识别率也越来越低。

因此,急需一种动态增减方法及装置,以解决相关技术中由于数据不能动态增减导致的识别率低下的问题。



技术实现要素:

本申请的主要目的在于提供一种动态增减方法及装置,以解决相关技术中由于数据不能动态增减导致的识别率低下的问题。

为了实现上述目的,根据本申请的第一方面,本申请实施例提供了一种动态增减方法,所述方法包括:根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点;将多个数据节点建立网状关联关系;对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型;监测所述数据节点的目标数据是否发生变化;如果监测到所述数据节点的目标数据发生了变化,则再次对所述数据节点的目标数据进行卷积神经网络训练,得到并更新所述特征模型。

结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中,所述根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点包括:根据所述目标数据的属性特征进行分类操作;将分类后的每一类所述目标数据定义为一个数据节点并按照预设加权规则设置初始权重数值。

结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中,所述将多个数据节点建立网状关联关系包括:根据每个所述数据节点的所述初始权重数值,以图结构的形式构建多个所述数据节点之间的关联关系。

结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中,所述根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点包括:对所述数据节点在设定周期内的使用次数进行统计,得到使用频率信息;根据所述数据节点的使用频率信息,对所述数据节点执行加权操作,得到实际权重数值。

结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中,所述将多个数据节点建立网状关联关系包括:根据所述数据节点的实际权重数值,更新所述图结构中的多个所述数据节点之间的关联关系。

结合第一方面,本申请实施例提供了第一方面的第五种可能的实施方式,其中,所述对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型包括:对所述数据节点中的目标数据进行卷积神经网络训练,得到训练数据与真实数据的误差值;对所述误差值进行纠正操作;判断纠正后的当前所述误差值是否达到预设目标值;如果判定纠正后的当前所述误差值达到预设目标值,则结束训练,得到所述特征模型。

为了实现上述目的,根据本申请的第二方面,本申请实施例提供了一种动态增减装置,包括:数据分类单元,用于根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点;关系建立单元,用于将所述数据分类单元定义的多个数据节点建立网状关联关系;第一模型训练单元,用于对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型;监测单元,用于监测所述数据节点的目标数据是否发生变化;第二模型训练单元,用于如果监测到所述数据节点的目标数据发生了变化,则再次对所述数据节点的目标数据进行卷积神经网络训练,得到并更新所述特征模型。

结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中,所述数据分类单元包括:特征分类模块,用于根据所述目标数据的属性特征进行分类操作;赋权模块,用于将分类后的每一类所述目标数据定义为一个数据节点并按照预设加权规则设置初始权重数值;统计模块,用于对所述数据节点在设定周期内的使用次数进行统计,得到使用频率信息;加权模块,用于根据所述数据节点的使用频率信息,对所述数据节点执行加权操作,得到实际权重数值。

结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中,所述关系建立单元包括:图结构构建模块,用于根据每个所述数据节点的所述初始权重数值,以图结构的形式构建多个所述数据节点之间的关联关系;图结构更新模块,用于根据所述数据节点的实际权重数值,更新所述图结构中的多个所述数据节点之间的关联关系。

结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中,所述第一模型训练单元包括:训练模块,用于对所述数据节点中的目标数据进行卷积神经网络训练,得到训练数据与真实数据的误差值;纠正模块,对所述误差值进行纠正操作;误差判断模块,用于判断纠正后的当前所述误差值是否达到预设目标值;结束模块,用于如果判定纠正后的当前所述误差值达到预设目标值,则结束训练,得到所述特征模型。

在本申请实施例中,采用对目标数据进行分类并将每一类定义为一个数据节点的方式,通过将多个数据节点构建成网状关系结构,达到了网状结构中的某一数据节点变化时,只需对该数据节点进行重新训练而不影响整个网状结构的目的,从而实现了动态增减的技术效果,进而解决了相关技术中由于数据不能动态增减导致的识别率低下的问题。

附图说明

构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1是根据本申请第一实施例提供的动态增减方法的流程图;

图2是根据本申请第二实施例提供的动态增减方法的流程图;

图3是根据本申请第三实施例提供的动态增减方法的流程图;

图4是根据本申请第四实施例提供的动态增减方法的流程图;

图5是根据本申请第一实施例提供的动态增减装置的示意图;

图6是根据本申请第二实施例提供的动态增减装置的示意图;

图7是根据本申请第三实施例提供的动态增减装置的示意图;以及

图8是根据本申请第四实施例提供的动态增减装置的示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。

并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。

此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

考虑到:相关技术中在进行训练数据时,由于没有很好的数据动态删减机制,用于训练的数据总量只增不减,导致数据总量越来越多,识别率越来越低,因此,本申请提供了一种动态增减方法及装置。

如图1所示,该方法包括如下的步骤s101至步骤s105:

步骤s101,根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点;

优选的,所述目标数据可以是用来进行神经网络训练的物品特征数据,根据物品的不同属性特征对所述目标数据进行分类,比如颜色、大小、形状和材料,每种类别相互独立,将每一类目标数据定义为一个可单独进行数据运算处理的数据节点,在本申请的其他实施例中,也可以按照其他分类原则对所述目标数据进行分类处理。

步骤s102,将多个数据节点建立网状关联关系;

优选的,所述网状关联关系采用图结构,图结构简称“图”,是一种复杂的数据结构,在图结构中,每个数据节点的前驱节点数和后续节点数可以为任意多个。

具体的,在第一次建立图结构时,根据人为经验为每个数据节点设置初始权重数值,根据所述初始权重数值的大小设置所述数据节点在图结构中的节点位置。

数据元素间的关系是任意的。其他数据结构(如树、线性表等)都有明确的条件限制,而图形结构中任意两个数据元素间均可相关联。常用来研究生产流程、施工计划、各种网络建设等问题。

在本申请的一些实施例中,在后续实际应用图结构的节点路线进行目标物品搜索时,实时统计每个数据节点的使用次数,并计算出所述数据节点在设定时间周期内的使用频率,根据所述使用频率,动态调整所述数据节点对应的权重数值,即实际权重数值,并根据得到的所述数据节点的实际权重数值,动态更新所述图结构中多个数据节点组成的网状关联关系。

步骤s103,对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型;

优选的,对每个所述数据节点的目标数据进行rcnn卷积神经网络训练,得到所述物品的物品特征模型。

步骤s104,监测所述数据节点的目标数据是否发生变化;

优选的,对于由多个所述数据节点构建的图结构的实际操作包括但不限于:增加、删除、修改和查询,由于在初次构建图结构时采用了人为设置数据节点位置的方法,系统本地保存有每个数据节点的具体节点位置;后期根据每个数据节点的实际权重数值进行动态位置调整,系统本地也保存了调整后的每个数据节点的具体节点位置,因此系统能够准确监测到每个数据节点的数据变化。

步骤s105,如果监测到所述数据节点的目标数据发生了变化,则再次对所述数据节点的目标数据进行卷积神经网络训练,得到并更新所述特征模型。

优选的,当系统监测到某个数据节点的目标数据发生了变化时,对该数据节点所包含的所有目标数据(包含变化后的目标数据)进行二次神经网络训练,并得到最新的物品特征模型。

实施例一:

假设有100种可乐:,首先对这100种可乐的不同属性特征进行数据分类,可以从品牌、颜色和体积三种属性分为三种类别,即三个数据节点,比如“品牌类别、颜色类别以及体积类别”,根据人为经验为三个数据节点设置初始权重数值“品牌类别30分、颜色类别60分、体积类别80分”,然后根据初始权重数值的大小确定三个数据节点在图结构中的具体节点位置并构建图结构,具体为:体积类别=>颜色类别=>品牌类别,在对图结构进行实际的增加、删除、修改和查找操作时,从上述节点组成的路径执行操作,实际效果为“体积类别:得到80种可乐,颜色类别:得到18种可乐,品牌类别:得到2种可乐”;根据在一周时间内每个数据节点的使用频率,比如“体积类别:80次/天、颜色类别:30次/天、品牌类别:60次/天”,则重新设置该数据节点的实际权重数值,比如“品牌类别60分、颜色类别30分、体积类别80分”,并以此更新整个图结构的数据节点的具体节点位置;对每个数据节点所包含的数据进行神经网络训练得到特征模型,比如由数据节点“体积类别”中包含的80种可乐作为训练数据得到一个物品特征模型,当某款可口可乐从整个图结构中删除掉后,根据节点查询路径“体积类别=>品牌类别=>颜色类别”可以得到该可口可乐,所以只需将末端数据节点“颜色类别”包含的17种可乐重新进行神经网络训练,得到新的物品特征模型并更新,而其他两个数据节点无需进行重新训练。

从以上的描述中,可以看出,本发明实现了如下技术效果:

在本申请实施例中,采用对目标数据进行分类并将每一类定义为一个数据节点的方式,通过将多个数据节点构建成网状关系结构,达到了网状结构中的某一数据节点变化时,只需对该数据节点进行重新训练而不影响整个网状结构的目的,从而实现了动态增减的技术效果,进而解决了相关技术中由于数据不能动态增减导致的识别率低下的问题。

根据本发明实施例,作为本申请实施例中的优选,如图2所示,所述根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点包括如下的步骤s201至步骤s202:

步骤s201,根据所述目标数据的属性特征进行分类操作;

优选的,所述目标数据可以是用来进行神经网络训练的物品特征数据,根据物品的不同属性特征对所述目标数据进行分类,比如颜色、大小、形状和材料,每种类别相互独立。

步骤s202,将分类后的每一类所述目标数据定义为一个数据节点并按照预设加权规则设置初始权重数值。

优选的,将每一类目标数据定义为一个可单独进行数据运算处理的数据节点,在本申请的其他实施例中,也可以按照其他分类原则对所述目标数据进行分类处理。

根据本发明实施例,作为本申请实施例中的优选,所述将多个数据节点建立网状关联关系包括:根据每个所述数据节点的所述初始权重数值,以图结构的形式构建多个所述数据节点之间的关联关系。

优选的,所述网状关联关系采用图结构,图结构简称“图”,是一种复杂的数据结构,在图结构中,每个数据节点的前驱节点数和后续节点数可以为任意多个。

根据本发明实施例,作为本申请实施例中的优选,如图3所示,所述根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点包括如下的步骤s301至步骤s302:

步骤s301,对所述数据节点在设定周期内的使用次数进行统计,得到使用频率信息;

优选的,在实际应用图结构的节点路线进行目标物品搜索时,实时统计每个数据节点的使用次数,并计算出所述数据节点在设定时间周期内的使用频率。

步骤s302,根据所述数据节点的使用频率信息,对所述数据节点执行加权操作,得到实际权重数值。

优选的,根据所述使用频率,动态调整所述数据节点对应的权重数值,即实际权重数值。

根据本发明实施例,作为本申请实施例中的优选,所述将多个数据节点建立网状关联关系包括:根据所述数据节点的实际权重数值,更新所述图结构中的多个所述数据节点之间的关联关系。

优选的,根据得到的所述数据节点的实际权重数值,动态更新所述图结构中多个数据节点组成的网状关联关系。

根据本发明实施例,作为本申请实施例中的优选,如图4所示,所述对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型包括如下的步骤s401至步骤s402:

步骤s401,对所述数据节点中的目标数据进行卷积神经网络训练,得到训练数据与真实数据的误差值;

优选的,对所数据节点中的目标数据进行rcnn神经网络训练,得到预测值,并且计算出预测值与标注数据的真实值的误差值。

步骤s402,对所述误差值进行纠正操作;

优选的,所述误差值为损失函数的计算结果,通过损失函数计算出来的模型的预测值与真实值的不一致程度,根据所述误差值,和优化后的所述损失函数的参数,优化rcnn神经网络参数,并进行再次训练,不断的纠正和标注好的数据之间的误差,得到新的更接近于真实值的误差值,再次进行纠正,在本申请的cnn神经网络中大概进行3万次误差纠正操作。

步骤s403,判断纠正后的当前所述误差值是否达到预设目标值;

优选的,预设目标值相当于标注信息的值也就是真实值,等于或收敛至真实值,预期值相当于是真实值的接近程度,也就是误差值的大小。

步骤s404,如果判定纠正后的当前所述误差值达到预设目标值,则结束训练,得到所述特征模型。

优选的,如果判定经过误差纠正操作后的当前误差值已经在预设范围内,则结束神经网络训练,并根据训练结果得到所述样本物品的物品特征模型。

需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

根据本发明实施例,还提供了一种用于实施上述动态增减方法的装置,如图5所示,该装置包括:数据分类单元10,用于根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点;关系建立单元20,用于将所述数据分类单元定义的多个数据节点建立网状关联关系;第一模型训练单元30,用于对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型;监测单元40,用于监测所述数据节点的目标数据是否发生变化;第二模型训练单元50,用于如果监测到所述数据节点的目标数据发生了变化,则再次对所述数据节点的目标数据进行卷积神经网络训练,得到并更新所述特征模型。

根据本申请实施例所述的数据分类单元10用于根据预设分类规则对目标数据进行分类,并将每一类目标数据定义为一个数据节点,优选的,所述目标数据可以是用来进行神经网络训练的物品特征数据,根据物品的不同属性特征对所述目标数据进行分类,比如颜色、大小、形状和材料,每种类别相互独立,将每一类目标数据定义为一个可单独进行数据运算处理的数据节点,在本申请的其他实施例中,也可以按照其他分类原则对所述目标数据进行分类处理。

根据本申请实施例所述的关系建立单元20用于将所述数据分类单元定义的多个数据节点建立网状关联关系,优选的,所述网状关联关系采用图结构,图结构简称“图”,是一种复杂的数据结构,在图结构中,每个数据节点的前驱节点数和后续节点数可以为任意多个。

根据本申请实施例所述的第一模型训练单元30用于对每个所述数据节点的目标数据进行卷积神经网络训练,得到特征模型,优选的,对每个所述数据节点的目标数据进行rcnn卷积神经网络训练,得到所述物品的物品特征模型。

根据本申请实施例所述的监测单元40用于监测所述数据节点的目标数据是否发生变化,优选的,对于由多个所述数据节点构建的图结构的实际操作包括但不限于:增加、删除、修改和查询,由于在初次构建图结构时采用了人为设置数据节点位置的方法,系统本地保存有每个数据节点的具体节点位置;后期根据每个数据节点的实际权重数值进行动态位置调整,使得权重高的节点在所述图结构中的节点位置靠前,可以被优先查询到,系统本地也保存了调整后的每个数据节点的具体节点位置,因此系统能够准确监测到每个数据节点的数据变化。

根据本申请实施例所述的第二模型训练单元50用于如果监测到所述数据节点的目标数据发生了变化,则再次对所述数据节点的目标数据进行卷积神经网络训练,得到并更新所述特征模型,优选的,当系统监测到某个数据节点的目标数据发生了变化时,对该数据节点所包含的所有目标数据(包含变化后的目标数据)进行二次神经网络训练,并得到最新的物品特征模型。

根据本发明实施例,作为本申请实施例中的优选,如图6所示,所述数据分类单元10包括:特征分类模块11,用于根据所述目标数据的属性特征进行分类操作;赋权模块12,用于将分类后的每一类所述目标数据定义为一个数据节点并按照预设加权规则设置初始权重数值;统计模块13,用于对所述数据节点在设定周期内的使用次数进行统计,得到使用频率信息;加权模块14,用于根据所述数据节点的使用频率信息,对所述数据节点执行加权操作,得到实际权重数值。

根据本申请实施例所述的特征分类模块11用于根据所述目标数据的属性特征进行分类操作,优选的,所述目标数据可以是用来进行神经网络训练的物品特征数据,根据物品的不同属性特征对所述目标数据进行分类,比如颜色、大小、形状和材料,每种类别相互独立。

根据本申请实施例所述的赋权模块12用于将分类后的每一类所述目标数据定义为一个数据节点并按照预设加权规则设置初始权重数值,优选的,将每一类目标数据定义为一个可单独进行数据运算处理的数据节点,在本申请的其他实施例中,也可以按照其他分类原则对所述目标数据进行分类处理。

根据本申请实施例所述的统计模块13用于对所述数据节点在设定周期内的使用次数进行统计,得到使用频率信息,优选的,在实际应用图结构的节点路线进行目标物品搜索时,实时统计每个数据节点的使用次数,并计算出所述数据节点在设定时间周期内的使用频率。

根据本申请实施例所述的加权模块14用于根据所述数据节点的使用频率信息,对所述数据节点执行加权操作,得到实际权重数值,优选的,根据所述使用频率,动态调整所述数据节点对应的权重数值,即实际权重数值。

根据本发明实施例,作为本申请实施例中的优选,如图7所示,所述关系建立单元20包括:图结构构建模块21,用于根据每个所述数据节点的所述初始权重数值,以图结构的形式构建多个所述数据节点之间的关联关系;图结构更新模块22,用于根据所述数据节点的实际权重数值,更新所述图结构中的多个所述数据节点之间的关联关系。

根据本申请实施例所述的图结构构建模块21用于根据每个所述数据节点的所述初始权重数值,以图结构的形式构建多个所述数据节点之间的关联关系,优选的,所述网状关联关系采用图结构,图结构简称“图”,是一种复杂的数据结构,在图结构中,每个数据节点的前驱节点数和后续节点数可以为任意多个。

根据本申请实施例所述的图结构更新模块22用于根据所述数据节点的实际权重数值,更新所述图结构中的多个所述数据节点之间的关联关系,优选的,根据得到的所述数据节点的实际权重数值,动态更新所述图结构中多个数据节点组成的网状关联关系。

根据本发明实施例,作为本申请实施例中的优选,如图8所示,所述第一模型训练单元30包括:训练模块31,用于对所述数据节点中的目标数据进行卷积神经网络训练,得到训练数据与真实数据的误差值;纠正模块32,对所述误差值进行纠正操作;误差判断模块33,用于判断纠正后的当前所述误差值是否达到预设目标值;结束模块34,用于如果判定纠正后的当前所述误差值达到预设目标值,则结束训练,得到所述特征模型。

根据本申请实施例所述的训练模块31用于对所述数据节点中的目标数据进行卷积神经网络训练,得到训练数据与真实数据的误差值,优选的,对所数据节点中的目标数据进行rcnn神经网络训练,得到预测值,并且计算出预测值与标注数据的真实值的误差值。

根据本申请实施例所述的纠正模块32对所述误差值进行纠正操作,优选的,所述误差值为损失函数的计算结果,通过损失函数计算出来的模型的预测值与真实值的不一致程度,根据所述误差值,和优化后的所述损失函数的参数,优化rcnn神经网络参数,并进行再次训练,不断的纠正和标注好的数据之间的误差,得到新的更接近于真实值的误差值,再次进行纠正,在本申请的cnn神经网络中大概进行3万次误差纠正操作。

根据本申请实施例所述的误差判断模块33用于判断纠正后的当前所述误差值是否达到预设目标值,优选的,预设目标值相当于标注信息的值也就是真实值,等于或收敛至真实值,预期值相当于是真实值的接近程度,也就是误差值的大小。

根据本申请实施例所述的结束模块34用于如果判定纠正后的当前所述误差值达到预设目标值,则结束训练,得到所述特征模型,优选的,如果判定经过误差纠正操作后的当前误差值已经在预设范围内,则结束神经网络训练,并根据训练结果得到所述样本物品的物品特征模型。

显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1