产品质量预测方法及装置与流程

文档序号:18743283发布日期:2019-09-21 02:02阅读:455来源:国知局
产品质量预测方法及装置与流程

本发明涉及数据处理技术,尤其涉及一种产品质量预测方法及装置。



背景技术:

在产品制造业中,有大量数据在加工生产环节保留下来,目前的方式是利用大量数据对制造的产品进行质量预测。

现有技术先对特征数据进行关键特征提取,然后将提取的数据输入到Xgboost模型中进行预测,Xgboost算法是一种基于传统梯度提升决策树(Gradient Boosting Decision Tree,简称GBDT)的拓展性方法,GBDT是一种迭代的决策树算法,该算法由多棵决策回归树组成,所有树的结论累加起来做最终答案。

然而,现有技术以决策树为基础的Xgboost使用贪心算法,使得问题容易陷入局部最优,当数据的特征类别比较多时,预测的过拟合风险较高。因此,现有技术中的产品质量预测方法不可靠。



技术实现要素:

本发明提供一种产品质量预测方法及装置,提高了产品质量预测的准确性。

本发明的第一方面,本提供一种产品质量预测方法,包括:

获取产品生成过程中的关键特征数据,所述关键特征数据包括非时序特征数据和时序特征数据;

根据所述非时序特征数据获取第一特征向量和第二特征向量,其中,所述第一特征向量是以对所述非时序特征数据进行特征数据关联处理得到的,所述第二特征向量是以对所述非时序特征数据进行特征数据优化处理得到的;

对所述时序特征数据进行特征数据序列处理得到第三特征向量;

根据所述第一特征向量、所述第二特征向量、所述第三特征向量和预设的质量预测模型,获取所述产品的预测质量信息。

可选地,在第一方面的一种可能实现方式中,所述非时序特征数据包括:连续型特征数据和离散型特征数据。

可选地,在第一方面的一种可能实现方式中,所述根据所述非时序特征数据获取第一特征向量,包括:

对所述连续型特征数据归一化处理,获取归一化处理后的连续型特征向量;

将所述离散型特征数据进行独热编码,获取一维特征向量,并将所述一维特征向量两两一组进行特征数据关联处理构造交叉特征向量;

将所述一维特征向量、所述交叉特征向量与所述连续型特征向量进行拼接,获取高维输入向量;

以预设的所述单层神经网络模型对所述高维输入向量进行处理,获取所述第一特征向量。

可选地,在第一方面的一种可能实现方式中,所述对所述连续型特征数据归一化处理,获取归一化处理后的连续型特征数据向量,包括:

根据公式一对所述连续型特征数据归一化处理,获取连续型特征向量;

其中,x′代表连续型特征向量,x代表所述连续型特征数据,μ代表所述连续型特征数据所有数据的平均数,σ代表所述连续型特征数据所有数据的标准差。

可选地,在第一方面的一种可能实现方式中,所述根据所述非时序特征数据获取第二特征向量,包括:

对所述连续型特征数据归一化处理,获取归一化处理后的连续型稠密特征向量;

将所述离散型特征数据添加嵌入层,获取离散型稠密特征数据;

将所述连续型稠密特征向量与所述离散型稠密特征拼接,获取稠密特征向量;

以预设的多层感知机对所述稠密特征向量进行特征数据优化处理,获取所述第二特征向量。

可选地,在第一方面的一种可能实现方式中,所述根据所述时序特征数据获取第三特征向量,包括:

根据所述时序特征数据构造出多个对应所述时序特征数据的时序特征向量数据;

将多个所述时序特征向量数据降维,获取关键时序特征向量数据;

以预设的长短时记忆网络模型对所述关键时序特征向量数据进行特征数据序列处理,获取第三特征向量。

可选地,在第一方面的一种可能实现方式中,所述将多个所述时序特征向量数据降维,获取关键时序特征向量数据,包括:

以预设的单层全连接层神经网络对多个所述时序向量进行降维处理,获取所述关键时序向量数据,其中,所述单层全连接层神经网络的输入层神经元数为M、输出层神经元数为N,且M>N。

可选地,在第一方面的一种可能实现方式中,所述预设的质量预测模型包括多层感知神经网络,所述多层感知神经网络的输出层神经元数目为1;

相应的,所述根据所述第一特征向量、所述第二特征向量、所述第三特征向量和预设的质量预测模型,获取预测质量信息,包括:

将所述第一特征向量、所述第二特征向量和所述第三特征向量拼接,获取总特征向量;

根据所述总特征向量和多层感知神经网络,获取预测质量信息,其中,所述多层感知神经网络的输入层神经元数目与所述总特征向量的维数相同。

可选地,在第一方面的一种可能实现方式中,所述根据所述第一特征向量、所述第二特征向量、所述第三特征向量和预设的质量预测模型,获取预测质量信息之前,包括:

获取总特征向量样本以所述总特征向量样本产生的预测质量信息样本;

以所述预测质量信息样本为输出量,以所述总特征向量样本为输入量,对初始质量预测模型进行学习获取所述预设的质量预测模型。

本发明的第二方面,一种产品质量预测装置,其特征在于,包括:

特征获取模块,用于获取产品生成过程中的关键特征数据,所述关键特征数据包括非时序特征数据和时序特征数据;

非时序特征处理模块,用于根据所述非时序特征数据获取第一特征向量和第二特征向量,其中,所述第一特征向量是以对所述非时序特征数据进行特征数据关联处理得到的,所述第二特征向量是以对所述非时序特征数据进行特征数据优化处理得到的;

时序特征处理模块,用于对所述时序特征数据进行特征数据序列处理得到第三特征向量;

质量预测模块,用于根据所述第一特征向量、所述第二特征向量、所述第三特征向量和预设的质量预测模型,获取所述产品的预测质量信息。

可选地,在第二方面的一种可能实现方式中,所述非时序特征数据包括:连续型特征数据和离散型特征数据。

可选地,在第二方面的一种可能实现方式中,所述根据所述非时序特征数据获取第一特征向量,包括:

对所述连续型特征数据归一化处理,获取归一化处理后的连续型特征向量;

将所述离散型特征数据进行独热编码,获取一维特征向量,并将所述一维特征向量两两一组进行特征数据关联处理构造交叉特征向量;

将所述一维特征向量、所述交叉特征向量与所述连续型特征向量进行拼接,获取高维输入向量;

以预设的所述单层神经网络模型对所述高维输入向量进行处理,获取所述第一特征向量。

可选地,在第二方面的一种可能实现方式中,所述对所述连续型特征数据归一化处理,获取归一化处理后的连续型特征数据向量,包括:

根据公式一对所述连续型特征数据归一化处理,获取连续型特征向量;

其中,x′代表连续型特征向量,x代表所述连续型特征数据,μ代表所述连续型特征数据所有数据的平均数,σ代表所述连续型特征数据所有数据的标准差。

可选地,在第二方面的一种可能实现方式中,所述根据所述非时序特征数据获取第二特征向量,包括:

对所述连续型特征数据归一化处理,获取归一化处理后的连续型稠密特征向量;

将所述离散型特征数据添加嵌入层,获取离散型稠密特征数据;

将所述连续型稠密特征向量与所述离散型稠密特征拼接,获取稠密特征向量;

以预设的多层感知机对所述稠密特征向量进行特征数据优化处理,获取所述第二特征向量。

可选地,在第二方面的一种可能实现方式中,所述时序特征处理模块用于根据所述时序特征数据构造出多个对应所述时序特征数据的时序特征向量数据;

将多个所述时序特征向量数据降维,获取关键时序特征向量数据;

以预设的长短时记忆网络模型对所述关键时序特征向量数据进行特征数据序列处理,获取第三特征向量。

可选地,在第二方面的一种可能实现方式中,所述将多个所述时序特征向量数据降维,获取关键时序特征向量数据,包括:

以预设的单层全连接层神经网络对多个所述时序向量进行降维处理,获取所述关键时序向量数据,其中,所述单层全连接层神经网络的输入层神经元数为M、输出层神经元数为N,且M>N。

可选地,在第二方面的一种可能实现方式中,所述预设的质量预测模型包括多层感知神经网络,所述多层感知神经网络的输出层神经元数目为1;

相应的,所述质量预测模块用于将所述第一特征向量、所述第二特征向量和所述第三特征向量拼接,获取总特征向量;

根据所述总特征向量和多层感知神经网络,获取预测质量信息,其中,所述多层感知神经网络的输入层神经元数目与所述总特征向量的维数相同。

可选地,在第二方面的一种可能实现方式中,所述质量预测模块获取预测质量信息之前,包括:

获取总特征向量样本和以所述总特征向量样本产生的预测质量信息样本;

以所述预测质量信息样本为输出量,以所述总特征向量样本为输入量,对初始质量预测模型进行学习获取所述预设的质量预测模型。

本发明提供的产品质量预测方法及装置,实现了产品质量的预测,过程中首先对生产监控数据进行筛选,去除干扰项,得到关键特征数据,减少对数据的处理量,提高了预测质量信息的准确性;此外,获取到的关键特征数据,有非时序特征数据和时序特征数据两种类型,本方案采用两种方式来对非时序特征数据进行处理,采用一种方式来对时序特征数据处理,其中对非时序特征数据进行特征数据关联处理得到的第一特征向量,用于对特征数据做宽度处理,建立特征数据之间的联系,对非时序特征数据进行特征数据优化处理得到第二特征向量,用于对特征数据做全面深度处理,对时序特征数据进行特征数据序列处理,上述三种处理方式得到三个特征向量进行拼接,利用预设的质量预测模型获取到产品的预测质量信息,本发明充分考虑了制造业海量数据中各种特征的不同情况,依据不同类型,以相对更加合理的方式将特征进行分类、结合、处理、融合,三种处理方式各有所长,预测效果相较于模型结构较为单一的现有相关技术理应更优,提高了产品预测质量的准确性。

附图说明

图1为本发明提供的一种产品质量预测的方法流程示意图;

图2为本发明提供的步骤S102中一种获取第一特征向量方法的流程示意图;

图3为本发明提供的步骤S102中一种获取第二特征向量方法的流程示意图;

图4为本发明提供的步骤S103中一种获取第三特征向量方法的流程示意图;

图5为本发明提供的长短时记忆网络模型的结构示意图;

图6为本发明提供的获取预测质量信息方法的流程示意图;

图7是本发明实施例提供的一种产品质量预测装置的结构示意图;

图8是本发明实施例提供的一种设备的硬件结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。

应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。

应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

在一些本发明的应用场景中,例如在产品制造业中,有大量数据在加工生产环节保留下来,目前,利用这些海量数据可以对新的产品进行质量预测,也可以据此调整加工过程,然而,现有技术对这些海量数据进行处理时,使得问题容易陷入局部最优,当数据的特征类别比较多时,预测的过拟合风险会增加。因此,现有技术中的产品质量预测方法不可靠。

为了解决现有技术的如上技术问题,本发明提供一种产品质量预测的方法,实现了产品质量的预测,提高了产品质量预测的准确性。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。

图1为本发明提供的一种产品质量预测的方法流程示意图,图1所示方法的执行主体可以是软件和/或硬件装置。图1所示方法包括步骤S101至步骤S104,具体如下:

S101、获取产品生成过程中的关键特征数据,关键特征数据包括非时序特征数据和时序特征数据。

在一些实施例中,在产品生产过程中,会有海量的生产监控数据,海量的生产监控数据可以理解为工厂中的各个环节积累的大量的各式各样的监控特征的数据,例如在产品成型环节需调节温度为100°,为可以由成型环节处的温度传感器获取;关键特征数据为从产品的生产监控数据中提取出来的与产品最终质量具有关联性的关键指标,去除掉干扰项,以减少后续处理的数据量,提高产品质量预测的准确性。

在另一些实施例中,关键特征数据包括非时序特征数据和时序特征数据,即海量的生产监控数据包括非时序特征数据和时序特征数据,而关键特征数据包括与产品最终质量具有关联性的关键指标的非时序特征数据和时序特征数据。

在另一些实施例中,非时序特征数据包括连续型特征数据和离散型特征数据,其中,离散型特征数据和连续型特征数据的区别就是,连续型特征数据是在一定区间内变化较为分散的,如某产品的在某道工序经历的加工时常可能是从500秒到800秒之间的各种取值,则称之为连续型特征数据,而离散型特征数据常常为类别型的变量,比如工艺要求加热温度只有280℃和300℃两档,不存在295℃或275℃这种取值,则称之为离散型特征数据。

S102、根据非时序特征数据获取第一特征向量和第二特征向量,其中,第一特征向量是以对非时序特征数据进行特征数据关联处理得到的,第二特征向量是以对所述非时序特征数据进行特征数据优化处理得到的。

在一些实施例中,第一特征向量和第二特征向量是采用两种不同的方式同时对非时序特征数据处理得到的两种不同的特征向量,其中,第一特征向量是对非时序特征数据进行特征数据关联处理得到的,建立非时序特征数据之间的联系,用于对非时序特征数据做宽度处理,第二特征向量是对非时序特征数据进行特征数据优化处理得到,用于对非时序特征数据做全面深度处理,针对非时序特征数据的特点,采用两种方式进行宽度和深度的处理,得到处理后的第一特征向量和第二特征向量。

S103、对时序特征数据进行特征数据序列处理得到第三特征向量。

在一些实施例中,时序特征数据即与时间变化联系较为紧密的,在加工生产的全过程、全工序中一直监测的采样数据,例如,对全过程的温度进行监控,加工总时长若为7200秒,假设每隔5秒进行一次采样,则会得到1440个数据,本方案针对时序特征数据的特点,对时序特征数据进行特征数据序列处理,得到第三特征向量。

S104、根据第一特征向量、第二特征向量、第三特征向量和预设的质量预测模型,获取产品的预测质量信息。

在一些实施例中,上述针对不同的关键特征数据采用不同的方式处理,得到三个不同的向量,将三个向量拼接到一起,形成一个长向量,对关键特征数据的处理进行汇总,输入到训练好的预设的质量预测模型,即可得到产品的预测质量信息,产品的预测质量信息为一个质量值,质量值的范围在0~1之间,例如,0、85。

上述实施例提供的产品质量预测的方法,实现了产品质量的预测,实现了产品质量的预测,过程中首先对生产监控数据进行筛选,去除干扰项,得到关键特征数据,减少对数据的处理量,提高了预测质量信息的准确性;此外,获取到的关键特征数据,有非时序特征数据和时序特征数据两种类型,本方案采用两种方式来对非时序特征数据进行处理,采用一种方式来对时序特征数据处理,其中对非时序特征数据进行特征数据关联处理得到的第一特征向量,用于对特征数据做宽度处理,建立特征数据之间的联系,对非时序特征数据进行特征数据优化处理得到第二特征向量,用于对特征数据做全面深度处理,对时序特征数据进行特征数据序列处理,上述三种处理方式得到三个特征向量进行拼接,利用预设的质量预测模型获取到产品的预测质量信息,本发明充分考虑了制造业海量数据中各种特征的不同情况,依据不同类型,以相对更加合理的方式将特征进行分类、结合、处理、融合,三种处理方式各有所长,预测效果相较于模型结构较为单一的现有相关技术理应更优,提高了产品预测质量的准确性。

非时序特征数据包括:连续型特征数据和离散型特征数据。

图2为本发明提供的步骤S102中一种获取第一特征向量方法的流程示意图,图2所示方法的执行主体可以是软件和/或硬件装置。图2所示方法包括步骤S201至步骤S204,具体如下:

S201、对连续型特征数据归一化处理,获取归一化处理后的连续型特征向量。

在一些实施例中,对连续型特征数据归一化处理,就是将连续型特征数据进行统一的处理,根据公式一对连续型特征数据归一化处理,获取连续型特征向量;

其中,x′代表连续型特征向量,x代表连续型特征数据,μ代表连续型特征数据所有数据的平均数,σ代表连续型特征数据所有数据的标准差。

例如,假设加工生产一种热水壶,但热水壶的生产工艺不是固定的,如某道工序的加工时长并不一定,所用材料并不一定,每道工序加热的温度不同,等等,在制造中生产厂家会对每一个热水壶的生产过程进行全记录监控,并对生产出的水壶进行质量评定,最终得到的数据结构就是:编号为m的水壶,使用某公司生产的某材料、在某工序中加热某秒,在某工序中加热到某摄氏度,最终得到的质量评分为某,每一个水壶各个特征的监控数据和对应的质量评定数据就是我们用的制造业大数据,假设热水壶m在某道工序的加工时长为600秒,而所有产品的加工时长平均值为580秒,标准差为3,则归一化处理后的连续型特征向量

S202、将离散型特征数据进行独热编码,获取一维特征向量,并将一维特征向量两两一组进行特征数据关联处理构造交叉特征向量。

在一些实施例中,离散型特征数据的独热编码,就是将离散的数据构造为只由一个1和其余为0的向量,例如,热水壶在某道工序加工时采用的温度只包含150℃、180℃和210℃三档,不存在165℃或者192℃这种位于它们之间的其他值。为了避免过拟合等后果,不直接将150、180、210作为数据输入,而是将这些数据使用独热编码,即建立相应的三种一维特征“某工序的加工温度-1”、“某工序的加工温度-2”和“某工序的加工温度-3”(分别对应150、180、210),组成一个3×1的只由0和1组成的向量[t1,t2,t3],三个位置中仅在真实的加工温度处取1,其余取0,如热水壶m在这道工序中的加工温度为210℃,那么它对应于这个加工温度的3×1特征向量为[0,0,1],即仅在210℃对应的位置为1,其余为0,完成对离散型特征数据的独热编码,获取到一维特征向量。

在另一些实施例中,交叉特征向量就是将上述不同的一维特征向量绑定成组构造出的新特征向量,例如,假设热水壶的特征中,包含原材料厂商(假设有公司1和公司2两家可选)和使用材料(假设包含材料A、B、C三种,这里的意思是,A、B、C三种材料在公司1和公司2都可以买到)则对这两个本身独立的一维特征向量,建立一个二维交叉特征:“厂商-材料”,根据原先特征各自的可能取值,则结果为相应的“1-A”,“1-B”,“1-C”,“2-A”,“2-B”,“2-C”六种,由此再进一步将六种结果转化,即相对于六种结果按顺序依次构造“厂商-材料-1”,“厂商-材料-2”,“厂商-材料-3”,“厂商-材料-4”,“厂商-材料-5”,“厂商-材料-6”六种交叉特征,分别对应刚刚提到的六种可能的结果。对于这六个交叉特征,仅在对应的结果处取1,其余三处取0。也就是说,假设该实例个体m的数据中显示,本产品由公司2提供的原材料A,则这一条数据的交叉特征向量[“厂商-材料-1”,“厂商-材料-2”,“厂商-材料-3”,“厂商-材料-4”,“厂商-材料-5”,“厂商-材料-6”]=[0,0,0,1,0,0],在实际的制造业监测数据中,可能的特征种类远远多于上述这种,我们挑选其中的离散型特征数据,两两一组构造成交叉特征向量,就这个实施例而言,也许使用公司1的B材料就容易出现残次品,使用公司2的A材料就容易出现残次品,如果不这样构造,我们或许很难从一维特征获取上述关联信息,很难捕获这种联系。

S203、将一维特征向量、交叉特征向量与连续型特征向量进行拼接,获取高维输入向量。

在一些实施例中,将上述步骤得到的一维特征向量、交叉特征向量与连续型特征向量进行拼接,形成长向量,即高维输入向量,实现对非时序特征数据中特征数据的关联处理,构建特征数据之间的关系。

S204、以预设的单层神经网络模型对高维输入向量进行处理,获取第一特征向量。

在一些实施例中,预设的单层神经网络模型用于对高维输入向量进行处理,预设的单层神经网络模型由一个不加激活函数的单层神经网络构成,预设的单层神经网络模型的输入是高维输入向量,输出第一特征向量,第一特征向量是一个约20维的向量。

本实施例中,步骤S201和步骤S202的执行顺序不限,步骤S201可以在步骤S202之前执行,也可以在步骤S202之后执行,也可以与步骤S202同时执行,步骤S201需要在步骤S203之前执行完毕。

图3为本发明提供的步骤S102中一种获取第二特征向量方法的流程示意图,图3所示方法的执行主体可以是软件和/或硬件装置。图3所示方法包括步骤S301至步骤S304,具体如下:

S301、对连续型特征数据归一化处理,获取归一化处理后的连续型稠密特征向量。

在一些实施例中,步骤S301与步骤S201相同,其中,步骤S301中的连续型稠密特征向量与步骤S201中的连续型特征向量相同,均是实现对连续型特征数据归一化处理,效果一致,在此不再赘述。

S302、将离散型特征数据添加嵌入层,获取离散型稠密特征数据。

在一些实施例中,嵌入层是借用自然语言处理中的词向量嵌入的思想,将高维向量映射为低维特征的方法,由于独热编码可以将离散型特征转化为多个一维特征,并用一个“1”和其余若干的“0”表征原始离散特征,通常,离散型特征若经过独热化处理以后,若离散型特征的维度很高时,由于独热化的向量只允许出现一个1和若干的0,独热化处理的结果通常是极其稀疏的向量组成的稀疏矩阵。为了解决这个问题,可以采用嵌入式方法将高维的离散特征向量输入到嵌入层神经网络中,从而得到一个保留原始输入信息的低维稠密向量。这样做的实质是通过进行额外的训练过程,去除稀疏化,获取离散型稠密特征数据。

S303、将连续型稠密特征向量与离散型稠密特征拼接,获取稠密特征向量。

在一些实施例中,连续型稠密特征向量即将连续型特征数据归一化处理得到的,与离散型稠密特征拼接,得到稠密特征向量,实现对非时序特征向量中特征数据的处理。

S304、以预设的多层感知机对稠密特征向量进行特征数据优化处理,获取第二特征向量。

在一些实施例中,多层感知机即一个多层神经网络,每一层都采用线性整流函数作为非线性函数,多层感知机的输入是稠密特征向量,输出也是一个向量,即第二特征向量。

本实施例中,步骤S301和步骤S302的执行顺序不限,步骤S301可以在步骤S302之前执行,也可以在步骤S302之后执行,也可以与步骤S302同时执行,步骤S301需要在步骤S303之前执行完毕。

图4为本发明提供的步骤S103中一种获取第三特征向量方法的流程示意图,图4所示方法的执行主体可以是软件和/或硬件装置。图4所示方法包括步骤S401至步骤S403,具体如下:

S401、根据时序特征数据构造出多个对应时序特征数据的时序特征向量数据。

在一些实施例中,时序数据即与时间变化联系较为紧密的,在加工生产的全过程、全工序中一直监测的采样数据,例如,对全过程的温度进行监控,加工总时长若为7200秒,假设每隔5秒进行一次采样,则会得到1440个数据。真实数据中,加工总时长通常在25000秒以上,其采样频率或许更高,而且采样的特征种类远远不止温度一种,这样的海量数据直接使用是不现实的。此时,应先对海量时序数据进行基于统计量的表征。最简单的方法是,将总共的加工时长等分为若干段(如15段),分别计算每一小段的平均值、中位数、众数等,从而构造出属于这一特征的时序向量(假设使用这三个统计量,则对每个特征每一个时段,建立一个1×3的向量,其三个元素即该特征在该时段的上述三个统计量),这样就能在尽量保留原先海量数据变化趋势的前提下获得精炼的数据,也就是用各种统计量表征的时序数据向量。

S402、将多个时序特征向量数据降维,获取关键时序特征向量数据;

在一些实施例中,得到时序特征向量数据后,需要进行降维处理,假设我们要处理的时序数据中有20种时序特征,我们将总加工时长等分为15段,每一个特征包含3个统计量,那么输入数据15行60(20×3)列,其中每一行为同一时段20个特征的1×3向量拼接而成的1×60维数据,而每一列为同一特征各个时段1×3向量,在现实处理种,可能遇到更多的特征类型、用到更多的统计量(如方差、标准差等)、分割更多的时段,此时数据矩阵的行数仍为分割的段数,但是列数则为特征数目×统计量数目,后者会变得非常巨大。因此,采用降维方法在保留原有信息基础上先获得更加精简的数据,可以减少对数据的处理量,提高本方案对数据的处理效率,降维的方法可以是使用全连接层嵌入的方法降维,也可以是使用Xgboost算法对特征进行重要性排序的方法降维。

在另一些实施例中,其中,使用全连接层嵌入的方法降维,是以预设的单层全连接层神经网络对多个所述时序向量进行降维处理,获取关键时序向量数据,其中,单层全连接层神经网络的输入层神经元数为M、输出层神经元数为N,且M>N,此方法不做特征重要性排序,而是直接将全部的时序特征向量数据输入到一个全连接层网络中,如对于上一段中的60列数据,建立一个输入层神经元数为60、输出层神经元数为30的单层全连接层神经网络,并将这个网络30维的输出替代原先的60维列向量,完成降维。

使用Xgboost算法对特征进行重要性排序的方法降维,例如上述的20个特征中或许并非所有特征都对最终预测的质量结果有特别大的影响,因此可以相对挑出最重要的前K个(如前7个),作为最后使用的数据以作为输入,也就是说,只选用7个特征的三种统计量,最终将60维降为21维,并将这21维替代原有的60维得到一个15行21维矩阵,完成降维。

S403、以预设的长短时记忆网络模型对关键时序特征向量数据进行特征数据序列处理,获取第三特征向量。

在一些实施例中,长短时记忆网络模型的输入为关键时序特征向量数据,输出为一个针对关键时序特征向量数据的第三特征向量。

图5为本发明提供的长短时记忆网络模型的结构示意图,具体如下:

LSTM由一系列时间单元构成,每个时间单元包含输入门it,遗忘门ft,输出门ot。其中,遗忘门负责决定每一个时刻的单元丢弃哪些信息,输入门决定每一时刻的单元接收多少信息,输出门确定每个时刻的状态与输出的关系。

对于任意一个时刻(为方便,设为时刻t),其包含的内容为输入Xt、状态Ct、输出ht。

遗忘门的公式为ft=σ(Wf·[ht-1,xt]+bf),其中ft为遗忘门输出,Wf为遗忘门权值,bf为遗忘门偏置。

输入门的公式为

其中it为输入门输出,Wi为输入门权值,bi为输入门偏置,为状态中间量,WC为状态中间量权值,bC为状态中间量偏置;

输出门的公式为ot=σ(Wo·[ht-1,xt]+bo),其中ot为输出门输出,Wo为输出门权值,bo为输出门偏置。

上述公式中t时刻的输入为xt、状态为Ct、输出为ht,而σ代表sigmoid函数σ(u)=1/(1+e-u),tanh表示双曲正切函数。

LSTM的特点在于,它能控制每一时刻的学习与遗忘过程,从而对过去的时间序列状态进行过滤,选择那些对当前状态更有影响的先前状态。这种优势使得网络能使两个时刻之间的联系变得可控,避免了相距较远的不同单元梯度传递时造成的梯度爆炸或梯度消失的问题。

在一些实施例中,第三特征向量实质上就是LSTM输出层的构成的序列。LSTM吸取全连接层降维后的时序数据作为输入,读取了时序输入信息,每一时刻的输出结果形成的向量即可作为第三特征向量。

图6为本发明提供的获取预测质量信息方法的流程示意图,图6所示方法的执行主体可以是软件和/或硬件装置。图6所示方法包括步骤S501至步骤S502,具体如下:

S501、将第一特征向量、第二特征向量和第三特征向量拼接,获取总特征向量。

在一些实施例中,第一特征向量和第二特征向量是针对非时序特征数据处理得到的两种特征向量,第三特征向量是针对时序特征数据处理得到的,将三种向量拼接成的总特征向量,是对海量原始数据做了多种处理后得到的与产品质量相关的数据。

S502、根据总特征向量和预设的质量预测模型,获取预测质量信息,其中,预设的质量预测模型包括多层感知神经网络,多层感知神经网络的输出层神经元数目为1,多层感知神经网络的输入层神经元数目与总特征向量的维数相同。

在一些实施例中,由于产品的质量指标为一个在[0,1]内的小数,因此将多层感知神经网络的输出层神经元数目设为1,且其输入层神经元数目与总特征向量的维数相同,假设上述汇总出来的长向量是50维,则多层感知机的输入层神经元数目为50,最终的输出层的神经元数目为1,这意味着我们模型最终的预测结果仅为一个数字,即最终的预测质量信息。

在另一些实施例中,根据第一特征向量、第二特征向量、第三特征向量和预设的质量预测模型,获取预测质量信息之前,获取总特征向量样本,和以所述总特征向量样本产生的预测质量信息样本对初始质量预测模型进行学习获取预设的质量预测模型。

参见图7,是本发明实施例提供的一种产品质量预测装置的结构示意图,如图7所示的产品质量预测装置10,包括:

特征获取模块101,用于获取产品生成过程中的关键特征数据,关键特征数据包括非时序特征数据和时序特征数据。

非时序特征处理模块102,用于根据非时序特征数据获取第一特征向量和第二特征向量,其中,第一特征向量是以对非时序特征数据进行特征数据关联处理得到的,第二特征向量是以对非时序特征数据进行特征数据优化处理得到的。

时序特征处理模块103,用于对时序特征数据进行特征数据序列处理得到第三特征向量。

质量预测模块104,用于根据第一特征向量、第二特征向量、第三特征向量和预设的质量预测模型,获取产品的预测质量信息。

图7所示实施例的产品质量预测装置10对应地可用于执行图1所示方法实施例中的步骤,其实现原理和技术效果类似,此处不再赘述。

非时序特征数据包括:连续型特征数据和离散型特征数据。

根据非时序特征数据获取第一特征向量,包括:

对连续型特征数据归一化处理,获取归一化处理后的连续型特征向量;

将离散型特征数据进行独热编码,获取一维特征向量,并将一维特征向量两两一组进行特征数据关联处理构造交叉特征向量;

将一维特征向量、交叉特征向量与连续型特征向量进行拼接,获取高维输入向量;

以预设的单层神经网络模型对高维输入向量进行处理,获取第一特征向量。

对连续型特征数据归一化处理,获取归一化处理后的连续型特征数据向量,包括:

根据公式一对连续型特征数据归一化处理,获取连续型特征向量;

其中,x′代表连续型特征向量,x代表连续型特征数据,μ代表连续型特征数据所有数据的平均数,σ代表连续型特征数据所有数据的标准差。

根据非时序特征数据获取第二特征向量,包括:

对连续型特征数据归一化处理,获取归一化处理后的连续型稠密特征向量;

将离散型特征数据添加嵌入层,获取离散型稠密特征数据;

将连续型稠密特征向量与离散型稠密特征拼接,获取稠密特征向量;

以预设的多层感知机对稠密特征向量进行特征数据优化处理,获取第二特征向量。

时序特征处理模块103用于根据时序特征数据构造出多个对应时序特征数据的时序特征向量数据,将多个时序特征向量数据降维,获取关键时序特征向量数据,以预设的长短时记忆网络模型对关键时序特征向量数据进行特征数据序列处理,获取第三特征向量。

将多个时序特征向量数据降维,获取关键时序特征向量数据,包括:

以预设的单层全连接层神经网络对多个时序向量进行降维处理,获取关键时序向量数据,其中,单层全连接层神经网络的输入层神经元数为M、输出层神经元数为N,且M>N。

预设的质量预测模型包括多层感知神经网络,多层感知神经网络的输出层神经元数目为1;

相应的,质量预测模块104用于将第一特征向量、第二特征向量和第三特征向量拼接,获取总特征向量;

根据总特征向量和多层感知神经网络,获取预测质量信息,其中,多层感知神经网络的输入层神经元数目与总特征向量的维数相同。

质量预测模块104获取预测质量信息之前,包括:

获取总特征向量样本和以总特征向量样本产生的预测质量信息样本;

以预测质量信息样本为输出量,以总特征向量样本为输入量,对初始质量预测模型进行学习获取预设的质量预测模型。

参见图8,是本发明实施例提供的一种设备的硬件结构示意图,该设备20包括:处理器21、存储器22和计算机程序;其中

存储器22,用于存储所述计算机程序,该存储器还可以是闪存(flash)。所述计算机程序例如是实现上述方法的应用程序、功能模块等。

处理器21,用于执行所述存储器存储的计算机程序,以实现上述方法中终端执行的各个步骤。具体可以参见前面方法实施例中的相关描述。

可选地,存储器22既可以是独立的,也可以跟处理器21集成在一起。

当所述存储器22是独立于处理器21之外的器件时,所述设备还可以包括:

总线23,用于连接所述存储器22和处理器21。

本发明还提供一种可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时用于实现上述的各种实施方式提供的方法。

其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如,可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。另外,该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式提供的动态人脸图像重建方法。

在上述设备的实施例中,应理解,处理器可以是中央处理单元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、专用集成电路(英文:Application Specific Integrated Circuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1