本发明涉及印前修正领域,尤其涉及一种基于机器学习降低印前版面处理错误率的方法。
背景技术:
印刷质量是印刷行业追求的目标,需要印前质量作保障,从生产管理的角度来看,印前质量的好坏不仅影响印品的质量,而且影响到印刷周期和成本的控制,指导着印前,印刷和印后的各个环节。影响印刷质量的因素有很多,但如果在印前制版过程中就出现了问题,那么即使所有的印刷材料再好,印刷机的质量再高,装订再精美也不可能生产出合格的印刷品。如果印前制版过程中的某个环节出现问题,就可能给后面的工序造成很大的损失。虽然目前在印前领域提出了多种多角度设计方案,但对于印前文件修正的研究仍普遍存在以下问题。
第一、目前大多数印前软件都是对印前版面进行检测,对于尺寸,出血,补模等提供了一些检测方案,对于印前版面的修改很少存在一些高效的修正方案,普遍存在的问题是文件修改后无法判定是否为符合要求的修正,导致修正后的版面还存在一定的错误,并且这种问题是通过人工检测很难发现的。
第二、对于印前版面的修正,目前存在很多中方案,但想得到符合预期的修正结果却不容易,目前存在的版面校验方案过度依赖对处理前后版面的图像化对比,并且在此过程中需要人眼去比对版面修改是否符合预期,这种方式带有很强的主观因素,并且处理速度缓慢低效,很难降低版面修正的错误率。
技术实现要素:
本发明提供了一种基于机器学习降低印前版面处理错误率的方法,为解决目前印前版面处理错误无法及时发现,版面校验过度依赖人工检测,传统图像对比耗费时间长,非图像参数错误无法校验等问题,详见下文描述。
一种基于机器学习降低印前版面处理错误率的方法,所述方法包括以下步骤:
提取印前版面处理前以及处理后的矢量路径数、版面尺寸、版面图层层数、版面的色彩空间;将矢量路径数、尺寸、组成图层数、色彩空间组成特征矩阵;
将所有版面的特征矩阵构成的特征集合按比例划分为训练集和测试集,选取校验模型的核函数;
设置定时任务,定期完成上述两个步骤,获得新的校验模型,比较新的校验模型与旧校验模型分类正确率,选取检错率更高的模型导入生产分类中,对处理过的印前版面结果进行矫正。
其中,所述校验模型的核函数为高斯核函数;将特征集合代入校验模型中训练得到用于降低版面错误率的校验模型,然后将校验模型封装,输入参数为版面处理前后的矢量路径数,尺寸,组成图层数,色彩空间的集合;输出结果为处理后的版面中出现处理错误的版面。
进一步地,所述校验模型具体为:
其中,xt为特征参数矩阵,yt为标签列向量,wt为系数矩阵,bt为常数列向量。
本发明取得的有益效果如下:1、有效的降低了印前版面处理的错误率、及印前版面错误印刷率;
2、解决了依靠肉眼无法有效识别版面细节错误的问题,可以校验肉眼无法感知的参数错误;
3、本发明实现了版面校验的自动化,可以批量对版面进行校验,提高了印刷行业的生产效率。
附图说明
图1为一种基于机器学习降低印前版面处理错误率的方法的流程图;
图2为处理后的印前版面正确处理与错误处理的分类示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步的详细描述。
实施例1
为了解决目前印前版面处理错误无法及时发现,版面校验过度依赖人工检测,传统图像对比耗费时间长,非图像参数错误无法校验等问题,以降低印前版面处理的错误率,本发明实施例提供了一种基于机器学习降低印前版面处理错误率的方法,参见图1,该方法包括以下步骤:
101:首先提取印前版面处理前以及处理后的矢量路径数,版面尺寸,版面图层层数,版面的色彩空间,将版面处理前后的矢量路径数,尺寸,组成图层数,色彩空间组成特征矩阵;
102:将所有版面的特征矩阵构成的特征集合按8:2比例划分为训练集和测试集,选取校验模型的核函数;
其中,本发明实施例选取的校验模型为高斯核函数,将数据集代入校验模型中训练得到用于降低版面错误率的校验模型,取得校验模型后,将校验模型封装,对外的输入参数为版面处理前后的矢量路径数,尺寸,组成图层数,色彩空间的集合,输出结果为处理后的版面中出现处理错误的版面。
103:设置定时任务,定期完成上述101,102步骤,获得新的校验模型,比较新的校验模型与旧校验模型分类正确率,选取其中检错率更高的模型(检错率更高总体错误率更低)导入实际生产分类中,对实际处理过的印前版面结果进行矫正,即可降低印前版面处理的错误率。
实施例2
下面结合具体的计算公式、图1对实施例1中的方案进行进一步地介绍,详见下文描述:
通过读取文件流的方式获取所有印前版面处理前以及处理后的矢量路径数,版面尺寸,版面图层层数,版面的色彩空间,多个版面特征构成特征矩阵。将特征矩阵按8:2分为训练数据和测试数据,生成的特征标签矩阵,矩阵分为两部分训练集与测试集,xt表示训练集特征值,xv表示测试集特征值,yt表示训练集标签,yv表示测试集标签。
1)提取印前版面处理前以及处理后的矢量路径数,版面尺寸,版面图层层数,版面的色彩空间,将版面处理前后的矢量路径数,尺寸,组成图层数,色彩空间成特征矩阵,矩阵公式如下:
矩阵每一行的具体数据为:
上述特征的选取依据cfs特征估计进行选取,选取方程为:
merit为包含k个特征的特征子集s的性能指标,rcf为特征-类平均相关性,rff为特征-特征平均相关性。
下表为特征子集s的性能指标(小数点后保留两位):
注:处理前的矢量路径数(1),版面尺寸(2),版面图层层数(3),版面的色彩空间(4),处理后的矢量路径数(5),版面尺寸(6),版面图层层数(7),版面的色彩空间(8),版面出血值(9)
由上表可得本设计方法中的特征选取效果更好,选取的特征为处理前的矢量路径数(1),版面尺寸(2),版面图层层数(3),版面的色彩空间(4),处理后的矢量路径数(5),版面尺寸(6),版面图层层数(7),版面的色彩空间(8)。
2)设置校验模型方程组,结合训练矩阵(1中矩阵)的特征,构造校验模型方程,求解模型的目的就是求解模型中的未知量,其中校验模型的未知量为系数矩阵设为wt,常数列向量设为bt。
将xt构成特征参数矩阵xt,将标签列yt构成标签列向量yt,系数矩阵设为wt(此为所求模型,
合并模型方程:
3)校验模型的求解过程,此部分为简化校验模型,并求解校验模型中的未知参数,公式的推导与计算,最终获得的模型所需的未知参数,校验模型求解完成。
其中(wt,bt)为模型所求参数,模型中向量间的欧氏距离定义为:margin(wt,bt,xt)
margin(wt,bt,xt)=min(distance(wt,bt,xt))(5)
其中,distance(wt,bt,xt)为向量到分界面的距离,如图2所示,距离计算公式为:
得到最大的间隔max(margin(wt,bt,xt)):
wt为系数,与变量计算无关,提取无关项:
模型方程组为:
对于
为计算上述约束方程组,引入拉格朗日乘子法,其中λ为拉格朗日系数原式变为:
由强对偶原则可使原方程组更新为:
4)求解得到校验模型所求的未知参数,将得到的系数矩阵wt,常数列向量bt,代入到校验模型中最后得到校验模型。
解得上述方程组:
则所得校验模型为:
实施例3
下面结合具体的运算模型、图1对实施例2中的公式进行进一步地验证,详见下文描述:
本例中选取500个样本印前版面进行实验,其中400个印前版面用于训练模型,100个印前版面用于测试本设计算法有效性,实验结果以二维图示呈现,结果图1如下:
上中下三条线依次为修改错误版面样本切线,分类的超平面,修改正确版面样本切线。由上下两切线为界,上切线以上为处理错误6个样本点,对应修改错误的版面,下切线以下为处理正确的94个样本点,对应修改正确的版面。对版面进行验证,上切线以上的6个样本版面均存在处理错误情况,下切线以下的94个样本版面中还存在2个错误样本点未检出。
添加定时巡检任务,定时巡检的步骤具体包括:
周期提取当前所处理一批次印前版面的训练数据,清洗无效数据
周期训练印前版面校验模型
周期验证对比新模型与旧模型的检错率
周期更新性能更好的校验模型用于生产
定时巡检任务的增加,保证了每一批版面的分类都会匹配到最适合的模型,实现原理如下:计算新模型测试结果的错误率,与老模型的测试结果进行比对,若错误率高于老模型,则沿用老版本的模型,若错误率低于老模型则更新模型。
综上所述,本设计从100个处理过的版面中筛选出了6个确认错误的版面,将印刷错误率由8%降低到了2%,降低了版面印刷错误率,提高了生产效率。
本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。