影像辨识方法及其系统与流程

文档序号：28678980发布日期：2022-01-29 00:31阅读：191来源：国知局

1.本发明关于一种辨识方法及辨识系统，特别是指一种对影像进行全新辨识方法的影像辨识方法及影像辨识系统。

背景技术：

2.在现有技术中，若要借由影像辨识以在一影像画面中抓取缺陷，或是判别所述影像画面是否为正常状态，通常是将获取的影像画面与一标准影像(goldenframe)做比对，只要二者有差异，即会判定所获取的影像为非正常状态，有可能存在缺陷或是其他异常之处。然而，在上述现有技术中可能存在误判的情形，以下将针对误判情形做说明。
3.图10为一示意图，用以说明现有技术中其中一种的画面比对误判情形。请参照图10，在现有技术中，会将从待测物中获取的影像901与所述待测物的标准影像903做比较以产生一结果影像905，在影像901中包括所述待测物的一特征92，在标准影像903中则包括所述待测物的一标准特征90。由结果影像905可知，因特征92与标准特征90相比具有一位移d’，所以最终结果会将影像901判定为非正常状态。然而，在实际的产业应用中，特征92的位移d’并不会影响到所述待测物的使用状况，包括特征92的影像901其实可视为正常状态影像，将影像901判定为非正常状态影像反而会导致判定的良率下降。
4.图11为一示意图，用以说明现有技术中其中一种的画面比对误判情形。请参照图11，类似地，在现有技术中，会将从待测物中获取的影像901与所述待测物的标准影像903做比较以产生一结果影像905，在影像901中包括所述待测物的一特征94，在标准影像903中则包括所述待测物的一标准特征90。由结果影像905可知，因特征94与标准特征90相比具有一旋转值，所以最终结果会将影像901判定为非正常状态。然而，在实际的产业应用中，特征94的旋转并不会影响到所述待测物的使用状况，包括特征94的影像901其实可视为正常状态影像，将影像901判定为非正常状态影像反而会导致判定的良率下降。
5.另一方面，在其他的现有技术中，会将所述待测物目前所知的非正常状态影像存入一数据库中，当获取的所述待测物影像与所述数据库中的非正常状态影像相符时，即可判断所述待测物的影像为非正常状态影像。然而，当所述待测物的影像数量随着时间增加时，有可能产生许多未储存在所述数据库中的非正常状态影像，导致无法判别影像是否正常，因此这样的辨别方式需要不断的更新所述数据库中的非正常状态影像类型，导致作业上非常繁琐。

技术实现要素：

6.由上述的先前技术可知，目前的影像辨识技术存在多种类的误判情形或是在作业上非常繁琐，导致许多可归类为正常状态的待测物都被判别为非正常状态，从而降低影像辨识的判别正确率并延长了作业时间。
7.所以，本发明的目的在于提供一种：包括对影像进行全新辨识方法的影像辨识方法及影像辨识系统，从而提高影像辨识的判别正确率并降低作业时间。
8.为了解决上述技术问题，本发明实施例提供一种影像辨识方法，包括以下步骤：储存至少一待测物的至少一正常状态影像；一自动编译码器接收所述至少一正常状态影像，以成为一已训练自动编译码器；借由至少一摄影装置撷取所述至少一待测物的至少一状态影像；一计算机装置接收所述至少一状态影像，所述已训练自动编译码器对所述至少一状态影像进行特征提取及重建，以产生至少一重建状态影像；以及所述计算机装置比对所述至少一状态影像及所述至少一重建状态影像，并判断所述至少一状态影像是否为正常状态影像。
9.较佳地，所述自动编译码器及所述已训练自动编译码器皆为一非对称自动编译码器，所述非对称自动编译码器的编码部分为包括多层卷积层及多层最大池化层的一卷积神经网络，所述非对称自动编译码器的解码部分为包括一全连接层及一卷积层的一转置卷积神经网络。
10.较佳地，所述至少一重建状态影像为在所述至少一状态影像中去除至少一个缺陷所产生的影像，所述计算机装置比对所述至少一状态影像及所述至少一重建状态影像，并判断所述至少一状态影像中是否包含所述至少一个缺陷。
11.较佳地，所述至少一待测物为至少一电子产品或人脸的其中之一者。
12.再者，本发明的影像辨识方法进一步包括以下步骤：当所述计算机装置判断所述至少一状态影像为非正常状态影像时，所述计算机装置控制一机械手臂将所述至少一电子产品拿取至一不良品区。
13.另一方面，本发明还提供一种影像辨识系统，包括一数据库，储存至少一待测物的至少一正常状态影像；至少一摄影装置，撷取所述至少一待测物的至少一状态影像；以及一计算机装置，电性连接至所述数据库及所述至少一摄影装置，且所述计算机装置包括一自动编译码器，所述自动编译码器接收所述至少一正常状态影像，以成为一已训练自动编译码器，所述计算机装置接收所述至少一状态影像，所述已训练自动编译码器对所述至少一状态影像进行特征提取及重建，以产生至少一重建状态影像；其中，所述计算机装置比对所述至少一状态影像及所述至少一重建状态影像，并判断所述至少一状态影像是否为正常状态影像。
14.较佳地，所述自动编译码器及所述已训练自动编译码器皆为一非对称自动编译码器，所述非对称自动编译码器的编码部分为包括多层卷积层及多层最大池化层的一卷积神经网络，所述非对称自动编译码器的解码部分为包括一全连接层及一卷积层的一转置卷积神经网络。
15.较佳地，所述至少一重建状态影像为在所述至少一状态影像中去除至少一个缺陷所产生的影像，所述计算机装置比对所述至少一状态影像及所述至少一重建状态影像，并判断所述至少一状态影像中是否包含所述至少一个缺陷。
16.较佳地，所述至少一待测物为至少一电子产品或人脸的其中之一者。
17.再者，本发明的影像辨识系统进一步包括一机械手臂，所述机械手臂电性连接至所述计算机装置，当所述计算机装置判断所述至少一状态影像为非正常状态影像时，所述计算机装置控制所述机械手臂将所述至少一电子产品拿取至一不良品区。
18.本发明的有益效果是：
19.由上述内容可知，本发明提供一种全新的影像辨识方法及其系统，在本发明中，是
借由输入待测物的正常状态影像来训练自动编译码器，如此一来，在进行影像辨识时，即使待测物的特征有些许位移或旋转等不影响待测物本身的偏差值，还可将待测物辨识为正常状态。此外，本发明会借由自动编译码器来对撷取的影像进行特征提取及重建，如此可有效判定所撷取的影像是否与正常状态影像匹配。因此，本发明可有效提高影像辨识的判别正确率并降低作业时间。
附图说明
20.本领域中具有通常知识者在参照附图阅读下方的详细说明后，可以对本发明的各种态样以及其具体的特征与优点有更良好的了解，其中，该些附图包括：
21.图1为本发明一实施例的影像辨识系统的架构示意图。
22.图2为本发明一实施例的影像辨识系统的影像比对示意图。
23.图3为本发明另一实施例的影像辨识系统的影像比对示意图。
24.图4为本发明再一实施例的影像辨识系统的影像比对示意图。
25.图5为习知技术的影像编译码的架构示意图。
26.图6为本发明一实施例的影像编译码的架构示意图。
27.图7为本发明一实施例的待测物的示意图。
28.图8为本发明一实施例的影像辨识方法的流程图。
29.图9为本发明另一实施例的影像辨识方法的流程图。
30.图10为现有技术中其中一种的画面比对误判情形的示意图。
31.图11为现有技术中其中一种的画面比对误判情形的示意图。
32.附图标记说明：
33.1-数据库；
34.20-计算机装置；
35.201-自动编译码器；
36.2011-编码部分；
37.2013-解码部分；
38.30-摄影装置；
39.301-状态影像；
40.303-重建状态影像；
41.305-结果影像；
42.40-待测物；
43.400-特征；
44.401、402、403-正常状态影像；
45.405、407-缺陷；
46.501-编码部分；
47.503-解码部分；
48.505、523-影像；
49.507、511、515、519、529-卷积层；
50.509、513-最大池化层；
51.517、521-上采样层；
52.525-特征部分；
53.527-全连接层；
54.60-显示适配器；
55.601-特征；
56.70-人脸；
57.701-特征；
58.90-标准特征；
59.92、94-特征；
60.901-影像；
61.903-标准影像；
62.905-结果影像；
63.s10-s20-步骤；
64.d、d
’-
位移。
具体实施方式
65.(第1实施例)
66.为使本发明的目的、技术方案和优点更加清楚，下面将结合附图及具体实施例对本发明进行详细描述。
67.图1为一示意图，用以说明本发明一实施例的影像辨识系统的架构。请参照图1，在本发明一实施例中，影像辨识系统包括一数据库10、一计算机装置20以及至少一摄影装置30。数据库10储存至少一待测物40的至少一正常状态影像，例如正常状态影像401-403；摄影装置30撷取待测物40的至少一状态影像；计算机装置20电性连接至数据库10及摄影装置30，且计算机装置20包括一自动编译码器201，自动编译码器201接收至少一正常状态影像，例如正常状态影像401-403，以成为一已训练自动编译码器，且计算机装置20接收摄影装置30所撷取的待测物40的所述至少一状态影像，所述已训练自动编译码器对所述至少一状态影像进行特征提取及重建，以产生至少一重建状态影像。其中，计算机装置20比对所述至少一状态影像及所述至少一重建状态影像，并判断所述至少一状态影像是否为正常状态影像。
68.值得一提的是，在自动编译码器201的训练中，是将待测物40的所有正常状态影像储存在数据库10中并输入到自动编译码器201，相较于现有技术是使用目前所知的非正常状态影像，本发明不需要因应新增的非正常状态影像而频繁地更新数据库10，且在判别过程中可大幅减少碰到许多未储存在数据库10中的正常状态影像的机率，如此可使影像辨识系统的作业效率大幅上升。
69.此外，在本发明一实施例中，摄影装置30的数量可为一个以上，以撷取待测物40不同角度的状态影像并进行影像辨识。
70.图2为一示意图，用以说明本发明一实施例的影像辨识系统的影像比对。请参照图1及图2，在本发明一实施例中，计算机装置20会接收摄影装置30从待测物40上所撷取的至少一状态影像301，所述已训练自动编译码器对至少一状态影像301进行特征提取及重建，
以产生至少一重建状态影像303。其中，状态影像301中包括特征400、缺陷405及缺陷407，当所述已训练自动编译码器接收到状态影像301后，所述已训练自动编译码器会比对状态影像301中的特征400是否与正常状态影像匹配，且仅将符合正常状态影像的特征400提取出并重建为重建状态影像303。
71.最后，计算机装置20会比对状态影像301及重建状态影像303并产生一结果影像305，以判断状态影像301是否为正常状态影像。详细而言，在图2中，当状态影像301与重建状态影像303进行比对后，在结果影像305中会去除掉正常状态的特征400并留下缺陷405及缺陷407，因此，计算机装置20即会判定状态影像301因含有缺陷405及缺陷407而为非正常状态影像。
72.(第2实施例)
73.图3为一示意图，用以说明本发明另一实施例的影像辨识系统的影像比对。请参照图1及图3，在本发明另一实施例中，类似地，状态影像301中包括特征400，且特征400与正常的位置相比具有一位移d，但应了解的是，具有位移d的特征400并不会对待测物40造成影响，因此可视为正常状态。再者，当所述已训练自动编译码器接收到状态影像301后，所述已训练自动编译码器会比对状态影像301中的特征400是否与正常状态影像匹配，且仅将符合正常状态影像的特征400提取出并重建为重建状态影像303。
74.其中，因为所述已训练自动编译码器在训练过程中已接收到具有位移d的特征400可为正常状态影像的信息，所以重建状态影像303中会包括特征400。最后，计算机装置20会比对状态影像301及重建状态影像303并产生一结果影像305，而在结果影像305中并未包含其他特征，因此即会判定状态影像301为正常状态影像。
75.(第3实施例)
76.图4为一示意图，用以说明本发明再一实施例的影像辨识系统的影像比对。请参照图1及图4，在本发明再一实施例中，类似地，状态影像301中包括特征400，且所述特征400与正常的位置相比具有一旋转值，但应了解的是，具有旋转值的特征400并不会对待测物40造成影响，因此可视为正常状态。再者，当所述已训练自动编译码器接收到状态影像301后，所述已训练自动编译码器会比对状态影像301中的特征400是否与正常状态影像匹配，且仅将符合正常状态影像的特征400提取出并重建为重建状态影像303。
77.其中，因为所述已训练自动编译码器在训练过程中已接收到具有旋转值的特征400可为正常状态影像的信息，所以重建状态影像303中会包括特征400。最后，计算机装置20会比对状态影像301及重建状态影像303并产生一结果影像305，而在结果影像305中并未包含其他特征，因此即会判定状态影像301为正常状态影像。
78.图5为一示意图，用以说明现有技术的影像编译码的架构。请参照图5，在现有技术中，影像编译码器通常为一对称型编译码器，举例而言，当影像505输入至对称型编译码器的编码部分501后，通常会经过卷积层(convolution layer)507、最大池化层(max-pooling layer)509、卷积层511及最大池化层513，以提取出影像505的特征部分，之后特征部分会再进入对称型编译码器的解码部分503，并经过卷积层515、上采样层(up-sampling layer)517、卷积层519及上采样层521，以产生译码后的影像523。
79.然而，在上述的现有编解码技术中，会导致编解码的过程过于繁琐，导致处理时间变长，且影像有可能因为经过过于繁琐的编译码过程而失真。
80.图6为一示意图，用以说明本发明一实施例的影像编译码的架构。请参照图1及图6，在本发明的实施例中，自动编译码器201及已训练自动编译码器皆为一非对称自动编译码器，所述非对称自动编译码器的编码部分为包括多层卷积层及多层最大池化层的一卷积神经网络，所述非对称自动编译码器的解码部分为包括一全连接层及一卷积层的一转置卷积神经网络。举例而言，当影像505输入至非对称编译码器的编码部分2011后，会经过卷积层(convolution layer)507、最大池化层(max-pooling layer)509、卷积层511及最大池化层513，以提取出影像505的特征部分525，之后特征部分525会再进入非对称编译码器的解码部分2013，并经过全连接层(fully-connected layer)527及卷积层529，以产生译码后的影像523。
81.值得一提的是，在本发明中采用非对称编译码器具有以下优点：在解码部分包括用于全局重新构建的全连接层，并将全连阶层与卷积层连接，以借由卷积层来优化讯息，如此不仅可以确保影像重建后的准确度，还可降低编解码的处理时间。
82.图7为一示意图，用以说明本发明一实施例的待测物。请参照图1及图7，在本发明一实施例中，至少一待测物40可为至少一电子产品或人脸的其中之一者。详细而言，电子产品例如为pcb、显示适配器、主板等，以显示适配器60为例，显示适配器60上包括一特征601及多风扇，本发明即可判定特征601是否正常或是显示适配器60上是否包括任何缺陷，或是风扇上是否为正常状态，例如是否包括刮痕，其中，特征601例如为产品认证贴纸或商品logo等，且产品认证贴纸或商品logo于辨识时稍微位移或旋转亦可将其辨识为正常状态。此外，亦可借由本发明来自动辨识pcb上的焊接处是否包括刮伤、清印或虚焊，或自动辨识主板上是否包括任何缺陷。因此，本发明可应用于电子产业的自动生产线中。
83.再者，待测物40可为一人脸70，以借由本发明来自动辨识人脸上的特征701是否符合正常状态，且人脸于辨识时若稍微歪斜还可将其辨识为正常状态。因此，本发明还可应用于门禁管理产业中。
84.(第4实施例)
85.另一方面，请再参照图1，在本发明其他实施例中，当待测物40为电子产品时，影像辨识系统可进一步包括一机械手臂(未于图中示出)，所述机械手臂电性连接至计算机装置20，当计算机装置20判断撷取到的待测物40的状态影像为非正常状态影像时，计算机装置20会控制所述机械手臂将所述至少一电子产品拿取至一不良品区，以达成产线自动化的目的。
86.(第5实施例)
87.再者，本发明还提供一种影像辨识方法。图8为一流程图，用以说明本发明一实施例的影像辨识方法。请参照图1至图6及图8，本发明一实施例的影像辨识方法包括步骤s10-s18，步骤s10为：储存至少一待测物40的至少一正常状态影像，例如可于一数据库10中储存正常状态影像401-403；步骤s12为：一自动编译码器201接收所述至少一正常状态影像，以成为一已训练自动编译码器；步骤s14为：借由至少一摄影装置30撷取所述至少一待测物40的至少一状态影像301；步骤s16为：一计算机装置20接收所述至少一状态影像301，所述已训练自动编译码器对所述至少一状态影像301进行特征提取及重建，以产生至少一重建状态影像303；以及步骤s18为：计算机装置20比对所述至少一状态影像301及所述至少一重建状态影像303，并判断所述至少一状态影像301是否为正常状态影像。其中，至少一待测物40
可为至少一电子产品或人脸的其中之一者。
88.类似地，在本发明影像辨识方法的一实施例中，计算机装置20会比对状态影像301及重建状态影像303并产生一结果影像305，以判断状态影像301是否为正常状态影像。详细而言，在图2中，当状态影像301与重建状态影像303进行比对后，在结果影像305中会去除掉正常状态的特征400并留下缺陷405及缺陷407，因此，计算机装置20即会判定状态影像301因含有缺陷405及缺陷407而为非正常状态影像。
89.再者，在本发明影像辨识方法的一实施例中，自动编译码器201及已训练自动编译码器皆为一非对称自动编译码器，所述非对称自动编译码器的编码部分为包括多层卷积层及多层最大池化层的一卷积神经网络，所述非对称自动编译码器的解码部分为包括一全连接层及一卷积层的一转置卷积神经网络。举例而言，当影像505输入至非对称编译码器的编码部分2011后，会经过卷积层(convolution layer)507、最大池化层(max-pooling layer)509、卷积层511及最大池化层513，以提取出影像505的特征部分525，之后特征部分525会再进入非对称编译码器的解码部分2013，并经过全连接层(fully-connected layer)527及卷积层529，以产生译码后的影像523。
90.(第6实施例)
91.图9为一流程图，用以说明本发明另一实施例的影像辨识方法。请参照图1至图4及图9，在本发明影像辨识方法的另一实施例中，当至少一待测物40为至少一电子产品时，影像辨识方法进一步包括步骤s20，步骤s20为：当计算机装置20判断所述至少一状态影像301为非正常状态影像时，计算机装置20控制一机械手臂将所述至少一电子产品拿取至一不良品区。
92.本发明在产业上的可利用性：
93.由本发明的上述内容可知，本发明提供一种全新的影像辨识方法及其系统，在本发明中，是借由输入待测物的正常状态影像来训练自动编译码器，如此一来，在进行影像辨识时，即使待测物的特征有些许位移或旋转等不影响待测物本身的偏差值，还可将待测物辨识为正常状态。因此，本发明可应用于需要进行影像辨识的产业，例如应用于电子产业中的电子产品的辨识、门禁管理产业的人脸辨识等。
94.以上所述的是本发明的优选实施方式，应当指出对于本技术领域的普通人员来说，在不脱离本发明所述的原理前提下还可以作出若干改进和润饰，这些改进和润饰也在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：黄文吉;陈建华;陈纬仁;裴德雄;贾博渊
技术所有人：撼讯科技股份有限公司
我是此专利的发明人

上一篇：一种故障定位系统、方法及计算装置与流程
上一篇：网络设备配置方法、装置、电子设备及可读存储介质与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。