一种基于信道编码的人工智能集装箱识别系统的制作方法

文档序号:27255816发布日期:2021-11-05 19:26阅读:278来源:国知局
一种基于信道编码的人工智能集装箱识别系统的制作方法

1.本发明涉及基于深度学习的计算机视觉领域,以及信道编码领域,特别是一种基于信道编码的人工智能集装箱识别系统。


背景技术:

2.在计算机视觉领域,文本识别是一项很重要的任务。生活中文本无处不在,在智能化水平快速发展的今天,如何让计算机自动进行文本识别任务是一项很重要的考验。一旦达到人工乃至超越人工的水平,就能节约很多人力物力财力,那么将大大推动ai世界的进程,实现人工智能化。ocr(光学字符识别)技术旨在研究将输入的扫描文档图像等信息进行分析处理,识别出文档或者图像中的文字信息,所用之技术是基于基础图像处理方法,利用灰度化,二值化等技术提取关键文本区域,使用像素匹配法等进行文本识别。在白字黑字的条件下,一份字迹工整,字体单一,背景简单的文本几乎已经达到了人工识别的程度,甚至超过人工水平。但在自然场景下,如我们所需要应用的港口场景下,由于背景的复杂性,文本字体尺度颜色的多样性等因素,传统ocr技术并不适用,于是在ocr之下,引申出str(scene text recognition)技术,目前优秀的str技术都是基于深度学习进行的。str技术又分为两种方式,一种是文本检测加文本识别,这是一个two

stage的过程。另一种方式则为end

to

end,这是一个one

stage的过程,它将文本检测任务和文本识别任务并行处理。2020年eccv会议上提出的最先进的str技术,,应用在我们港口集装箱的场景下,单字符的识别准确率能够达到95%水平,集装箱识别准确率达到86.5%。但是,还是难以达到95%以上的人工水准。出现错误识别问题,识别出错无法校验问题,无法自动改正问题。


技术实现要素:

3.有鉴于此,本发明的目的是提供一种基于信道编码的人工智能集装箱识别系统,有效提升港口集装箱吞吐查验效率,减少人工和时间成本。
4.本发明采用以下方案实现:一种基于信道编码的人工智能集装箱识别系统,其特征在于:包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别。
5.进一步地,所述新型集装箱生成单元编码生成新型集装箱号所使用的编码方式为信道编码rs编码技术,新型集装箱号编码过程包括以下步骤:
6.步骤s1:定义初始参量,计算信息码符多项式m(x);
7.定义初始输入信息位有效字符m(x),则生成信息码符多项式m(x)=m
n
x
n
+m
n+1
x
n+1
+...m
n+9
x
n+9

8.步骤s2:定义rs校验码个数,计算rs校验码生成多项式g(x);
9.定义rs校验码个数为n,n为正整数,rs校验码生成多项式为
其中k0是偏移量;
10.步骤s3:用rs校验码生成多项式g(x)除信息码符多项式m(x)得到余式r(x);
11.余式r(x)=m0+m1x+...m
n
‑1x
n
‑1;
12.步骤s4:联合信息码符多项式m(x)和余式r(x)的系数得到最终rs码即新型集装箱号;
13.最终生成rs码字的多项式表达式为c(x)=m(x)+r(x);新型集装箱号码字序列为c(x)=m
10+n
‑1,m
10+n
‑2,m
10+n
‑3,...m0;将其从6位二进制码转为正常符号加数字的形式,生成最终新型集装箱号,号码长度为10+n。
14.进一步地,所述智能识别单元包括端到端ai识别器与rs译码检纠错器;所述ai识别器对包含使用新型集装箱号的集装箱实际场景图进行str识别,得出与箱号序列相同的识别序列;之后所述rs译码检纠错器进行rs译码检纠错操作;利用rs译码检纠错器中的syndrome进行校验,判断进行str识别生成的序列号是否出错,全部正确则通过去除rs校验码,自动输出ai识别信息位结果;若校验识别出错,将进行错误定位,找到识别出错的位置,进入rs译码检纠错器中的rs译码纠错器进行错误纠正,rs译码纠错器包括rs译码定位错误字符、译码纠错与输出修复结果;纠正之后去除rs校验码,输出正确的十位集装箱号信息位。
15.进一步地,所述ai识别器识别集装箱实际场景图得出与箱号序列相同的识别序列,所述ai识别器中包括str检测器与str识别器;采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法或文本检测算法进行微调训练,得到集装箱号检测器即str检测器;采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用单字符识别算法或多字符识别算法进行微调训练,得到集装箱号识别器即str识别器;
16.具体步骤如下:
17.步骤1:输入带有新型号码的港口集装箱图片或视频;
18.步骤2:进入str检测器,检测出新型集装箱号区域;
19.步骤3:将新型集装箱号区域送入str识别器进行字符串识别;
20.步骤4:输出str结果。
21.进一步地,利用rs译码检纠错器中的syndrome进行校验的具体内容为:校正子syndrome是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员;r(x)是通过ai识别之后的集装箱号转换到伽罗华域的rs码多项式,结构特征为syndrome由n个符号组成,计算公式为如果r(x)中任何一个都是有效的,那么每个syndrome都为0;若是出现非零syndrome,那么说明校验的rs码出错。
22.进一步地,所述rs译码纠错具体包括以下内容:
23.出现t个错误就需要求解2t个值来进行错误定位和错误值确定;使用里德

所罗门解码算法,解出2t个联立方程组得到错误位置和错误值表示为其中e
i
为错误值,j为错误位置;错误纠正将r(x)还原为真实值u(x),运算公式为u(x)
为正确码字;根据公式还原出正确码字后,再通过域转换,将伽罗华域的rs码多项式还原为实际输出集装箱信息位。
24.进一步地,所述目标检测算法能够选择包括但不限于r

cnn、fast r

cnn、mask r

cnn、yolo检测系列或ssd算法。
25.进一步地,所述文本检测算法能够选择包括但不限于ctpn、seglink、pixellink、mcn、textsnake、craft、pan或east算法。
26.进一步地,所述单字符识别算法能够选择包括但不限于像素匹配法或手写字符识别算法。
27.进一步地,所述多字符识别算法能够选择包括但不限于crnn+ctc、crnn+attention或transformer算法。
28.与现有技术相比,本发明具有以下有益效果:
29.(1)本发明利用信道编码rs码技术,建立新型集装箱号编码规则,有更好的应用价值与应用前景。
30.(2)本发明建立一套完整的集装箱号智能识别系统,有效提升港口集装箱吞吐查验效率,减少人工和时间成本。
31.(3)本发明将信道编码技术融合进基于深度学习的计算机视觉领域,极大克服了目前智能识别出现错检的不足,达到智能识别率99%以上,推进港口智能化进程。
附图说明
32.图1为本发明实施例十四位为例的流程框图。
33.图2为本发明实施例的十四位为例原始集装箱号与利用本发明新型编码规则生成的新型集装箱号对比图。
34.图3为本发明实施例的十四位为例利用新型编码规则建立集装箱号的实例流程图。
具体实施方式
35.下面结合附图及实施例对本发明做进一步说明。
36.应该指出,以下详细说明都是例示性的,旨在对本技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
37.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
38.如图1所示,本实施例提供一种基于信道编码的人工智能集装箱识别系统,其特征在于:包括新型集装箱号生成单元和智能识别单元;所述新型集装箱号生成单元和所述智能识别单元通信相连,用以将所述新型集装箱号生成单元编码生成的新型集装箱号通过所述智能识别单元进行识别,完成人工智能集装箱的识别。
39.在本实施例中,所述新型集装箱生成单元编码生成新型集装箱号所使用的编码方式为信道编码rs编码技术,新型集装箱号编码过程包括以下步骤:
40.步骤s1:定义初始参量,计算信息码符多项式m(x);
41.定义初始输入信息位有效字符m(x),则生成信息码符多项式m(x)=m
n
x
n
+m
n+1
x
n+1
+...m
n+9
x
n+9

42.步骤s2:定义rs校验码个数,计算rs校验码生成多项式g(x);
43.定义rs校验码个数为n,n为正整数,rs校验码生成多项式为其中k0是偏移量;
44.步骤s3:用rs校验码生成多项式g(x)除信息码符多项式m(x)得到余式r(x);
45.余式r(x)=m0+m1x+...m
n
‑1x
n
‑1;
46.步骤s4:联合信息码符多项式m(x)和余式r(x)的系数得到最终rs码即新型集装箱号;
47.最终生成rs码字的多项式表达式为c(x)=m(x)+r(x);新型集装箱号码字序列为c(x)=m
10+n
‑1,m
10+n
‑2,m
10+n
‑3,...m0;将其从6位二进制码转为正常符号加数字的形式,生成最终新型集装箱号,为10+rs校验码个数。
48.在本实施例中,所述智能识别单元包括端到端ai识别器与rs译码检纠错器;所述ai识别器对包含使用新型集装箱号的集装箱实际场景图进行str识别,首先进行集装箱号区域检测,后将号码区域进行识别,得出与箱号序列相同的识别序列;之后所述rs译码检纠错器进行rs译码检纠错操作;利用rs译码检纠错器中的syndrome进行校验,判断进行str识别生成的序列号是否出错,全部正确则通过去除rs校验码,自动输出ai识别信息位结果;若校验识别出错,将进行错误定位,找到识别出错的位置,进入rs译码检纠错器中的rs译码纠错器进行错误纠正,rs译码纠错器包括rs译码定位错误字符、译码纠错与输出修复结果;纠正之后去除rs校验码,输出正确的十位集装箱号信息位。
49.在本实施例中,所述ai识别器识别集装箱实际场景图得出与箱号序列相同的识别序列,ai识别器包括str检测器和str识别器两个部分;
50.采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法(r

cnn,fast r

cnn,mask r

cnn,yolo检测系列,ssd等)或文本检测算法(ctpn,seglink,pixellink,mcn,textsnake,craft,pan,east等)进行微调训练,得到集装箱号检测器即str检测器;采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用单字符识别算法(像素匹配法,手写字符识别算法等)或多字符识别算法(crnn+ctc,crnn+attention,transformer等)进行微调训练,得到集装箱号识别器即str识别器;
51.具体步骤如下:
52.步骤1:输入带有新型号码的港口集装箱图片或视频;
53.步骤2:进入str检测器,检测出新型集装箱号区域;
54.步骤3:将新型集装箱号区域送入str识别器进行字符串识别;
55.步骤4:输出str结果。
56.在本实施例中,利用rs译码检纠错器中的syndrome进行校验的具体内容为:校正子syndrome是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员;r(x)是通过ai识别
之后的集装箱号转换到伽罗华域的rs码多项式,结构特征为syndrome由n个符号组成,计算公式为如果r(x)中任何一个都是有效的,那么每个syndrome都为0;若是出现非零syndrome,那么说明校验的rs码出错。
57.在本实施例中,所述rs译码纠错具体包括以下内容:
58.出现t个错误就需要求解2t个值来进行错误定位和错误值确定;使用里德

所罗门解码算法,解出2t个联立方程组得到错误位置和错误值表示为其中e
i
为错误值,j为错误位置;错误纠正将r(x)还原为真实值u(x),运算公式为u(x)为正确码字;根据公式还原出正确码字后,再通过域转换,将伽罗华域的rs码多项式还原为实际输出集装箱信息位。
59.在本实施例中,所述目标检测算法能够选择包括但不限于r

cnn、fastr

cnn、mask r

cnn、yolo检测系列或ssd算法。
60.在本实施例中,所述文本检测算法能够选择包括但不限于ctpn、seglink、pixellink、mcn、textsnake、craft、pan或east算法。
61.在本实施例中,所述单字符识别算法能够选择包括但不限于像素匹配法或手写字符识别算法。
62.在本实施例中,所述多字符识别算法能够选择包括但不限于crnn+ctc、crnn+attention或transformer算法。
63.较佳的,在本实施例中,ai识别器包括str检测器和str识别器两个部分;str检测器:目前在文本定位的算法上可以使用yolo,craft,db等方法。我们对算法的使用不受限制。针对集装箱号的泛化性,我们需要对集装箱数据集进行微调训练,具体步骤为:采集集装箱图片或视频数据,标注位置监督标签,使用目标检测算法或文本检测算法进行微调训练,得到集装箱号检测器即str检测器。str识别器:目前在文本识别的算法上可以使用传统像素匹配法,使用深度学习下单字符识别算法(手写字符识别算法等),多字符识别算法(crnn+ctc,crnn+attention等)。我们对算法的使用不受限制。针对集装箱号的泛化性,我们需要对集装箱数据集进行微调训练,具体步骤为:采集集装箱图片或视频数据,裁剪集装箱号区域,标注语义监督标签,使用上述算法进行微调训练,得到集装箱号识别器即str识别器。
64.较佳的,在本实施例中,当前港口使用的集装箱号编码规则是由十位集装箱号加一位校验位构成,校验位提供判断前十位信息位是否正确的功能。在现阶段的智慧港口建设中,集装箱箱号识别与验证是很关键的一环。为了提升识别率,本发明通过利用rs信道编码,将前十位集装箱号信息位根据rs编码规则进行编码得出rs校验码。最终生成的集装箱号为十位集装箱信息位加rs校验码。rs编码可以提供校验功能校验前十位真实信息位是否出错,并且它能够提供错误纠正功能。编码后的集装箱号码序列在ai识别之后,识别后的号码可以再由rs码译码检错器判断出错和错误定位,最后通过rs译码纠错器,纠正错误信息。这可以极大提升整体的集装箱号码识别率助力智慧港口建设。
65.较佳的,本实施例结合信道编码的rs系统码技术,对初始集装箱号十位信息位进行rs编码,得到编码后的码字。该码字包含初始的十位信息位和rs校验位。将该码字作为集装箱号码序列,作为后期的ai识别系统输入。
66.原始集装箱号由三部分组成。第一部分为四位英文字母,前三位代表箱主,经营人,第四位代码说明集装箱类型;第二部分由六位数字组成,是箱体的注册码,此为集装箱箱体的唯一标识;第三部分为校验码,是由第一部分和第二部分经过原始校验规则运算得到的,用于校验是否发生错误。在发明专利里,通过我们的编码规则实现的新型序列也是一个由三部分构成的号码,前两个部分不变,将第三部分换成rs校验码,整体称为rs码。号码对比图如图2所示。
67.具体包括以下步骤:
68.步骤s1:编码生成新型集装箱号
69.步骤s2:ai识别系统
70.集装箱信息位为十位有效字符转为m位二进制码m(x)=m
2t+9
,m
2t+8
,...m
2t
。对其进行rs编码生成rs(n,k)码。其中n为整体rs码长,k为信息位长度,使用的rs码为rs缩短码,系统码rs(n1,k1)为其母码,其中n1=2
m

1,k1

k=n1

n。n,k要遵循0<k<n<2
m
+2,m为符号大小,如m=8则表示符号由8位二进制组成。l=n

k=2t为校验码的符号数,t为之后能够在rs译码中进行纠错的数目。整个编码过程建立在伽罗华域gf(2
m
)上进行,多项式计算遵循mod2运算。针对集装箱号情况以及目前ai最佳识别率88.5%,我们取n=14,k=10,m=6。即缩短rs(14,10)码,建立在伽罗华域gf(64)上,包括36种(数字0

9,以及字母a

z)集装箱有效信息位。
71.生成新型集装箱号过程如图3所示(图中表明输出新型号码替换区域)。新型集装箱号编码过程包括以下步骤:
72.步骤s11:定义初始参量,计算信息码符多项式m(x)。
73.定义初始输入信息位有效字符m(x),则生成信息码符多项式m(x)=m4x4+m5x5+...m
13
x
13

74.步骤s12:定义rs校验码个数,计算rs校验码生成多项式g(x)。
75.定义rs校验码个数为4,rs校验码生成多项式为其中k0是偏移量,通常取k0=0或k0=1,这里取0。
76.步骤s13:用rs校验码生成多项式g(x)除信息码符多项式m(x)得到余式r(x)。
77.用rs校验码生成多项式g(x)除信息码符多项式m(x),得到余式r(x)=m0+m1x+...m3x3。
78.步骤s14:联合信息码符多项式m(x)和余式r(x)的系数得到最终rs码即新型集装箱号。
79.最终生成rs码字的多项式表达式为c(x)=m(x)+r(x)。我们14位新型集装箱号码字序列为c(x)=m
13
,m
12
,m
11
,...m0。将其从6位二进制码转为正常符号加数字的形式,生成我们最终的14位新型集装箱号。
80.ai识别系统运行流程图如图1所示,可分为两个操作:
81.(1)str识别操作。
82.(2)rs译码检纠错操作。
83.具体实施包括以下步骤:
84.步骤s21:str识别模块四个阶段操作。
85.阶段一:输入带有新型号码的港口集装箱,可以是图片,视频。
86.阶段二:进入str检测器,检测出新型集装箱号区域。
87.阶段三:将新型集装箱号区域送入str识别器进行字符串识别。
88.阶段四:输出str结果,为(14)位字符串。
89.步骤s22:rs译码检纠错模块两个阶段操作。
90.阶段一:rs译码检错验证。计算校正子syndrome,验证识别字符串是否出错。
91.校正子是对r(x)执行奇偶校验的结果,确定r(x)是否为有效成员。这里的r(x)是通过ai识别之后的集装箱号转换到伽罗华域的rs码多项式,结构特征为syndrome由4个符号组成,计算公式为如果r(x)中任何一个都是有效的,那么每个syndrome都为0。若是出现非零syndrome,那么说明校验的rs码出错。
92.阶段二:rs译码纠错。包括了错误定位,错误纠正两个部分。出现t个错误就需要求解2t个值来进行错误定位和错误值确定。使用里德

所罗门解码算法,可以解出2t个联立方程组得到错误位置和错误值表示为其中e
i
为错误值,j为错误位置。错误纠正只需要将r(x)还原为真实值u(x)。运算公式为还原出正确码字,再通过域转换。将伽罗华域的rs码多项式还原为实际输出集装箱信息位。
93.在集装箱号码的智能检错场景,利用此编码方式,人工校验工作十分便捷,只需进行简单的rs译码检错操作就能够实现校验。在ai识别场景下,rs校验码不仅可以完成校验工作,并且它能够提供定位错误,纠正ai识别错误的功能。等价于在通信系统中,传输信息的出错率为5%,在这种场景,通过rs(14,10)译码可将误码率降至10
‑3。同样,目前应用在集装箱号识别的ai识别算法的字符识别率95%,误识别率为5%,采用rs码译码后也可将字符误识别率降至10
‑3,也就是将整体号码的识别率提升到95%以上,极大提升集装箱号码识别效果。
94.以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1