图像识别方法、装置以及电子设备与流程

文档序号:24725620发布日期:2021-04-16 15:57阅读:110来源:国知局
图像识别方法、装置以及电子设备与流程

1.本申请涉及图像识别技术领域,尤其是涉及一种图像识别方法、装置以及电子设备。


背景技术:

2.目前,对文本图像进行识别时,主要适用于一些具有特定段落规则、字迹清晰的文本图像,例如,文本图像的排版是简易的一页两列,在这两列中,分别是由规则的块状区域组成的,所以识别时,会比较准确的识别到排版区域,并识别到排版区域中的内容,所以识别的准确性较高,基本上在95%以上。
3.但是,在档案行业对传统纸质存量档案的数字化加工过程中,往往存在许多复杂的识别场景,例如表格识别、手写体识别、油印印刷体识别、竖排文字识别、页面残缺、透页缺补等,如果仍然使用现有的ocr识别技术,其准确性将会下降至80%左右,所以,现有的识别技术会极大地降低识别的准确率。


技术实现要素:

4.本申请的目的在于提供一种图像识别方法、装置以及电子设备,以缓解图像识别准确率较低的技术问题。
5.第一方面,本申请实施例提供了一种图像识别方法,所述方法包括:
6.利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;
7.从多个预设文本类型中确定所述目标图像区域对应的目标预设文本类型;
8.从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本。
9.在一个可能的实现中,在所述利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤之后,还包括:
10.利用预设聚类算法对所述目标图像区域进行聚类,得到多个不同类别的第一图像区域集合;
11.针对每个所述第一图像区域集合,分别确定预设个数的第一质心;
12.计算每个所述第一质心分别与所述第一图像区域集合内目标图像区域之间的距离,得到目标图像区域与目标第一质心之间的最小距离,所述目标第一质心对应一种预设文本类型;
13.将所述目标第一质心对应的所述预设文本类型确定为所述目标图像区域的文本类型;
14.按照所述文本类型对所述目标图像区域重新划分所属的第二图像区域集合;
15.按照预设规则将所述第二图像区域集合内的所述目标图像区域进行合并,得到图像矩阵。
16.在一个可能的实现中,所述从多个预设文本类型中确定所述目标图像区域对应的目标预设文本类型的步骤,包括:
17.当所述目标图像区域组成图像矩阵时,利用神经网络模型提取所述图像矩阵的第一特征值;
18.当所述第一特征值位于预设置信度区间时,从多个预设文本类型中确定所述第一特征值对应的目标预设文本类型,所述目标预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体。
19.在一个可能的实现中,当所述第一特征值没有位于预设置信度区间时,对所述图像矩阵执行所述利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤,直至所述图像矩阵的第一特征值位于所述预设置信度区间。
20.在一个可能的实现中,所述从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本的步骤,包括:
21.当所述目标预设文本类型是手写体时,从多个预设算法中确定所述手写体对应的目标预设算法,所述目标预设算法是预设机器学习算法;
22.利用所述预设机器学习算法对所述目标图像区域进行识别,提取出第二特征值;
23.在预设手写体笔迹库中查找与所述第二特征值匹配的手写体笔迹,根据所述手写体笔迹确定目标文本。
24.在一个可能的实现中,所述从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本的步骤,包括:
25.当所述目标预设文本类型是印章体时,从多个预设算法中确定所述印章体对应的目标预设算法;
26.利用所述目标预设算法对所述目标图像区域进行识别,提取出第三特征值;
27.在预设印章库中查找与所述第三特征值匹配的印章体类型,根据所述印章体类型确定目标文本。
28.在一个可能的实现中,所述从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本的步骤,包括:
29.当所述目标预设文本类型是表格体时,从多个预设算法中确定所述表格体对应的目标预设算法;
30.利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本。
31.在一个可能的实现中,所述方法还包括:
32.对所述目标文本添加标签,所述标签包括所述目标文本的内容,并将所述目标文本按照预设格式存储为元数据。
33.第二方面,提供了一种图像识别装置,包括:
34.分割模块,用于利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;
35.确定模块,用于从多个预设文本类型中确定所述目标图像区域对应的目标预设文
本类型;
36.识别模块,用于从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本。
37.第三方面,本申请实施例又提供了一种电子设备,包括存储器、处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的第一方面所述方法。
38.第四方面,本申请实施例又提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述的第一方面所述方法。
39.本申请实施例带来了以下有益效果:
40.本申请实施例提供的一种图像识别方法、装置以及电子设备,能够利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;从多个预设文本类型中确定目标图像区域对应的目标预设文本类型;从多个预设算法中确定目标预设文本类型对应的目标预设算法,并利用目标预设算法对目标图像区域进行识别,得到目标文本。本方案中,可以利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域,然后对目标图像区域进行识别,并确定目标图像区域对应的目标预设文本类型,进一步确定目标预设文本类型对应的目标预设算法,并利用目标预设算法对目标图像区域进行识别,得到目标文本,所以,通过针对目标图像区域的目标预设文本类型,调用对应的目标预设算法对目标图像区域进行识别,实现了针对多种目标预设文本类型的目标图像区域进行识别,实现了根据目标预设文本类型灵活的调用相关算法,适用于具有多种预设文本类型的复杂场景,缓解了图像识别准确率较低的技术问题。
41.为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
42.为了更清楚地说明本申请具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
43.图1为本申请实施例提供的图像识别方法的流程示意图;
44.图2为本申请实施例提供的一种图像识别装置的结构示意图;
45.图3示出了本申请实施例所提供的一种电子设备的结构示意图。
具体实施方式
46.为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
47.本申请实施例中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆
盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括其他没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
48.目前,对文本图像进行识别时,主要适用于一些具有特定段落规则、字迹清晰的文本图像,例如,文本图像的排版是简易的一页两列,在这两列中,分别是由规则的块状区域组成的,所以识别时,会比较准确的识别到排版区域,并识别到排版区域中的内容,所以识别的准确性较高,基本上在95%以上。
49.但是,在档案行业对传统纸质存量档案的数字化加工过程中,往往存在许多复杂的识别场景,例如表格识别、手写体识别、油印印刷体识别、竖排文字识别、页面残缺、透页缺补等,如果仍然使用现有的ocr识别技术,其准确性将会下降至80%左右,所以,现有的识别技术会极大地降低识别的准确率。
50.基于此,本申请实施例提供了一种图像识别方法、装置以及电子设备,通过该方法可以缓解图像识别准确率较低的技术问题。
51.下面结合附图对本申请实施例进行进一步地介绍。
52.图1为本申请实施例提供的一种图像识别方法的流程示意图。其中,该方法应用于电子设备。如图1所示,该方法包括:
53.步骤s110,利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;
54.在本步骤中,待检测图像可以是文本图像等,预设文本目标检测算法可以将待检测图像分割成多个预设尺寸的像素块,例如,像素块的尺寸是2*2,所以,可以得到尺寸2*2的多个目标图像区域。
55.步骤s120,从多个预设文本类型中确定目标图像区域对应的目标预设文本类型;
56.需要说明的是,预设文本类型是电子设备预先设定的多种文本类型,例如,预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体等。
57.在本步骤中,可以在多个预设文本类型中分别确定每个目标图像区域对应的目标预设文本类型。
58.步骤s130,从多个预设算法中确定目标预设文本类型对应的目标预设算法,并利用目标预设算法对目标图像区域进行识别,得到目标文本。
59.需要说明的是,预设算法是电子设备预先设定的算法,例如,预设算法包括机器学习算法、ocr(光学字符识别)、特征图像识别、图像增强算法等,其中,图像增强算法包括:去噪、滤波及二值化等。
60.具体的,电子设备还能将每次识别的目标文本等成果添加至机器学习的训练库中、识别对比的特征库中等,扩充机器学习的数据样本,进一步提升后续的识别准确度。
61.在本步骤中,可以从多个预设算法中分别确定每个目标预设文本类型对应的目标预设算法,并利用目标预设算法对目标图像区域进行识别,得到目标文本。
62.本申请实施例可以利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;从多个预设文本类型中确定目标图像区域对应的目标预设文本类型;从多个预设算法中确定目标预设文本类型对应的目标预设算法,并利用目标预设算法对目标图像区域进行识别,得到目标文本。本方案中,可以利用预设文本目标检测算法对待检测
76.在该步骤中,对于第一图像区域集合内的目标图像区域,遍历所有预设个数的第一质心,计算每个第一质心分别与第一图像区域集合内多个目标图像区域之间的距离,并比较距离的大小,得到目标图像区域与目标第一质心之间的最小距离,目标第一质心对应一种预设文本类型。
77.对于上述步骤d),具体的,电子设备可以将目标第一质心对应的预设文本类型确定为目标图像区域的文本类型,例如,将目标第一质心,即第一质心1对应的预设文本类型确定为目标图像区域1的文本类型。
78.对于上述步骤e),按照每个目标图像区域的文本类型,对目标图像区域重新划分所属的第二图像区域集合,还能够计算第二图像区域集合内的第二质心,计算第二质心的公式如下:
[0079][0080]
对于上述步骤f),预设规则可以是顺序规则,具体的,可以按照步骤s110中待检测图像中目标区域图像的排列顺序,将第二图像区域集合内的目标图像区域进行合并,得到图像矩阵,例如,像素矩阵x如下:
[0081][0082]
本申请实施例能够利用预设聚类算法对目标图像区域进行聚类,得到多个不同类别的第一图像区域集合;针对每个第一图像区域集合,分别确定预设个数的第一质心;计算每个第一质心分别与第一图像区域集合内目标图像区域之间的距离,得到目标图像区域与目标第一质心之间的最小距离,目标第一质心对应一种预设文本类型;将目标第一质心对应的预设文本类型确定为目标图像区域的文本类型;按照文本类型对目标图像区域重新划分所属的第二图像区域集合;按照预设规则将第二图像区域集合内的目标图像区域进行合并,得到图像矩阵。所以,可以通过聚类算法对目标区域图像进行迭代,确定每个目标区域图像所属的文本类型,并得到图像矩阵。
[0083]
在一些实施例中,基于上述步骤s120,可以通过神经网络模型确定图像矩阵的目标预设文本类型。作为一个示例,上述步骤s120可以包括以下步骤:
[0084]
步骤g),当目标图像区域组成图像矩阵时,利用神经网络模型提取图像矩阵的第一特征值;
[0085]
步骤h),当第一特征值位于预设置信度区间时,从多个预设文本类型中确定第一特征值对应的目标预设文本类型,目标预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体。
[0086]
对于上述步骤g),当目标图像区域组成图像矩阵时,利用神经网络模型(cnn)提取图像矩阵的第一特征值,例如,第一特征值是:0.9、1、0.95和0.98,并根据以上这4个值组成
一个矩阵图。
[0087]
对于上述步骤h),需要说明的是,预设置信度区间是预先设定的数值区间,示例性的,预设置信度区间是[0.7,1],将0.9、1、0.95和0.98逐一和该区间进行比较,确定0.9、1、0.95和0.98均在该区间的范围内,所以第一特征值位于预设置信度区间。
[0088]
关于神经网络模型,还可以预先根据多个历史待检测图像进行训练,得到不同预设文本类型对应的特征值,所以,可以从多个预设文本类型中确定第一特征值对应的目标预设文本类型,目标预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体。
[0089]
本申请实施例中,当目标图像区域组成图像矩阵时,利用神经网络模型提取图像矩阵的第一特征值;当第一特征值位于预设置信度区间时,从多个预设文本类型中确定第一特征值对应的目标预设文本类型,目标预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体。所以,电子设备可以利用神经网络模型确定目标区域图像的目标预设文本类型。
[0090]
在一些实施例中,可以对第一特征值没有位于预设置信度区间的目标区域图像执行步骤s110。作为一个示例,上述方法还可以包括如下步骤:
[0091]
步骤i),当第一特征值没有位于预设置信度区间时,对图像矩阵执行利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤,直至图像矩阵的第一特征值位于预设置信度区间。
[0092]
在该步骤中,当第一特征值没有位于预设置信度区间时,则说明第一特征值和历史待检测图像中的特征值没有任何匹配,所以,需要对图像矩阵执行利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤,直至图像矩阵的第一特征值位于预设置信度区间。
[0093]
本申请实施例中,当第一特征值没有位于预设置信度区间时,对图像矩阵执行利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤,直至图像矩阵的第一特征值位于预设置信度区间。所以,对第一特征值没有位于预设置信度区间的目标区域图像继续执行步骤s110,直到确定目标区域图像对应的目标预设文本类型。
[0094]
在一些实施例中,可以利用预设机器学习算法识别手写体类型的目标图像区域。作为一个示例,上述步骤s130可以包括如下步骤:
[0095]
步骤j1),当目标预设文本类型是手写体时,从多个预设算法中确定手写体对应的目标预设算法,目标预设算法是预设机器学习算法;
[0096]
步骤j2),利用预设机器学习算法对目标图像区域进行识别,提取出第二特征值;
[0097]
步骤j3),在预设手写体笔迹库中查找与第二特征值匹配的手写体笔迹,根据手写体笔迹确定目标文本。
[0098]
在本发明实施例中,当目标预设文本类型是手写体时,从多个预设算法中确定手写体对应的目标预设算法,具体的,目标预设算法是预设机器学习算法,利用预设机器学习算法对目标图像区域进行识别,提取出第二特征值,然后在预设手写体笔迹库中查找与第二特征值匹配的手写体笔迹,查找到匹配的手写体字迹后,将手写体字迹与第二特征值进行对比,从而确定目标文本。
[0099]
除此之外,还能根据查找到的匹配的手写体字迹,确定该手写体字迹是谁写出的,例如,确定是某位书法家的手写体字迹,并在预设手写体笔迹库中确定关于该书法家的手写体字迹的数据,然后将该数据与第二特征值进行对比,从而确定目标文本。
[0100]
本申请实施例中,当目标预设文本类型是手写体时,从多个预设算法中确定手写体对应的目标预设算法,目标预设算法是预设机器学习算法;利用预设机器学习算法对目标图像区域进行识别,提取出第二特征值;在预设手写体笔迹库中查找与第二特征值匹配的手写体笔迹,根据手写体笔迹确定目标文本。所以,电子设备可以利用目标预设算法,识别目标预设文本类型为手写体的目标图像区域,进而,得到目标文本。
[0101]
在一些实施例中,可以利用目标预设算法识别印章体类型的目标图像区域。作为一个示例,上述步骤s130可以包括如下步骤:
[0102]
步骤k1),当目标预设文本类型是印章体时,从多个预设算法中确定印章体对应的目标预设算法;
[0103]
步骤k2),利用目标预设算法对目标图像区域进行识别,提取出第三特征值;
[0104]
步骤k3),在预设印章库中查找与第三特征值匹配的印章体类型,根据印章体类型确定目标文本。
[0105]
在本发明实施例中,当目标预设文本类型是印章体时,从多个预设算法中确定印章体对应的目标预设算法,具体的,目标预设算法可以是特征图像识别算法,利用目标预设算法对目标图像区域进行识别,提取出第三特征值,然后在预设印章库中查找与第三特征值匹配的印章体类型,查找出印章体类型后,可以在预设印章库中确定关于该印章体类型的数据,然后将该数据与第三特征值进行对比,从而确定目标文本。
[0106]
本申请实施例中,当目标预设文本类型是印章体时,从多个预设算法中确定印章体对应的目标预设算法;利用目标预设算法对目标图像区域进行识别,提取出第三特征值;在预设印章库中查找与第三特征值匹配的印章体类型,根据印章体类型确定目标文本。所以,电子设备可以利用目标预设算法,识别目标预设文本类型为印章体的目标图像区域,进而,得到目标文本。
[0107]
在一些实施例中,可以利用目标预设算法识别表格体类型的目标图像区域。作为一个示例,上述步骤s130可以包括如下步骤:
[0108]
步骤l2),当目标预设文本类型是表格体时,从多个预设算法中确定表格体对应的目标预设算法;
[0109]
步骤l1),利用目标预设算法对目标图像区域进行识别,得到目标文本。
[0110]
在本发明实施例中,当目标预设文本类型是表格体时,可以调用预设表格识别模板,具体的,预设表格识别模板可以是预先设定好的,或者也可以是绘制的新模板,针对预设表格识别模板中的每个区域,分别设定元数据字段,例如,元数据字段包括:姓名字段、性别字段及身份证号码字段等,然后从多个预设算法中确定表格体对应的目标预设算法,基于多种元数据字段,利用目标预设算法对目标图像区域进行识别,得到目标文本。
[0111]
具体的,利用目标预设算法对目标图像区域进行识别时,可以根据多种元数据字段依次识别目标图像区域中的文字或图像内容,支持先行后列,以及先列后行等多种识别方式。
[0112]
本申请实施例中,当目标预设文本类型是表格体时,从多个预设算法中确定表格
体对应的目标预设算法;利用目标预设算法对目标图像区域进行识别,得到目标文本。所以,电子设备可以利用目标预设算法,识别目标预设文本类型为表格体的目标图像区域,进而,得到目标文本。
[0113]
在一些实施例中,可以对识别到的目标文本添加标签,以便用于后期的二次数据分析等。作为一个示例,该方法还可以包括以下步骤:
[0114]
步骤m),对目标文本添加标签,标签包括目标文本的内容,并将目标文本按照预设格式存储为元数据。
[0115]
在该步骤中,电子设备可以对目标文本自动添加标签,标签包括目标文本的内容描述等等,并将目标文本按照元数据格式存储为元数据,并以xml文件保存,或通过特定的数据接口持久化保存至数据库,形成元数据成果,并自动关联档案条目或字段等,所以,电子设备可以将目标文本进行二次加工,例如数据清洗、加工、序列化等,还能识别目标文本,根据标签进行检索、展现等。
[0116]
本申请实施例可以对目标文本添加标签,标签包括目标文本的内容,并将目标文本按照预设格式存储为元数据,所以,电子设备可以对目标文本进行后续的二次加工,进而,提高数据的利用率。
[0117]
在上述实施例的基础上,在一些实施例中,可以利用目标预设算法识别竖排文字类型的目标图像区域。作为一个示例,上述步骤s130可以包括如下步骤:
[0118]
步骤n),当目标预设文本类型是竖排文字时,从多个预设算法中确定竖排文字对应的目标预设算法;
[0119]
步骤o),利用目标预设算法对目标图像区域进行识别,得到目标文本。
[0120]
在本发明实施例中,当目标预设文本类型是竖排文字时,从多个预设算法中确定竖排文字对应的目标预设算法,具体的,目标预设算法可以是ocr(光学字符识别),利用ocr对目标图像区域进行识别,得到目标文本。
[0121]
图2提供了一种图像识别装置的结构示意图。该装置可以应用于电子设备。如图2所示,图像识别装置200包括:
[0122]
分割模块201,用于利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域;
[0123]
确定模块202,用于从多个预设文本类型中确定所述目标图像区域对应的目标预设文本类型;
[0124]
识别模块203,用于从多个预设算法中确定所述目标预设文本类型对应的目标预设算法,并利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本。
[0125]
在一些实施例中,在分割模块之后,还包括聚类模块,聚类模块具体用于:
[0126]
利用预设聚类算法对所述目标图像区域进行聚类,得到多个不同类别的第一图像区域集合;
[0127]
针对每个所述第一图像区域集合,分别确定预设个数的第一质心;
[0128]
计算每个所述第一质心分别与所述第一图像区域集合内目标图像区域之间的距离,得到目标图像区域与目标第一质心之间的最小距离,所述目标第一质心对应一种预设文本类型;
[0129]
将所述目标第一质心对应的所述预设文本类型确定为所述目标图像区域的文本
类型;
[0130]
按照所述文本类型对所述目标图像区域重新划分所属的第二图像区域集合;
[0131]
按照预设规则将所述第二图像区域集合内的所述目标图像区域进行合并,得到图像矩阵。
[0132]
在一些实施例中,确定模块具体用于:
[0133]
当所述目标图像区域组成图像矩阵时,利用神经网络模型提取所述图像矩阵的第一特征值;
[0134]
当所述第一特征值位于预设置信度区间时,从多个预设文本类型中确定所述第一特征值对应的目标预设文本类型,所述目标预设文本类型包括:竖排文字、油印文字、手写体、印章体、签名体及表格体。
[0135]
在一些实施例中,图像识别装置还用于:
[0136]
当所述第一特征值没有位于预设置信度区间时,对所述图像矩阵执行所述利用预设文本目标检测算法对待检测图像进行分割处理,得到多个目标图像区域的步骤,直至所述图像矩阵的第一特征值位于所述预设置信度区间。
[0137]
在一些实施例中,识别模块具体用于:
[0138]
当所述目标预设文本类型是手写体时,从多个预设算法中确定所述手写体对应的目标预设算法,所述目标预设算法是预设机器学习算法;
[0139]
利用所述预设机器学习算法对所述目标图像区域进行识别,提取出第二特征值;
[0140]
在预设手写体笔迹库中查找与所述第二特征值匹配的手写体笔迹,根据所述手写体笔迹确定目标文本。
[0141]
在一些实施例中,识别模块具体用于:
[0142]
当所述目标预设文本类型是印章体时,从多个预设算法中确定所述印章体对应的目标预设算法;
[0143]
利用所述目标预设算法对所述目标图像区域进行识别,提取出第三特征值;
[0144]
在预设印章库中查找与所述第三特征值匹配的印章体类型,根据所述印章体类型确定目标文本。
[0145]
在一些实施例中,识别模块具体用于:
[0146]
当所述目标预设文本类型是表格体时,从多个预设算法中确定所述表格体对应的目标预设算法;
[0147]
利用所述目标预设算法对所述目标图像区域进行识别,得到目标文本。
[0148]
在一些实施例中,图像识别装置还用于:
[0149]
对所述目标文本添加标签,所述标签包括所述目标文本的内容,并将所述目标文本按照预设格式存储为元数据。
[0150]
本申请实施例提供的图像识别装置,与上述实施例提供的图像识别方法具有相同的技术特征,所以也能解决相同的技术问题,达到相同的技术效果。
[0151]
本申请实施例提供的一种电子设备,如图3所示,电子设备300包括存储器301、处理器302,所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例提供的方法的步骤。
[0152]
参见图3,电子设备还包括:总线303和通信接口304,处理器302、通信接口304和存
储器301通过总线303连接;处理器302用于执行存储器301中存储的可执行模块,例如计算机程序。
[0153]
其中,存储器301可能包含高速随机存取存储器(random access memory,简称ram),也可能还包括非易失性存储器(non

volatile memory),例如至少一个磁盘存储器。通过至少一个通信接口304(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接,可以使用互联网,广域网,本地网,城域网等。
[0154]
总线303可以是isa总线、pci总线或eisa总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0155]
其中,存储器301用于存储程序,所述处理器302在接收到执行指令后,执行所述程序,前述本申请任一实施例揭示的过程定义的装置所执行的方法可以应用于处理器302中,或者由处理器302实现。
[0156]
处理器302可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器302中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器302可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processing,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现成可编程门阵列(field

programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本申请实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器301,处理器302读取存储器301中的信息,结合其硬件完成上述方法的步骤。
[0157]
对应于上述图像识别方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可运行指令,所述计算机可运行指令在被处理器调用和运行时,所述计算机可运行指令促使所述处理器运行上述图像识别方法的步骤。
[0158]
本申请实施例所提供的图像识别装置可以为设备上的特定硬件或者安装于设备上的软件或固件等。本申请实施例所提供的装置,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,前述描述的系统、装置和单元的具体工作过程,均可以参考上述方法实施例中的对应过程,在此不再赘述。
[0159]
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0160]
再例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0161]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0162]
另外,在本申请提供的实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0163]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述图像识别方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read

only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0164]
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释,此外,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0165]
最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的范围。都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1