文本图像版面分析方法、装置、电子设备及存储介质与流程

文档序号：31535457发布日期：2022-09-16 22:17阅读：90来源：国知局

1.本技术涉及图像处理技术领域，特别是涉及一种文本图像版面分析方法、装置、电子设备及存储介质。

背景技术：

2.文本图像的版面分析是指对文本图像上不同版面区域进行识别和解析，以便进行后续的ocr(optical character recognition，光学字符识别)处理，文本图像的版面分析在版面还原中具有重要的应用。
3.现有技术中，对于文本图像的版面分析方式，是针对不同类型的版面区域，采用独立的区域检测算法和区域解析算法进行分析。比如，文本区域需要采用文本区域检测算法及文本区域解析算法进行分析，表格区域需要采用表格区域检测算法及表格区域解析算法进行分析，等等。
4.但是，上述独立的区域检测算法及区域解析算法，由于没有利用区域的全局协同信息从而导致解析效果较差，并且处理过程复杂、效率低下。

技术实现要素：

5.鉴于上述问题，本技术实施例提出了一种文本图像版面分析方法、装置、电子设备及存储介质，用以提高文本图像版面分析的准确性和分析效率。
6.根据本技术的实施例的第一方面，提供了一种文本图像版面分析方法，包括：
7.利用解析模型中的特征提取网络，提取待处理文本图像的特征信息；
8.利用所述解析模型中的区域生成网络，基于所述待处理文本图像的特征信息，获取所述待处理文本图像中包含的各版面区域的位置和类型；
9.利用所述解析模型中的特征对齐网络，基于所述待处理文本图像的特征信息和所述各版面区域的位置，获取所述各版面区域的特征信息；
10.针对预设类型的每个版面区域，利用所述解析模型中当前版面区域的类型对应的内容解析网络，基于当前版面区域的特征信息，解析得到当前版面区域的解析结果。
11.可选地，所述解析模型通过如下方式进行训练：
12.利用待训练解析模型中的特征提取网络，提取样本文本图像的特征信息；
13.利用所述待训练解析模型中的区域生成网络，基于所述样本文本图像的特征信息，获取所述样本文本图像中包含的各样本版面区域的位置和类型；
14.利用所述待训练解析模型中的特征对齐网络，基于所述样本文本图像的特征信息和各样本版面区域的位置，获取所述各样本版面区域的特征信息；
15.针对预设类型的每个样本版面区域，利用所述待训练解析模型中当前样本版面区域的类型对应的内容解析网络，基于当前样本版面区域的特征信息，解析得到当前样本版面区域的解析结果；
16.计算模型损失函数，基于所述模型损失函数确定是否训练完成。
17.可选地，计算模型损失函数包括：计算所述区域生成网络的损失函数和各内容解析网络的损失函数；基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数。
18.可选地，基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数，包括：对所述区域生成网络的损失函数和各内容解析网络的损失函数进行加权计算，得到所述模型损失函数。
19.可选地，所述预设类型包括以下至少一种：表格区域、文本区域、公式区域。
20.根据本技术的实施例的第二方面，提供了一种文本图像版面分析装置，包括：
21.提取模块，用于利用解析模型中的特征提取网络，提取待处理文本图像的特征信息；
22.生成模块，用于利用所述解析模型中的区域生成网络，基于所述待处理文本图像的特征信息，获取所述待处理文本图像中包含的各版面区域的位置和类型；
23.对齐模块，用于利用所述解析模型中的特征对齐网络，基于所述待处理文本图像的特征信息和所述各版面区域的位置，获取所述各版面区域的特征信息；
24.解析模块，用于针对预设类型的每个版面区域，利用所述解析模型中当前版面区域的类型对应的内容解析网络，基于当前版面区域的特征信息，解析得到当前版面区域的解析结果。
25.可选地，所述解析模型通过如下方式模块训练：
26.样本提取模块，用于利用待训练解析模型中的特征提取网络，提取样本文本图像的特征信息；
27.样本生成模块，用于利用所述待训练解析模型中的区域生成网络，基于所述样本文本图像的特征信息，获取所述样本文本图像中包含的各样本版面区域的位置和类型；
28.样本对齐模块，用于利用所述待训练解析模型中的特征对齐网络，基于所述样本文本图像的特征信息和各样本版面区域的位置，获取所述各样本版面区域的特征信息；
29.样本解析模块，用于针对预设类型的每个样本版面区域，利用所述待训练解析模型中当前样本版面区域的类型对应的内容解析网络，基于当前样本版面区域的特征信息，解析得到当前样本版面区域的解析结果；
30.确定模块，用于计算模型损失函数，基于所述模型损失函数确定是否训练完成。
31.可选地，所述确定模块包括：第一计算单元，用于计算所述区域生成网络的损失函数和各内容解析网络的损失函数；第二计算单元，用于基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数。
32.可选地，所述第二计算单元，具体用于对所述区域生成网络的损失函数和各内容解析网络的损失函数进行加权计算，得到所述模型损失函数。
33.可选地，所述预设类型包括以下至少一种：表格区域、文本区域、公式区域。
34.根据本技术的实施例的第三方面，提供了一种电子设备，包括：一个或多个处理器；和其上存储有指令的一个或多个计算机可读存储介质；当所述指令由所述一个或多个处理器执行时，使得所述处理器执行如上任一项所述的文本图像版面分析方法。
35.根据本技术的实施例的第四方面，提供了一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序被处理器执行时，使得所述处理器执行如上任一项所述的
文本图像版面分析方法。
36.本技术实施例中，利用解析模型中的特征提取网络，提取待处理文本图像的特征信息；利用所述解析模型中的区域生成网络，基于所述待处理文本图像的特征信息，获取所述待处理文本图像中包含的各版面区域的位置和类型；利用所述解析模型中的特征对齐网络，基于所述待处理文本图像的特征信息和所述各版面区域的位置，获取所述各版面区域的特征信息；针对预设类型的每个版面区域，利用所述解析模型中当前版面区域的类型对应的内容解析网络，基于当前版面区域的特征信息，解析得到当前版面区域的解析结果。由此可知，本技术实施例中可以端到端的训练，有效利用了共享的特征提取网络及全局协同信息，从而版面区域的边界划分更加精确，进而能够提升解析结果的准确性，文本图像版面分析过程更加简洁高效，能够提升客户体验。
附图说明
37.为了更清楚地说明本技术的实施例的技术方案，下面将对本技术的实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术的实施例的一些附图，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
38.图1是本技术实施例的一种解析模型训练过程的步骤流程图。
39.图2是本技术实施例的一种文本图像版面分析方法的步骤流程图。
40.图3是本技术实施例的一种文本图像版面分析装置的结构框图。
41.图4是本技术实施例的一种电子设备的结构示意图。
具体实施方式
42.下面将结合本技术的实施例中的附图，对本技术的实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本技术的一部分实施例，而不是本技术的全部实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。
43.文本图像的版面分析，指的是获取文本图像中不同版面区域的属性及解析结果。
44.示例性地，版面区域的属性可以包括但不限于：位置、类型，等等。
45.示例性地，版面区域的类型可以包括但不限于：文本区域、表格区域、公式区域、图像区域，等等。其中，文本区域又可以细分为正文区域、标题(title)区域、列表(list)区域、页眉页脚区域等。表格区域又可以细分为有线表区域、无线表区域、混合表区域等。
46.示例性地，版面区域的解析结果可以包括但不限于内容等。其中，文本区域的解析结果可以包括但不限于文本的内容。表格区域的解析结果可以包括但不限于表格区域内各单元格的位置坐标及逻辑行列坐标，以及各单元格的内容。公式区域的解析结果可以包括但不限于公式的内容。图像区域无需进一步解析图像的内容。
47.本技术实施例中，预先训练解析模型，然后利用预先训练的解析模型对文本图像进行协同解析，无需采用各版面区域对应的独立算法分别对各版面区域进行解析，处理过程更加简便高效。以下具体说明。
48.首先，介绍解析模型的训练过程。
49.构建待训练解析模型，待训练解析模型是指还未进行训练的解析模型。
50.待训练解析模型中可以包括但不限于：特征提取网络、区域生成网络、特征对齐网络、各预设类型对应的内容解析网络。其中，类型是指文本图像中的版面区域的类型。示例性地，预设类型可以包括但不限于以下至少一种：表格区域、文本区域、公式区域。由于图像区域可以不进行内容解析，因此可以不设置图像区域对应的内容解析网络。
51.获取样本数据。样本数据可以包括样本文本图像的和该样本文本图像的标签，其中，样本文本图像的标签用于指示样本文本图像中包含的各样本版面区域的实际位置、实际类型和实际解析结果。
52.示例性地，可以从互联网中抓取大量的文本图像作为样本文本图像。针对每张样本文本图像，可以使用word解析工具、pdf解析工具等获取样本文本图像中包含的各版面区域的实际位置、实际类型和实际解析结果，以便得到样本文本图像的标签。
53.在一种可选实施方式中，可以利用获取到的全部样本数据对待训练解析模型进行训练。
54.参照图1，示出了本技术实施例的一种解析模型训练过程的步骤流程图。
55.如图1所示，解析模型训练过程可以包括以下步骤：
56.步骤101，利用待训练解析模型中的特征提取网络，提取样本文本图像的特征信息。
57.在训练过程中，将样本文本图像输入待训练解析模型中的特征提取网络。
58.特征提取网络用于提取文本图像的特征信息。因此，利用待训练解析模型中的特征提取网络对输入的样本文本图像进行卷积、池化等操作，可以提取样本文本图像的特征信息，此处的特征信息为共享的特征信息。
59.示例性地，特征提取网络可以采用cnn(convolutional neural networks，卷积神经网络)中的backbone(骨架网络)等。backbone主要设置于cnn网络的前端。backbone可以包括但不限于：resnet(residual network，残差网络)、vggnet(visual geometry group network，视觉几何组网络)、densenet(dense convolutional network，密集卷积网络)，等等。
60.对于特征提取网络的具体结构和特征提取过程，可以根据实际经验进行相关处理，本实施例在此不再详细论述。
61.步骤102，利用所述待训练解析模型中的区域生成网络，基于所述样本文本图像的特征信息，获取所述样本文本图像中包含的各样本版面区域的位置和类型。
62.将待训练解析模型中的特征提取网络输出的样本文本图像的特征信息，作为待训练解析模型中的区域生成网络的输入。
63.区域生成网络用于获取文本图像中包含的各版面区域的位置和类型。因此，利用待训练解析模型中的区域生成网络对输入的样本文本图像的特征信息进行区域分析，可以获取到样本文本图像中包含的各样本版面区域的位置和类型。其中，样本版面区域的位置可以为样本版面区域在样本文本图像中的位置坐标。各样本版面区域的位置和类型作为待训练解析模型的输出。
64.示例性地，区域生成网络可以采用rpn(regionproposal network，区域生成网络)等。
65.具体地，输入到rpn的特征信息可以为特征图(feature map)。rpn的处理过程可以包括：首先，rpn对特征图上的每一个点(称之为锚点anchorpoint)生成具有不同尺度和宽高比的锚点框(anchors)；然后，rpn将这些锚点框(锚点框可以对应于本技术实施例中的样本版面区域)输入到两个网络层中，一个网络层用来分类，即确定这个锚点框里面的特征图是否属于目标(目标可以对应于本技术实施例中的样本版面区域的类型)；另外一个网络层输出这个锚点框的位置坐标(位置坐标可以对应于本技术实施例中的样本版面区域的位置)。其中，锚点框的位置坐标(x，y，w，h)是指在原图上的坐标。
66.步骤103，利用所述待训练解析模型中的特征对齐网络，基于所述样本文本图像的特征信息和所述各样本版面区域的位置，获取所述各样本版面区域的特征信息。
67.将待训练解析模型中的特征提取网络输出的样本文本图像的特征信息，以及待训练解析模型中的区域生成网络输出的样本文本图像中包含的各样本版面区域的位置，作为待训练解析模型中的特征对齐网络的输入。
68.特征对齐网络用于对版面区域的位置和文本图像的特征信息进行特征对齐，以便获取版面区域的特征信息。因此，利用待训练解析模型中的特征对齐网络，可以对样本文本图像的特征信息和样本文本图像中包含的各样本版面区域的位置进行特征对齐，从而获取样本文本图像中包含的各样本版面区域的特征信息。
69.示例性地，针对任意一个样本版面区域，根据该样本版面区域的位置，从样本文本图像的特征信息中提取出该样本版面区域的位置对应的特征信息，将提取的特征信息作为该样本版面区域的特征信息。
70.示例性地，特征对齐网络可以采用roi align(region of interestalign，感兴趣区域对齐)网络等。
71.具体地，roi align的思路为：取消量化操作，使用双线性内插的方法获得坐标为浮点数的像素点上的图像数值，从而将整个特征聚集过程转化为一个连续的操作。处理过程可以包括：遍历每一个候选区域，保持浮点数边界不做量化；将候选区域分割成k
×
k个单元，每个单元的边界也不做量化；在每个单元中计算固定四个坐标位置，用双线性内插的方法计算出这四个坐标位置的值，然后进行最大池化操作。上述固定位置是指在每一个矩形单元中按照固定规则确定的位置。比如，如果采样点数是1，那么就是这个单元的中心点。如果采样点数是4，那么就是把这个单元平均分割成四个小方块以后它们分别的中心点。显然这些采样点的坐标通常是浮点数，所以需要使用插值的方法得到它的像素值。
72.步骤104，针对预设类型的每个样本版面区域，利用所述待训练解析模型中当前样本版面区域的类型对应的内容解析网络，基于当前样本版面区域的特征信息，解析得到当前样本版面区域的解析结果。
73.根据待训练解析模型中的区域生成网络输出的各样本版面区域的类型，确定各样本版面区域是否为预设类型。针对预设类型的每个样本版面区域，将待训练解析模型中的特征对齐网络输出的当前样本版面区域的特征信息，作为待训练解析模型中的当前样本版面区域的类型对应的内容解析网络的输入。
74.内容解析网络用于对版面区域的内容进行解析，以便获取版面区域的解析结果。因此，针对当前样本版面区域，利用待训练解析模型中的当前样本版面区域对应的内容解析网络，可以对当前样本版面区域的特征信息进行解析，从而获取当前样本版面区域的解
析结果。各样本版面区域的解析结果作为待训练解析模型的输出。
75.示例性地，内容解析网络可以采用transformer网络等。
76.transformer网络有多个编码器(encoder)和多个解码器(decoder)组成，编码器和解码器的数量相同。编码器包括自注意力(self-attention)层和前馈(feed-forward)神经网络层。从编码器输入的句子首先会经过自注意力(self-attention)层，这层在对每个单词编码时关注输入句子的其他单词，自注意力层的输出会传递到前馈(feed-forward)神经网络层中进行处理。解码器中也有编码器的自注意力(self-attention)层和前馈(feed-forward)神经网络层，除此之外，这两个层之间还有一个注意力层，用来关注输入句子的相关部分。对于具体的处理过程，本实施例在此不再详细论述。
77.步骤105，计算模型损失函数，基于所述模型损失函数确定是否训练完成。
78.在一种可选实施方式中，计算模型损失函数的过程，可以包括以下步骤a1～a2：
79.步骤a1，分别计算所述区域生成网络的损失函数和各内容解析网络的损失函数。
80.对于区域生成网络的损失函数，可以基于区域生成网络输出的样本版面区域的位置和标签中样本版面区域的实际位置，待训练解析模型输出的样本版面区域的类型和标签中样本版面区域的实际类型，进行计算。
81.对于任意一个内容解析网络的损失函数，可以基于该内容解析网络输出的样本版面区域的解析结果和标签中样本版面区域的实际解析结果，进行计算。
82.示例性地，损失函数可以包括但不限于：交叉熵损失函数、指数损失函数、平方损失函数、绝对值损失函数，等等。
83.步骤a2，基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数。
84.示例性地，基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数的过程，可以包括：对所述区域生成网络的损失函数和各内容解析网络的损失函数进行加权计算，得到所述模型损失函数。对于加权计算中各损失函数的权重，可以根据实际情况进行设置，本实施例对此不作限制。
85.示例性地，基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数的过程，可以包括：对所述区域生成网络的损失函数和各内容解析网络的损失函数进行求和，得到所述模型损失函数。
86.在模型损失函数小于预设阈值的情况下，可以确定训练完成。如果基于模型损失函数确定训练完成，则可以将训练完成的模型作为解析模型。如果基于模型损失函数确定训练未完成，则使用适用的优化器对区域生成网络和各内容解析网络的参数进行端到端的网络优化，并继续进行训练。
87.在一种可选实施方式中，可以从获取的全部样本数据中选取部分样本数据作为训练集，剩余部分样本数据作为测试集。利用训练集对待训练解析模型进行训练，利用测试集对训练完成的解析模型进行测试评估。
88.示例性地，训练集中样本数据的数量大于测试集中样本数据的数量。示例性地，训练集中样本数据的数量占全部样本数据的百分比大于等于预设百分比。可选地，预设百分比可以为80％、85％、90％，等等。例如，全部样本数据的数量为50万个，训练集中样本数据的数量可以为49.5万个，测试集中样本数据的数量可以为5000个。
89.该种情况下，在基于模型损失函数确定训练完成后，可以进一步对当前训练完成的解析模型进行测试评估。在评估通过时，得到评估通过的解析模型；在评估未通过时，继续对训练完成的解析模型进行参数优化。
90.示例性地，基于测试结果计算解析模型的准确率。准确率是指所有预测正确的样本数量除以总的样本数量得到的比值，准确率能够反映模型的正确预测能力，因此准确率越高，预测模型预测正确的可能性越大。因此，在计算得到的准确率大于预设准确率的情况下，可以确定评估通过。
91.然后，介绍文本图像版面分析的过程。
92.参照图2，示出了本技术实施例的一种文本图像版面分析方法的步骤流程图。
93.如图2所示，文本图像版面分析方法可以包括以下步骤：
94.步骤201，利用解析模型中的特征提取网络，提取待处理文本图像的特征信息。
95.将待处理文本图像输入训练得到的解析模型中的特征提取网络。
96.利用解析模型中的特征提取网络对输入的待处理文本图像进行卷积、池化等操作，可以提取待处理文本图像的特征信息，此处的特征信息为共享的特征信息。
97.步骤202，利用所述解析模型中的区域生成网络，基于所述待处理文本图像的特征信息，获取所述待处理文本图像中包含的各版面区域的位置和类型。
98.将解析模型中的特征提取网络输出的待处理文本图像的特征信息，作为解析模型中的区域生成网络的输入。
99.利用解析模型中的区域生成网络对输入的待处理文本图像的特征信息进行区域分析，可以获取到待处理文本图像中包含的各版面区域的位置和类型。其中，版面区域的位置可以为版面区域在待处理文本图像中的位置坐标。各版面区域的位置和类型作为解析模型的输出。
100.步骤203，利用所述解析模型中的特征对齐网络，基于所述待处理文本图像的特征信息和所述各版面区域的位置，获取所述各版面区域的特征信息。
101.将解析模型中的特征提取网络输出的待处理文本图像的特征信息，以及解析模型中的区域生成网络输出的待处理文本图像中包含的各版面区域的位置，作为解析模型中的特征对齐网络的输入。
102.利用解析模型中的特征对齐网络，可以对待处理文本图像的特征信息和待处理文本图像中包含的各版面区域的位置进行特征对齐，从而获取待处理文本图像中包含的各版面区域的特征信息。
103.步骤204，针对预设类型的每个版面区域，利用所述解析模型中当前版面区域的类型对应的内容解析网络，基于当前版面区域的特征信息，解析得到当前版面区域的解析结果。
104.根据解析模型中的区域生成网络输出的各版面区域的类型，确定各版面区域是否为预设类型。针对预设类型的每个版面区域，将解析模型中的特征对齐网络输出的当前版面区域的特征信息，作为解析模型中的当前版面区域的类型对应的内容解析网络的输入。
105.针对当前版面区域，利用解析模型中的当前版面区域对应的内容解析网络，可以对当前版面区域的特征信息进行解析，从而获取当前版面区域的解析结果。各样本版面区域的解析结果作为解析模型的输出。
106.本技术实施例中可以端到端的训练，有效利用了共享的特征提取网络及全局协同信息，从而版面区域的边界划分更加精确，进而能够提升解析结果的准确性，文本图像版面分析过程更加简洁高效，能够提升客户体验。
107.参照图3，示出了本技术实施例的一种文本图像版面分析装置的结构框图。
108.如图3所示，文本图像版面分析装置可以包括以下模块：
109.提取模块301，用于利用解析模型中的特征提取网络，提取待处理文本图像的特征信息；
110.生成模块302，用于利用所述解析模型中的区域生成网络，基于所述待处理文本图像的特征信息，获取所述待处理文本图像中包含的各版面区域的位置和类型；
111.对齐模块303，用于利用所述解析模型中的特征对齐网络，基于所述待处理文本图像的特征信息和所述各版面区域的位置，获取所述各版面区域的特征信息；
112.解析模块304，用于针对预设类型的每个版面区域，利用所述解析模型中当前版面区域的类型对应的内容解析网络，基于当前版面区域的特征信息，解析得到当前版面区域的解析结果。
113.可选地，所述解析模型通过如下方式模块训练：
114.样本提取模块，用于利用待训练解析模型中的特征提取网络，提取样本文本图像的特征信息；
115.样本生成模块，用于利用所述待训练解析模型中的区域生成网络，基于所述样本文本图像的特征信息，获取所述样本文本图像中包含的各样本版面区域的位置和类型；
116.样本对齐模块，用于利用所述待训练解析模型中的特征对齐网络，基于所述样本文本图像的特征信息和各样本版面区域的位置，获取所述各样本版面区域的特征信息；
117.样本解析模块，用于针对预设类型的每个样本版面区域，利用所述待训练解析模型中当前样本版面区域的类型对应的内容解析网络，基于当前样本版面区域的特征信息，解析得到当前样本版面区域的解析结果；
118.确定模块，用于计算模型损失函数，基于所述模型损失函数确定是否训练完成。
119.可选地，所述确定模块包括：第一计算单元，用于计算所述区域生成网络的损失函数和各内容解析网络的损失函数；第二计算单元，用于基于所述区域生成网络的损失函数和各内容解析网络的损失函数，计算所述模型损失函数。
120.可选地，所述第二计算单元，具体用于对所述区域生成网络的损失函数和各内容解析网络的损失函数进行加权计算，得到所述模型损失函数。
121.可选地，所述预设类型包括以下至少一种：表格区域、文本区域、公式区域。
122.本技术实施例中可以端到端的训练，有效利用了共享的特征提取网络及全局协同信息，从而版面区域的边界划分更加精确，进而能够提升解析结果的准确性，文本图像版面分析过程更加简洁高效，能够提升客户体验。
123.对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。
124.在本技术的实施例中，还提供了一种电子设备。该电子设备可以包括一个或多个处理器，以及其上存储有指令的一个或多个计算机可读存储介质，指令例如应用程序。当所述指令由所述一个或多个处理器执行时，使得所述处理器执行如上任一实施例所述的文本
图像版面分析方法。
125.参照图4，示出了本技术实施例的一种电子设备结构的示意图。如图4所示，电子设备包括处理器401、通信接口402、存储器403和通信总线404。其中，处理器401，通信接口402，存储器403通过通信总线404完成相互间的通信。
126.存储器403，用于存放计算机程序。
127.处理器401，用于执行存储器403上所存放的程序时，实现上述任一实施例的文本图像版面分析方法。
128.通信接口402用于上述电子设备与其他设备之间的通信。
129.上述提到的通信总线404可以是外设部件互连标准(peripheral component interconnect，简称pci)总线或扩展工业标准结构(extended industry standard architecture，简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示，图中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
130.上述提到的处理器401可以包括但不限于：中央处理器(central processing unit，简称cpu)、网络处理器(network processor，简称np)、数字信号处理器(digital signal processing，简称dsp)、专用集成电路(application specific integrated circuit，简称asic)、现场可编程门阵列(field－programmable gate array，简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，等等。
131.上述提到的存储器403可以包括但不限于：只读存储器(read only memory，简称rom)、随机存取存储器(random access memory，简称ram)、光盘只读储存器(compact disc readonly memory，简称cd-rom)、电可擦可编程只读存储器(electronic erasable programmable readonly memory，简称eeprom)、硬盘、软盘、闪存，等等。
132.在本技术的实施例中，还提供了一种非临时性计算机可读存储介质，其上存储有计算机程序，该计算机程序可由电子设备的处理器执行，当所述计算机程序被处理器执行时，使得所述处理器执行如上任一实施例所述的文本图像版面分析方法。
133.需要说明的是，本技术中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下，并获得由相应装置所有者给予授权的情况下进行的。
134.在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述，构造这类系统所要求的结构是显而易见的。此外，本技术的实施例也不针对任何特定编程语言。应当明白，可以利用各种编程语言实现在此描述的本技术的实施例的内容，并且上面对特定语言所做的描述是为了披露本技术的实施例的最佳实施方式。
135.在此处所提供的说明书中，说明了大量具体细节。然而，能够理解，本技术的实施例可以在没有这些具体细节的情况下实践。在一些实例中，并未详细示出公知的方法、结构和技术，以便不模糊对本说明书的理解。
136.类似地，应当理解，为了精简本技术并帮助理解各个发明方面中的一个或多个，在上面对本技术的示例性实施例的描述中，本技术的实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而，并不应将该公开的方法解释成反映如下意图：即所要求保护的本技术的实施例要求比在每个权利要求中所明确记载的特征更多的特征。更确
切地说，如下面的权利要求书所反映的那样，发明方面在于少于前面公开的单个实施例的所有特征。因此，遵循具体实施方式的权利要求书由此明确地并入该具体实施方式，其中每个权利要求本身都作为本技术的实施例的单独实施例。
137.本领域那些技术人员可以理解，可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件，以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外，可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述，本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的替代特征来代替。
138.本技术的实施例的各个部件实施例可以以硬件实现，或者以在一个或者多个处理器上运行的软件模块实现，或者以它们的组合实现。本领域的技术人员应当理解，可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本技术的实施例的动态图片的生成设备中的一些或者全部部件的一些或者全部功能。本技术的实施例还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本技术的实施例的程序可以存储在计算机可读介质上，或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到，或者在载体信号上提供，或者以任何其他形式提供。
139.应该注意的是上述实施例对本技术的实施例进行说明而不是对本技术的实施例进行限制，并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本技术的实施例可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
140.所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。
141.以上所述，仅为本技术的实施例的具体实施方式，但本技术的实施例的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本技术的实施例揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本技术的实施例的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高大帅李健陈明武卫东
技术所有人：北京捷通鸿泰科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。