一种基于二叉树的文本行精确定位方法与流程

文档序号：12177979阅读：来源：国知局

技术特征：

1.一种基于二叉树的文本行精确定位方法，其特征在于：包括以下步骤：

步骤A：对于一副输入的文本行区域被过度分割的自然场景图像，为所有这些被过度分割的文本行建立搜索空间；其中，文本行被过度分割是指文本行定位过程中产生过多的行分割线，导致单个文本行过度分割成若干部分；行分割线用于标注文本行的边界位置以同背景区域区分开来；得到用二叉树表示的搜索空间；

步骤B：对于一个用二叉树表示的搜索空间，二叉树的结点用边界位置这个属性来表示该结点指代的文本行区域组合的范围，并在待合并位置处分成左、右两个子结点；所有文本行区域的组合方式都以结点的形式被纳入该搜索空间；然后通过模拟二叉树后序遍历的方式从搜索空间中构建路径，其中每条路径表示一种特定的文本行组合方式；本步骤的目标是从这些路径中搜索出一条最优路径来重置文本行的定位，以解决文本行过分割问题；

步骤C：对于二叉树搜索空间中某条路径上包含的每个结点集，据结点集中父结点及左、右子结点的置信度比较结果在八种剪枝、合并策略中选择一种合适的情况进行处理，最终得到解决过分割问题的最优路径，该路径对应着重置后的文本行精确定位结果。

2.根据权利要求1所述的一种基于二叉树的文本行精确定位方法，其特征在于：所述步骤A的具体步骤如下：

步骤A01：输入文本行被过度分割的自然场景图像g，其中行分割线包含两个属性：位置l和置信度p，位置l指代行分割线位于输入图像g中第几行，置信度p指代行分割线的梯度值，置信度越小则行分割线分离开来的两文本区域间的差异也越小，故该行分割线越容易导致过分割问题；将二叉树搜索空间中的结点同自然场景图像g中的文本行区域一一对应，其中结点包含两个属性：边界位置即结点的左边界位置l_l和右边界位置l_r对应着某一文本行组合的边界分割线，故边界位置定义了该文本行组合的范围，待合并位置即结点的边界位置内部，具有最大置信度p_max的行分割线的位置l_m；

步骤A02：在当前文本行范围内构建父结点n_p，首先在所有行分割线中选出最外围的首尾行分割线l₁,l_end的位置作为父结点的左边界位置l_l和右边界位置l_r，由边界位置可确定该父结点所对应的文本行区域组合的范围；然后在此范围内不包含边界位置找到置信度最高p_max的行分割线的位置作为待合并位置l_m；

步骤A03：构建父结点n_p的左子结点n_l和右子结点n_r，用父结点n_p的待合并位置l_m将父结点代表的文本行区域范围分成左部分part_l和右部分part_r，分别用左子结点n_l和右子结点n_r来表示；其中左子结点n_l的边界位置l_l^*,l_r^*由父结点的左边界位置l_l及待合并位置l_m构成，左子结点n_l的待合并位置l_m^*由左部分part_l中置信度最高的行分割线位置获得；右子结点n_r的边界位置由父结点的待合并位置l_m及右边界位置l_r构成，右子结点n_r的待合并位置由右部分part_r中置信度最高的行分割线位置获得；

步骤A04：将左子结点n_l代表的文本行区域范围作为当前文本行范围，返回到步骤A02并递归地构建二叉树搜索空间中的结点，直到构建到某一左子结点只存在边界位置而不含待合并位置时，则令该结点为叶子节点n_leaf即不可再分的文本行单位，并返回到该结点的父节点n_p处；

步骤A05：将右子结点n_r代表的文本行区域范围作为当前文本行范围，返回到步骤A02并递归地构建二叉树搜索空间中的结点，直到构建到某一右子结点只存在边界位置而不含待合并位置时，则令该结点为叶子节点n_leaf即不可再分的文本行单位，并返回到该结点的父节点n_p处；

步骤A06：通过上述步骤，自上而下、自左向右递归地构建二叉树搜索空间，直到最右一个文本行单元作为叶子节点被纳入该搜索空间，即建立起覆盖了所有文本行组合方式的二叉树搜索空间。

3.根据权利要求1所述的一种基于二叉树的文本行精确定位方法，其特征在于：所述步骤B具体步骤如下：

步骤B01：对二叉树搜索空间进行后序遍历，得到对所有结点的访问顺序序列{n₁,n₂,...,n_t}，其中n_t是根结点，在后续遍历中被最后访问到；

步骤B02：据二叉树结构特性及后序遍历规则可将{n₁,n₂,...,n_t-1}按照每三个结点划为一组的方式分成组，再加上根结点n_t及其子节点构成的一组，得到共组结点集合，在此过程结点排列顺序不变；其中每个集合s都包含一个父结点及其按待合并位置分开的左、右子结点，得到结点集序列

步骤B03：对于每个结点集用分类器对中的父结点、子结点代表的文本行判断其属于完整文本行的置信度，过分割文本行的置信度较低，然后按照置信度进行剪枝或合并操作，使得每个结点集s_i只保留一个结点，则此时结点集序列S即为在剪枝、合并策略下选择出的最优路径，从而得到重置的文本行精确定位结果，以解决过分割问题。

4.根据权利要求1所述的一种基于二叉树的文本行精确定位方法，其特征在于：所述步骤C具体步骤如下：

步骤C01：分类器判别阶段，对结点集s_i中的父结点及左、右子结点分别用分类器判断该结点所指代的文本行是否属于完整的文本行即没有被过度分割的文本行，同时给出该文本行非过分割的置信度；每个结点集根据所含三个结点的判别结果从八种情况中选择合适的一种，进行后续处理；

步骤C02：八种分类器判别情况中，有五种情况无需进行结点置信度比较就能够直接根据分类器判别结果来执行决策阶段的剪枝或合并操作；剩下三种情况还需要进一步在结点置信度比较阶段，根据父结点、左子结点及右子结点的置信度比较结果，来对结点所指代的文本行区域执行剪枝或合并操作；最终在剪枝、合并策略下处理过的结点集，构成了二叉树搜索空间中的最优路径，对应着重置后的文本行精确定位结果，解决了文本行的过分割问题。

完整全部详细技术资料下载

当前第2页1 2 3