一种文字识别方法及装置的制造方法_2

文档序号：9376207阅读：来源：国知局

br>[0034] 通过步骤SlOl确定了待识别文字的备选文字后，则可通过该特殊校正模型，确定在已识别出该待识别文字的前一个文字的条件下，该待识别文字是该备选文字的特殊后验概率。
[0035] 仍以提取出的文字行中实际的文字是"应收"为例进行说明，假设通过本申请图 1所示的方法，已经识别出"应"字所在的文字块中的待识别文字为应，则针对"收"字所在的文字块，将该文字块中的文字作为待识别文字，将待识别文字输入OCR引擎，OCR引擎则根据输入的待识别文字的特征以及保存的各标准文字的特征，确定与输入的待识别文字的特征相似度较大的标准文字为"该"和"收"，从而确定该待识别文字的备选文字为"该"和 "收"。识别装置则采用依据出现在单据应用场景中词汇的词频而得到的特殊校正模型，分别确定在前一个字为"应"的条件下，当前的该待识别文字是"该"和"收"的特殊后验概率。
[0036] S103:根据每个备选文字的特殊后验概率，对该待识别文字进行识别。
[0037] 具体的，识别装置可将确定出的特殊后验概率最大的备选文字确定为该待识别文字。
[0038] 继续沿用上例，由于特殊校正模型是根据出现在单据应用场景中的词频得到的，而在单据应用场景中"应该"出现的词频小于"应收"出现的词频，因此，在前一个字是"应" 的条件下，采用上述特殊校正模型确定的该待识别文字是"收"的特殊后验概率大于该待识别文字是"该"的特殊后验概率，从而，识别装置将"收"确定为该待识别文字。
[0039] 由上述方法可见，由于特殊校正模型是预先根据统计的出现在特殊应用场景中的词汇的词频得到的，因此采用特殊校正模型可以准确的识别出符合特殊应用场景的文字，从而可以提高在特殊应用场景中识别文字的精度。
[0040] 在本申请实施例中，为了进一步提高识别文字的精度，在确定出待识别文字的备选文字后，除了确定每个备选文字的特殊后验概率以外，还可确定每个备选文字的通用后验概率，并根据每个备选文字的特殊后验概率和通用后验概率对该待识别文字进行识别，也即，综合考虑一个词汇出现在特殊应用场景和一般应用场景中的词频，再对待识别文字进行识别。具体的，识别装置可在根据每个备选文字的特殊后验概率对待识别文字进行识别之前，也即，在图1所示的步骤S103之前，针对该待识别文字的每个备选文字，根据已识别的该待识别文字的前一个文字，采用通用校正模型确定该待识别文字是该备选文字的通用后验概率，并在识别该待识别文字时，根据每个备选文字的通用后验概率和特殊后验概率，对待识别文字进行识别，如，可将通用后验概率乘特殊后验概率的乘积最大的备选文字确定为该待识别文字。其中，上述通用校正模型是根据预先统计的出现在一般应用场景中的各种词汇的词频进行统计得到的。
[0041] 仍以提取出的文字行中实际的文字是"应收"为例进行说明，假设通过本申请图1 所示的方法，已经识别出"应"字所在的文字块中的待识别文字为应，则针对"收"字所在的文字块，将该文字块中的文字作为待识别文字输入OCR引擎，OCR引擎则根据输入的待识别文字的特征以及保存的各标准文字的特征，确定与输入的待识别文字的特征相似度较大的标准文字为"该"和"收"，从而确定该待识别文字的备选文字为"该"和"收"。识别装置则采用依据出现在单据应用场景中词汇的词频而得到的特殊校正模型，分别确定在前一个字为"应"的条件下，当前的该待识别文字是"该"和"收"的特殊后验概率，并采用依据出现在一般应用场景中词汇的词频而得到的通用校正模型，分别确定在前一个字为"应"的条件下，当前的该待识别文字是"该"和"收"的通用后验概率。最后，识别装置将通用后验概率乘特殊后验概率的乘积最大的备选文字确定为该待识别文字。
[0042] 在本申请实施例中，为了进一步提高识别文字的精度，在识别待识别文字时，除了考虑特殊应用场景中的特殊后验概率和一般应用场景中的通用后验概率以外，还可以考虑 OCR引擎将该待识别文字识别为备选文字的置信度，以及所有已识别出的文字与备选文字所构成的子句的可信度权值。具体的，识别装置可针对待识别文字的每个备选文字，根据位于该待识别文字之前的所有已识别文字所构成的子句的可信度权值、将该待识别文字识别为该备选文字的置信度、该备选文字的通用后验概率和特殊后验概率，确定在该待识别文字是该备选文字的条件下，位于该待识别文字之前的所有已识别文字与该备选文字所构成的子句的可信度权值，再将确定的可信度权值最大的备选文字确定为识别出的该待识别文字。
[0043] 具体的，假设待识别文字是第t个文字，第t-Ι个文字是该待识别文字的前一个文字，则针对该待识别文字确定出的第k个备选文字，可采用公式
确定在该待识别文字是该第k个备选文字的条件下，位于该待识别文字之前的所有已识别文字与该第k个备选文字所构成的子句的可信度权值Q(t，k)。上述公式中：
[0044] j表示已识别出的该待识别文字的前一个文字（即第t-Ι个文字）为：在识别该前一个文字（即第t-i个文字）时，针对该前一个文字确定出的第j个备选文字；
[0045] P1 (Ctik)表示当该待识别文字是第一个文字时，该待识别文字是第k个备选文字的通用后验概率；
[0046] P2(Ctik)表示当该待识别文字是第一个文字时，该待识别文字是第k个备选文字的特殊后验概率；
[0047] CF(Ctik)表示将该待识别文字识别为第k个备选文字的置信度，即，ORC引擎根据该待识别文字的特征，将该待识别文字识别为第k个备选文字的置信度；
[0048] Q(t_l，j)表示位于该待识别文字之前的所有已识别文字所构成的子句的可信度权值；
[0049] P1 (ctik I Ct I,)表示当该待识别文字不是第一个文字时，该待识别文字是第k个备选文字的通用后验概率；
[0050] P2(ctik|ct u)表示当该待识别文字不是第一个文字时，该待识别文字是第k个备选文字的特殊后验概率。
[0051] 例如，假设提取出的文字行中实际的文字是"共计应收金额"，在该文字行中共确定了 6个文字块，分别是"共"所在的文字块、"计"所在的文字块、"应"所在的文字块、"收" 所在的文字块、"金"所在的文字块、"额"所在的文字块，则按照一般文字的书写顺序，即从左到右的顺序，先针对"共"所在的文字块，将该文字块中的文字作为待识别文字进行识别。识别装置先确定该待识别文字的各备选文字，假设确定的备选文字为"共"和"兴"，则由于当前该待识别文字是第一个文字，因此，识别装置先采用通用校正模型和特殊校正模型确定备选文字"共"的通用后验概率P 1 (Clil)和特殊后验概率P2(Clil)，以及将该待识别文字识别为备选文字"共"的置信度CF(C lil)。
[0052] 需要说明的是，由于当前该待识别文字是第一个文字，因此，确定的通用后验概率 P1(Cm)的意义实际上是：在一般应用场景中，包含备选文字"共"的词汇出现的概率。类似的，确定的特殊后验概率P2(Clil)的意义实际上是：在特殊应用场景中，包含备选文字"共" 的词汇出现的概率。
[0053] 针对备选文字"共"确定了通用后验概率P1 (C1, D、特殊后验概率P2 (C1, D、置信度 CF(Clil)后，则可采用公式 Q(l，l) = logPjcuHlogPjciD+logCFI^Cu)确定仅由备选文字"共"构成的子句的可信度权值Q (1，1)。
[0054] 类似的，再针对另一个备选文字"兴"，确定仅由备选文字"兴"构成的子句的可信度权值Q (1，2)。然后根据Q (1，1)和Q (1，2)，选择最大的可信度权值对应的备选文字，确定为该待识别文字。假设Q(l，l)大于Q(l，2)，则确定备选文字"共"为当前的该待识别文字。
[0055] 识别了第一个文字后，再针对第二个文字块（即"计"所在的文字块）进行识别，艮P，当前的待识别文字是第二个文字。具体的，假设根据当前的待识别文字确定的备选文字为"计"和"什"，则采用通用校正模型和特殊校正模型确定备选文字"计"的通用后验概率 P1 (C2il I Clil)和特殊后验概率P2(C2il I Clil)，以及将该待识别文字识别为备选文字"计"的置信度CF(C2il)，进而确定当第二个文字（即，当前的待识别文字）是"计"的条件下，由第二个文字和已经识别出的第一个文字"共"所构成的子句的可信度权值Q (2, I) = Q (1，I)+IogPi (? i I Cl, J +IogP2 (? i I Cl, D +IogCF (? J。类似的，针对第二个备选文字"什"，确定当第二个文字是"什"的条件下，由第二个文字和已经识别出的第一个文字"共"所构成的子句的可信度权值 Q(2, 2) = Q(l，IKlogP1 (C2,2|Cl,D+logPjcwIcuHlogCFGw)。然后再根据 Q(2, 1) 和Q(2, 2)的大小识别第二个文字。以此类推，可依次识别出文字行中"共计应收金额"这 6个文字。
[0056] 由上述过程可以看出，当对文字行中的最后一个文字识别完成后，可得到该文字行中所有已识别出的文字所构成的子句的可信度权值，而由于对于同一个文字行来说，在确定该文字行中的各文字块时，采用不同的文字块确定方法可能确定出不同的文字块，因此，可针对采用每种文字块确定方法确定出的文字块，均采用上述方法进行文字识别，最终得到该文字行中所有已识别出的文字构成的子句的可信度权值，再从中选择出可信度权值最大的子句，作为

完整全部详细技术资料下载

当前第2页1 2 3 4