本申请涉及人工智能(artificial intelligence,简称ai),特别涉及一种印章文字识别方法、装置、设备及存储介质。
背景技术:
1、随着人工智能技术的发展,从印章图像中识别印章的文字已成为较为重要的研究方向。其中,针对一维线性分布的文本图像(也即印章中文字的方向是朝一个方向线性排列的)的文字识别技术已经相对成熟,而针对二维曲型文本分布的文本图像(也即印章中文字的方向不是朝一个方向线性排列的)的印章识别方法目前研究相对较少。
2、相关技术中,将二维曲型分布的文本图像拆分成多个小段图像,每段图像可近似看作一维线性分布的文本图像,对于每一段图像采用针对一维线性分布的印章文本的文字识别技术进行文本识别得到该分段的文本识别结果,再将所有分段的识别结果串接起来得到最终的识别结果。
3、而上述相关技术中,将二维曲型分布的印章文本图像划分为多个小段图像,并逐一进行文本识别的方法很有可能导致印章中的文本被截断,从而导致最终的识别结果的精度较差。
技术实现思路
1、本申请实施例提供了一种印章文字识别方法、装置、设备及存储介质,能够提升印章的文字识别结果的准确度。所述技术方案包括如下几个方面。
2、根据本申请实施例的一个方面,提供了一种印章文字识别方法,所述方法包括如下几个步骤。
3、基于印章图像,确定所述印章图像中的印章文字区域,所述印章文字区域是所述印章图像中的印章中的文字所在区域,所述印章文字区域呈环形,所述印章文字区域中的文字呈弧形排列;
4、从所述印章文字区域中确定至少两对匹配点,每对匹配点中包括所述印章文字区域上的一个外轮廓点和与所述外轮廓点匹配的所述印章文字区域上的一个内轮廓点,所述至少两对匹配点将所述印章文字区域划分为多个子区域;
5、对各个所述子区域分别进行矫正,得到矫正后的所述印章文字区域,矫正后的所述印章文字区域中的文字沿直线方向排列;
6、对矫正后的所述印章文字区域进行文字识别,得到所述印章的文字识别结果。
7、根据本申请实施例的一个方面,提供了一种印章文字识别装置,所述装置包括如下几个模块。
8、区域确定模块,用于基于印章图像,确定所述印章图像中的印章文字区域,所述印章文字区域是所述印章图像中的印章中的文字所在区域,所述印章文字区域呈环形,所述印章文字区域中的文字呈弧形排列;
9、匹配点确定模块,用于从所述印章文字区域中确定至少两对匹配点,每对匹配点中包括所述印章文字区域上的一个外轮廓点和与所述外轮廓点匹配的所述印章文字区域上的一个内轮廓点,所述至少两对匹配点将所述印章文字区域划分为多个子区域;
10、区域矫正模块,用于对各个所述子区域分别进行矫正,得到矫正后的所述印章文字区域,矫正后的所述印章文字区域中的文字沿直线方向排列;
11、文字识别模块,用于对矫正后的所述印章文字区域进行文字识别,得到所述印章的文字识别结果。
12、根据本申请实施例的一个方面,提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现上述印章文字识别方法。
13、根据本申请实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现上述印章文字识别方法。
14、根据本申请实施例的一个方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现上述印章文字识别方法。
15、本申请实施例提供的技术方案可以带来如下有益效果。
16、通过从印章图像中确定出印章图像中的印章文字区域,并进一步从印章文字区域中确定至少两对匹配点,对至少两对匹配点划分成的各个子区域分别进行矫正,得到矫正后的印章文字区域,使得矫正后的印章文字区域中的文字沿直线方向排列,也即将二维曲型分布的文字矫正为一维线性分布的文字,直接对矫正后的印章文字区域进行文字识别,从而得到印章的文字识别结果。因此,本申请提出的技术方案实现了先矫正再识别,不会导致印章中文字被截断,有利于提升印章的文字识别结果的准确度。
17、进一步地,本申请实施例提出的技术方案对于同一个印章,仅需文字识别一次即可,无需像相关技术中一样对于一个印章划分的多个分段图像分别进行文字识别。因此,本申请还减少了印章文字识别的次数,提升了印章文字识别的效率。
1.一种印章文字识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述从所述印章文字区域中确定至少两对匹配点,包括:
3.根据权利要求2所述的方法,其特征在于,所述根据所述法线与所述印章文字区域的轮廓的至少一个交点,确定所述外轮廓点对应的内轮廓点,包括:
4.根据权利要求2所述的方法,其特征在于,所述方法还包括:
5.根据权利要求2所述的方法,其特征在于,所述对所述印章文字区域的外轮廓进行拟合,得到所述外轮廓所在的椭圆之前,还包括:
6.根据权利要求5所述的方法,其特征在于,所述从所述印章文字区域中确定至少两对匹配点之后,还包括:
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
8.根据权利要求7所述的方法,其特征在于,所述矫正后的子区域为长方形区域;
9.根据权利要求1所述的方法,其特征在于,所述对矫正后的所述印章文字区域进行文字识别,得到所述印章的文字识别结果之前,还包括:
10.根据权利要求9所述的方法,其特征在于,所述对矫正后的所述印章文字区域进行文字颜色分离,得到文字颜色分离后的所述印章文字区域,包括:
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
12.根据权利要求1所述的方法,其特征在于,所述基于印章图像,确定所述印章图像中的印章文字区域,包括:
13.根据权利要求12所述的方法,其特征在于,所述根据所述印章区域,确定所述印章图像中的印章文字区域,包括:
14.根据权利要求1所述的方法,其特征在于,所述方法还包括:
15.根据权利要求14所述的方法,其特征在于,所述构建训练样本集,包括:
16.一种印章文字识别装置,其特征在于,所述装置包括:
17.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有计算机程序,所述计算机程序由所述处理器加载并执行以实现如权利要求1至15任一项所述的印章文字识别方法。
18.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至15任一项所述的印章文字识别方法。
19.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序由处理器加载并执行以实现如权利要求1至15任一项所述的印章文字识别方法。