文字识别方法、相关装置及存储介质与流程

文档序号：36505750发布日期：2023-12-28 14:32阅读：43来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本申请实施例涉及文字识别领域，更具体地涉及一种文字识别方法、相关装置及存储介质。

背景技术：

1、艺术字在广告、设计、排版等领域扮演着重要角色，以其独特的风格和形态吸引人们的注意，给作品增添了艺术性和个性化。

2、然而，艺术字存在形变、扭曲等特点，导致传统的文字识别方法对形变较大的文字识别效果较差。

技术实现思路

1、本申请实施例提供一种文字识别方法、相关装置及存储介质，可以对目标图像中包含的文字进行识别，得到识别结果，能够利用角点数据识别文字的形变，提高了对形变较大的文字的识别效果。

2、第一方面，本申请实施例提供一种文字识别方法，该方法包括：获取目标图像，基于目标图像，确定目标图像中包含的文字对应的角点数据，角点数据用于表征多个角点的位置；基于角点数据，对目标图像中包含的文字进行识别，得到识别结果。

3、在一个实施方式中，基于角点数据，对目标图像中包含的文字进行识别，得到识别结果，包括：利用角点数据以及各角点的权重，提取目标图像的图像特征；基于目标图像的图像特征，对目标图像中包含的文字进行识别，得到识别结果。

4、在一个实施方式中，目标图像包含的文字存在交叠，基于目标图像，确定目标图像中包含的文字对应的角点数据，包括：基于图像分割模型处理目标图像，得到每个文字对应的图像区域；对每个文字对应的图像区域中的角点进行识别，得到目标图像中包含的文字对应的角点数据。

5、在一个实施方式中，基于图像分割模型处理目标图像，得到每个文字对应的图像区域，包括：将目标图像对应的文本描述和目标图像输入图像分割模型，得到每个文字对应的图像区域。

6、在一个实施方式中，基于角点数据，对目标图像中包含的文字进行识别，得到识别结果，包括：将角点数据、目标图像、目标图像对应的文本描述和每个文字对应的图像区域输入文字识别模型，得到识别结果。

7、在一个实施方式中，利用角点数据以及各角点的权重，提取目标图像的图像特征是基于神经网络模型实现的。

8、在一个实施方式中，神经网络模型根据以下方式得到：获取至少一个样字对应的样本图像集、以及样本图像集中的每幅样本图像中包含的样字对应的角点数据，其中，样本图像集中包括至少一个样字各自对应的至少一幅样本图像；基于至少一个样字对应的样本图像集、以及样本图像集中的每幅样本图像中包含的样字对应的角点数据，训练初始神经网络模型，得到神经网络模型。

9、在一个实施方式中，每个样字对应的样本图像包括正样本图像和负样本图像，基于至少一个样字对应的样本图像集、以及样本图像集中的每幅样本图像中包含的样字对应的角点数据，训练初始神经网络模型，得到神经网络模型，包括：针对每个样字，基于样字对应的样本图像集和角点数据，提取样字的正样本图像对应的图像不变特征和样字的负样本图像对应的图像变化特征；基于图像不变特征和图像变化特征，确定样字的字符损失值；如果字符损失值不满足预设收敛条件，则基于字符损失值，调整初始神经网络模型的权重参数；基于样字对调整后的初始神经网络模型进行迭代训练，直至所得到的字符损失值满足预设收敛条件，得到神经网络模型。

10、第二方面，本申请实施例提供一种文字识别装置，具有实现对应于上述第一方面提供的文字识别方法的功能。功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，模块可以是软件和/或硬件。

11、在一个实施方式中，文字识别装置包括：获取模块，被配置为获取目标图像；角点识别模块，被配置为基于目标图像，确定目标图像中包含的文字对应的角点数据，角点数据用于表征多个角点的位置；文字识别模块，被配置为基于角点数据，对目标图像中包含的文字进行识别，得到识别结果。

12、第三方面，本申请实施例提供一种计算设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，处理器执行计算机程序时实现第一方面所提及的方法。

13、第四方面，本申请实施例提供一种计算机可读存储介质，其包括指令，当其在计算机上运行时，使得计算机执行如第一方面所提及的方法。

14、第五方面，本申请实施例提供一种包含指令的计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述第一方面所提及的方法。

15、第六方面，本申请实施例提供一种芯片，该芯片中包括与终端设备的收发器耦合的处理器，用于执行本申请实施例第一方面所提及的技术方案。

16、第七方面，本申请实施例提供一种芯片系统，该芯片系统包括处理器，用于支持终端设备实现上述第一方面所涉及的功能，例如，生成或者处理上述第一方面提供的方法中所涉及的信息。

17、在一种可能的设计中，上述芯片系统还包括存储器，该存储器用于保存终端必需的程序指令和数据。该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

18、相比于传统的文字识别方法，本申请实施例提供的文字识别方法，先确定目标图像中包含的文字对应的角点数据，然后基于角点数据，对目标图像中包含的文字进行识别，得到识别结果，而不是传统的文字识别方法中的仅仅基于目标图像进行文字识别。因此，本申请实施例提供的文字识别方法，可以在进行文字识别时，参考文字的角点信息来确定目标图像中包含的文字的不变特征，从而利用角点数据定位文字的形变，指导对文字识别的过程，可以提高对形变较大的文字的识别效果。

技术特征：

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的文字识别方法，其特征在于，所述基于所述角点数据，对所述目标图像中包含的文字进行识别，得到识别结果，包括：

3.根据权利要求1或2所述的文字识别方法，其特征在于，所述目标图像包含的文字存在交叠，所述基于所述目标图像，确定所述目标图像中包含的文字对应的角点数据，包括：

4.根据权利要求3所述的文字识别方法，其特征在于，所述基于图像分割模型处理所述目标图像，得到每个所述文字对应的图像区域，包括：

5.根据权利要求4所述的文字识别方法，其特征在于，所述基于所述角点数据，对所述目标图像中包含的文字进行识别，得到识别结果，包括：

6.根据权利要求2所述的文字识别方法，其特征在于，所述利用所述角点数据以及各角点的权重，提取所述目标图像的图像特征是基于神经网络模型实现的。

7.根据权利要求6所述的文字识别方法，其特征在于，所述神经网络模型根据以下方式得到：

8.根据权利要求7所述的文字识别方法，其特征在于，每个所述样字对应的样本图像包括正样本图像和负样本图像，

9.一种文字识别装置，其特征在于，包括：

10.一种计算设备，其特征在于，其包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述的方法。

11.一种计算机可读存储介质，其特征在于，其包括指令，当其在计算机上运行时，使得所述计算机执行如权利要求1至8任一项所述的方法。

12.一种包含指令的计算机程序产品，所述计算机程序产品包括程序指令，当所述程序指令在计算机或处理器上运行时，使得所述计算机或所述处理器执行如权利要求1至8任一项所述的方法。

13.一种芯片系统，其特征在于，该芯片系统包括：

技术总结
本申请实施例涉及OCR技术领域，提供一种文字识别方法、相关装置及存储介质，文字识别方法包括：获取目标图像；基于目标图像，确定目标图像中包含的文字对应的角点数据，角点数据用于表征多个角点的位置；基于角点数据，对目标图像中包含的文字进行识别，得到识别结果。本申请实施例可以在进行文字识别时，参考文字的角点信息来确定目标图像中包含的文字的不变特征，从而利用角点数据定位文字的形变，指导对文字识别的过程，可以提高对形变较大的文字的识别效果。

技术研发人员：请求不公布姓名,请求不公布姓名,请求不公布姓名
受保护的技术使用者：北京瑞莱智慧科技有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：请求不公布姓名请求不公布姓名请求不公布姓名
技术所有人：北京瑞莱智慧科技有限公司
我是此专利的发明人

上一篇：检测心力衰竭或阿尔兹海默症标志物的装置
上一篇：一种数据处理方法及装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。