一种图片字体识别方法、系统、电子设备及存储介质与流程

文档序号：33001078发布日期：2023-01-18 01:15阅读：68来源：国知局

1.本发明涉及文字识别技术领域，特别是涉及一种图片字体识别方法、系统、电子设备及存储介质。

背景技术：

2.随着科技发展趋于智能化数字化，提取图片文字需求日益增多。人们对可视化操作越发依赖，对于图像文字识别技术而言，识别技术逐渐成熟。光学字符识别（optical character recognition，ocr）就是图像文字识别技术中的一种。然而，大多数人的字体识别能力是非常有限的，因为目前的常用文字(如中文、英文)字体繁多，可能高达数千种，且某些字体类别之间的差异微乎其微，即使是专业人士，也需要长时间的记忆训练才能具备一定的字体识别能力，而且能分辨的字体类别也是有限的，因此，基于图片的字体识别技术在文档图像处理和艺术设计领域一直是一项重要的技术，尤其相较设计行业而言，方便快捷的转化识别图片上的字体并且输出相应内容的字体格式显得尤为重要，尤其人们对知识产权更加重视，字体版权相关信息，也是需要考虑的因素。

技术实现要素：

3.本发明的目的是提供一种图片字体识别方法、系统、电子设备及存储介质，提高了图片中文字识别的准确性和全面性。
4.为实现上述目的，本发明提供了如下方案：一种图片字体识别方法，包括：对待识别图片进行预处理，获得文字轮廓图像；增强所述文字轮廓图像的饱和度和对比度，获得文字轮廓增强图像；将所述文字轮廓增强图像进行区域划分，划分为设定数量的区域；获取所述文字轮廓增强图像中各区域的特征值；将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配，获得多个匹配值，将最高匹配值对应的所述字模库中文字信息输出，所述文字信息包括字形和字体类型；所述字模库中每条信息包括字形、字体类型和各区域的特征值；所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值，所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
5.可选地，所述将所述文字轮廓增强图像进行区域划分，划分为设定数量的区域，具体包括：按照九宫格形式将所述文字轮廓增强图像划分为9个区域。
6.可选地，所述字模库的构建过程包括：获取各种开源字体文字；将各开源字体文字进行区域划分，划分为设定数量的区域；获取各开源字体文字对应的各区域的特征值；
将各开源字体文字的字形、字体类型和各区域的特征值存储所述字模库；一个开源文字对应一条存储信息。
7.可选地，所述对待识别图片进行预处理，获得文字轮廓图像，具体包括：对所述待识别图片进行背景阈值化处理，获得文字轮廓图像。
8.可选地，所述字体包括黑体、宋体和楷体。
9.本发明公开了一种图片字体识别系统，包括：文字轮廓图像获取模块，用于对待识别图片进行预处理，获得文字轮廓图像；文字轮廓图像增强模块，用于增强所述文字轮廓图像的饱和度和对比度，获得文字轮廓增强图像；区域划分模块，用于将所述文字轮廓增强图像进行区域划分，划分为设定数量的区域；特征值获取模块，用于获取所述文字轮廓增强图像中各区域的特征值；特征值匹配模块，用于将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配，获得多个匹配值，将最高匹配值对应的所述字模库中文字信息输出，所述文字信息包括字形和字体类型；所述字模库中每条信息包括字形、字体类型和各区域的特征值；所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值，所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
10.本发明还公开了一种电子设备，包括存储器及处理器，所述存储器用于存储计算机程序，所述处理器运行所述计算机程序以使所述电子设备执行所述的图片字体识别方法。
11.本发明还公开了一种计算机可读存储介质，其存储有计算机程序，所述计算机程序被处理器执行时实现所述的图片字体识别方法。
12.根据本发明提供的具体实施例，本发明公开了以下技术效果：本发明获得待识别图片中文字各区域的特征值，将各特征值与字模库中对应的各特征值进行相似度匹配，将相似度最高的的匹配值对应的字模库中文字信息输出，其中特征值包括字形和与字形对应的字体类型，从而提高了图片中文字识别的准确性和全面性。
附图说明
13.为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。
14.图1为本发明一种图片字体识别方法流程示意图；图2为本发明文字轮廓增强图像区域划分示意图；图3为本发明一种图片字体识别系统结构示意图。
具体实施方式
15.下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于
本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
16.本发明的目的是提供一种图片字体识别方法、系统、电子设备及存储介质，提高了图片中文字识别的准确性。
17.为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。
18.实施例1图1为本发明一种图片字体识别方法流程示意图，如图1所示，一种图片字体识别方法，包括：步骤101：对待识别图片进行预处理，获得文字轮廓图像。
19.一个文字对应一个文字轮廓图像。
20.提取的文字轮廓图像必须保证其文字笔画与矩形图片边缘相切，以确保每个区域中文字部分的占比达到最大，提高准确性。
21.其中，步骤101具体包括：对所述待识别图片进行背景阈值化处理，即对待识别图片的背景进行过滤，对文字进行定位分割，通过文字间距空白处进行定位，将待识别图片分割成一个个单独的文字，获得每个文字的文字轮廓图像。
22.步骤102：增强所述文字轮廓图像的饱和度和对比度，获得文字轮廓增强图像。
23.本发明对文字轮廓图像的增强用以更精确的提取出文字内容。
24.步骤103：将所述文字轮廓增强图像进行区域划分，划分为设定数量的区域。
25.其中，步骤103具体包括：按照九宫格形式将所述文字轮廓增强图像划分为9个区域。
[0026]“字”字划分为9个区域如图2所示。
[0027]
步骤104：获取所述文字轮廓增强图像中各区域的特征值。
[0028]
各区域的特征值为各区域文字轮廓的坐标组成的特征向量。
[0029]
分割的每块区域中的特征，以相量坐标的形式将区域中的文字轮廓的边界进行定位，即字体轮廓在分割的不同区域里均可以采集几个边界处的定位点相量坐标值，如单独分割区域中的最左、最右、最上和最下坐标值。
[0030]
步骤105：将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配，获得多个匹配值，将最高匹配值对应的所述字模库中文字信息输出，所述文字信息包括字形和字体类型；所述字模库中每条信息包括字形、字体类型和各区域的特征值；所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值，所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
[0031]
区域的特征值的相似度为特征向量之间的距离。
[0032]
作为具体实施方式：获取各区域的定位点与字模库中各文字的各区域的定位点进行匹配，将定位点重叠的数量作为匹配值。即各区域的特征值为各区域的定位点坐标值。
[0033]
本发明图片文字识别结果包括生成的相应分析字体的图片识别文案和对应的可导出矢量文件及透明背景格式。
[0034]
所述字模库的构建过程包括：
获取各种开源字体文字。
[0035]
将各开源字体文字进行区域划分，划分为设定数量的区域。
[0036]
按照九宫格形式将各开源字体文字划分为9个区域。如图2所示，9个区域依次是中间n1、中间上边n2、中间下边n3、中间左边n4、中间右边n5、左上n6、右上n7、左下n8、右下n9，对这9个区域的特征值进行计算和存储，以便后续比对。
[0037]
对文字进行划分的区域数量可以根据文字复杂程度进行增加或减少，以提高准确性和识别速率。
[0038]
获取各开源字体文字对应的各区域的特征值。
[0039]
将各开源字体文字的字形、字体类型和各区域的特征值存储所述字模库；一个开源文字对应一条存储信息。
[0040]
所述字体包括黑体、宋体和楷体。
[0041]
本发明字模库及本发明一种图片字体识别方法部署在云平台。
[0042]
字模库中还包括不同语种的文字，语种包括汉字和英文。
[0043]
实施例2图3为本发明一种图片字体识别系统结构示意图，如图3所示，一种图片字体识别系统，包括：文字轮廓图像获取模块201，用于对待识别图片进行预处理，获得文字轮廓图像。
[0044]
文字轮廓图像增强模块202，用于增强所述文字轮廓图像的饱和度和对比度，获得文字轮廓增强图像。
[0045]
区域划分模块203，用于将所述文字轮廓增强图像进行区域划分，划分为设定数量的区域。
[0046]
特征值获取模块204，用于获取所述文字轮廓增强图像中各区域的特征值。
[0047]
特征值匹配模块205，用于将所述文字轮廓增强图像的特征值与字模库中各文字的特征值进行相似度匹配，获得多个匹配值，将最高匹配值对应的所述字模库中文字信息输出，所述文字信息包括字形和字体类型；所述字模库中每条信息包括字形、字体类型和各区域的特征值；所述文字轮廓增强图像的特征值包括所述文字轮廓增强图像各区域的特征值，所述字模库中各文字的特征值包括各文字对应的各区域的特征值。
[0048]
本发明一种图片字体识别系统部署在云平台。
[0049]
实施例3本发明实施例3提供一种电子设备包括存储器及处理器，该存储器用于存储计算机程序，该处理器运行计算机程序以使电子设备执行实施例1的图片字体识别方法。
[0050]
可选地，上述电子设备可以是服务器。
[0051]
另外，本发明实施例3还提供一种计算机可读存储介质，其存储有计算机程序，该计算机程序被处理器执行时实现实施例1的图片字体识别方法方法。
[0052]
本说明书中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。
[0053]
本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说
明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处。综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：牟文青王晓菲杨西帅姜远鹏吴忠洋王冰
技术所有人：山东捷瑞数字科技股份有限公司
我是此专利的发明人

上一篇：一种体育训练球门的制作方法
上一篇：一种地质勘探用地质影像的地质标记解译建模方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。