基于深度学习的手写体数学公式识别方法与流程

文档序号:21366123发布日期:2020-07-04 04:41阅读:808来源:国知局
基于深度学习的手写体数学公式识别方法与流程

本发明涉及人工智能领域,更具体地说,它涉及一种基于深度学习的手写体数学公式识别方法。



背景技术:

随着科技的发展,在信息的传播时,将信息以电子文稿或图片的方式进行传播的方式也越来越广泛,但是在一些学术论文中,其中包含了大量的公式,对于一些使用者来说,使用电子产品输入文字就已经较为吃力,更何况是更为复杂的公式输入撰写,导致很多使用者不会使用,而且在word、wps等排版工具中输入公式是一项非常费时费力的工作,更加大了使用者的使用难度,影响了使用者的使用速度;

所以现今社会出现了利用人工神经网络等技术进行深度学习的智能识别系统,以达到将手写体公式转化成书面公式的效果,人工神经网络虽然是较为成熟的人工智能技术,但是由于每个人手写习惯的影响,在实际应用过程中仍然有极大可能出现识别误差,当出现识别错误时,就需要使用者去手动输入修正,但是遇到一些复杂的公式在进行修改时,如果是其中一个复杂的子式出现错误,修正时需要输入该复杂的子式,对使用者来说,工作量也非常的大,有着不亚于直接输入公式的复杂程度,使得智能识别系统失去它该有的工作性能,不利于实际使用。



技术实现要素:

本发明的目的是提供一种基于深度学习的手写体数学公式识别方法,能够在智能识别系统识别手写体公式错误的情况下,以最小的工作量对公式进行调整,从而达到方便使用者实际使用的效果。

本发明的上述技术目的是通过以下技术方案得以实现的:基于深度学习的手写体数学公式识别方法,包括以下步骤:

s1、向公式识别系统的识别模块中导入手写公式图片,并由所述识别模块识别出初步识别公式导入至所述可编辑模块;

s2、所述可编辑模块根据识别出的初步识别公式中的字符,对所述初步识别公式中包含的所有修改字符位进行优先级等级划分;

s3、所述可编辑模块根据修改字符位的优先级等级从第一级至最后一级的顺序对所述初步识别公式的所有修改字符位依次进行确认,直至所有修改字符位均被确认完成后,导出最终识别公式。

作为本发明的一个优选方案,一个修改字符位包括至少一个单字符。

作为本发明的一个优选方案,所述优先级等级按照等级数越小则优先级越高的顺序进行排序。

作为本发明的一个优选方案,一个公式包括若干个平行的第一级修改字符位。

作为本发明的一个优选方案,一个第n级的修改字符位里包含了若干个其属下的第n+1级的修改字符位。

作为本发明的一个优选方案,当第n级的修改字符位被确认成功时,则其属下的若干个第n+1级的修改字符位也被确认成功,当第n级的修改字符位被确认失败时,将对若干个所述第n+1级的修改字符位逐次进行确认。

作为本发明的一个优选方案,所述公式识别系统包括识别模块和可编辑模块,所述识别模块配置有人工神经网络,用于对现有的公式图片进行深度学习,达成识别出所述初步识别公式的效果;所述可编辑模块用于对所述识别模块识别出的所述初步识别公式按照所述修改字符位的优先级等级进行逐位确认。

作为本发明的一个优选方案,所述识别模块的识别原理为:设立有识别数据库,并对人工神经网络设立若干抓取特征值,并对所有所述抓取特征值建立权重参数,通过对所述抓取特征值的权重参数进行计算,而从所述识别数据库中找出识别字符并组合排列后导出所述初步识别公式。

作为本发明的一个优选方案,所述可编辑模块在进行确认一个修改字符位时,还将提供若干候选识别字符。

作为本发明的一个优选方案,所述可编辑模块的显示选择对话框的选项包括:正确、错误以及若干候选识别字符。

综上所述,本发明具有以下有益效果:以二叉树形的确认结构对初步识别公式进行确认和调整,使用者实际的工作是以最小程度的改动达到修正识别公式的工作,能够节省使用者大量的时间,并且在修改字符位进行确认时包含了若干个候选识别公式,使用者只需选择即可,最终需要手动输入的可能性很小,方便实际使用。

附图说明

图1是本发明的公式识别流程图;

图2是本发明的一个初步识别公式结构图;

图3是图2的初步识别公式确认示意图。

具体实施方式

以下结合附图对本发明作进一步详细说明。

如图1所示,本发明提供一种基于深度学习的手写体数学公式识别方法,其特征是:包括以下步骤:

s1、向公式识别系统的识别模块中导入手写公式图片,并由识别模块识别出初步识别公式导入至可编辑模块;

s2、可编辑模块根据识别出的初步识别公式中的字符,对初步识别公式中包含的所有修改字符位进行优先级等级划分;

s3、可编辑模块根据修改字符位的优先级等级从第一级至最后一级的顺序对初步识别公式的所有修改字符位依次进行确认,直至所有修改字符位均被确认完成后,导出最终识别公式。

具体的,一个修改字符位包括至少一个单字符。

具体的,优先级等级按照等级数越小则优先级越高的顺序进行排序。

具体的,一个公式包括若干个平行的第一级修改字符位。

具体的,一个第n级的修改字符位里包含了若干个其属下的第n+1级的修改字符位。

具体的,当第n级的修改字符位被确认成功时,则其属下的若干个第n+1级的修改字符位也被确认成功,当第n级的修改字符位被确认失败时,将对若干个第n+1级的修改字符位逐次进行确认。

具体的,公式识别系统包括识别模块和可编辑模块,识别模块配置有人工神经网络,用于对现有的公式图片进行深度学习,达成识别出初步识别公式的效果;可编辑模块用于对识别模块识别出的初步识别公式按照修改字符位的优先级等级进行逐位确认。

识别模块的识别原理为:设立有识别数据库,并对人工神经网络设立若干抓取特征值,并对所有抓取特征值建立权重参数,通过对抓取特征值的权重参数进行计算,而从识别数据库中找出识别字符并组合排列后导出初步识别公式。由于人工神经网络应用于图片识别的技术已经较为成熟,领域内普通技术人员较为了解,此处便不做赘述。

可编辑模块在进行确认一个修改字符位时,还将提供若干候选识别字符。

可编辑模块的显示选择对话框的选项包括:正确、错误以及若干候选识别字符。

在本发明中需要注意的是:在对最后一级优先级等级的修改字符位确认时,如果候选识别字符也没有正确的,这时本系统将提供手动输入的功能,虽然本发明的基于深度学习的公式识别系统具有相当高的精度,但是人工智能并不能完全智能的服务于人类,所以仍然留出使用者的修改空间,以确保导出公式的精度。

本发明所提及的公式识别系统为能够运行于电脑或者手机等智能终端的应用系统,利用计算机程序执行上述提及的所有方法和功能。

具体的,优先级等级按照等级数越小则优先级越高的顺序进行排序;一个公式包括若干个平行的第一级修改字符位;一个第n级的修改字符位里包含了若干个其属下的第n+1级的修改字符位;当第n级的修改字符位被确认成功时,则其属下的若干个第n+1级的修改字符位也被确认成功,当第n级的修改字符位被确认失败时,将对若干个第n+1级的修改字符位进行确认,直到最后一级的修改字符位进行确认成功,再返回上一级的平行的修改字符位进行确认,循环下去,直到得到正确的最终识别公式;

如图2所示,假设一个初步识别公式包括两个第一级的修改字符位,第一级的修改字符位包括两个第二级修改字符位,各个修改字符位的编号也如图2所示;对图3所示的初步识别公式确认的过程为:

首先对初步识别公式进行确认,如果为正确的则直接勾选“正确”选项,完成确认;如果不正确,就在候选识别字符中查看是否有正确的,如果有则选择正确的候选识别字符,完成确认;如果没有正确的,就点选“错误”进入到第一级优先级等级的修改字符位中进行确认;

则第一级修改字符位1和第一级修改字符位2中至少有一个为错误的,这时候分别对其进行确认,同上述识别初步识别公式的确认相同,如果第一级修改字符位1为正确的则直接勾选“正确”选项,完成确认;这时再对第一级修改字符位2进行确认;如果第一级修改字符位1不正确,就在候选识别字符中查看是否有正确的,如果有则选择正确的候选识别字符,完成确认;如果没有正确的,就点选“错误”进入到第二级修改字符位11和第二级修改字符位12中进行确认;

此时第二级修改字符位11和第二级修改字符位12至少有一个是错的,这时候分别对其进行确认,如果第二级修改字符位11为正确的则直接勾选“正确”选项,完成确认;这时再对第二级修改字符位12;第二级修改字符位11,就在候选识别字符中查看是否有正确的,如果有则选择正确的候选识别字符,完成确认;如果没有正确的,就可以手动输入正确的字符,完成确认;

上述第一级修改字符位2和第二级修改字符位12的确认过程分别和第一级修改字符位1与第二级修改字符位11的确认过程相同,最终完成整个初步识别公式的确认。

以下是本发明的一个具体应用实例,假设手写体的公式为和差化积公式“”,由于手写识别误差,导致经过识别模块识别导出的初步识别公式为,此时可以看出,公式是有误的,所以通过可编辑模块在候选识别字符中选择正确的,若是没有正确的,就选择“错误”选项,进入到第一级的修改字符位进行确认;第一级的修改字符位是这三个字符,此时我们可以得到第一级的第三个字符有误,通过可编辑模块能够依次对第一个字符和第二个字符进行确认正确的选择,对第三个字符进行确认时,先在候选识别公式内找有没有正确的,有的话就选择正确的候选识别公式,没有就继续第二级的确认,一直进行下去,直到得出

本发明以二叉树形的确认结构对初步识别公式进行确认和调整,使用者实际的工作是以最小程度的改动达到修正识别公式的工作,能够节省使用者大量的时间,并且在修改字符位进行确认时包含了若干个候选识别公式,使用者只需选择即可,最终需要手动输入的可能性很小,方便实际使用。

以上所述仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1