基于区块链机制的OCR深度学习方法、存储介质与流程

文档序号:16882939发布日期:2019-02-15 22:21阅读:374来源:国知局
基于区块链机制的OCR深度学习方法、存储介质与流程
本发明涉及ocr深度学习方法,具体涉及基于区块链机制的ocr深度学习方法、存储介质。
背景技术
:目前常见的ocr方案是基于滑动窗口全图扫描的自上而下的方式和基于底层规则先分割得到小区域再组合成文字区域的自底而上的方式。而ocr的深度学习则是基于hog特征输入的5层cnn网络作为ocr识别模型。在识别网络训练中,cnn要识别复杂的文字,面临的问题就是如何获取足够多的符合多样性的训练样本,而只有训练的样本满足多样性才能保证训练出符合业务需求的ocr识别网络。传统的文字识别是采用基于模板匹配的方式,对特征描述要求较高,很难满足复杂环境下的识别,目前深度学习是基于cnn网络的学习,是独立进行的。每次学习都需要庞大且多样的数据样本,包括字体、颜色、背景等。据现有的产品来看,对于手写体的识别率并没有达到印刷体识别率的稳定性。阻碍手写识别最大的问题就是识别样本数据不足,使得在5层cnn网络中机器的学习没有达到要求。而目前的艺术字、个性签名等字体越来越多,对于ocr来说,需要不断的对新的字体进行学习。而每多一种字体,仅以汉字为例就多了上万种文字,就需要大量的学习时间。那么通过区块链的数据共享特征可以解决这一问题。对于新数据的学习,各个公司都在比速度,对于ocr来说,cnn并不是难题,关键在于谁更快的对新文字进行识别学习,而通过区块链对数据的私有保护特性,能在状态和状态对应的回报选取、固定模型阶段保护私有数据。ocr的识别应用慢慢更多转向了金融行业,不论是票据、数字签名,都具有一定的私有性,而ocr识别后,只会确定文字内容,并不会对文字作保护。那么通过区块链的私有数据机制和确权属性便可以对数据行保护。技术实现要素:本发明所要解决的技术问题是:提供基于区块链机制的ocr深度学习方法、存储介质,不仅大大减少学习时间;同时还能将训练模型私有化保护,提高学习价值。为了解决上述技术问题,本发明采用的技术方案为:基于区块链机制的ocr深度学习方法,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。本发明提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器处理时,能实现上述基于区块链机制的ocr深度学习方法所包含的步骤。本发明的有益效果在于:首先,通过区块链的数据共享特征,不仅能够保证ocr识别数据可以被所有机器进行复用,而且还能依据共享数据显著提升学习效率,从而大大缩减学习时间;其次,通过区块链的私有保护和确权属性,不仅能够在获取训练模型阶段保证训练模型的私有性,有助于快速研发,提高企业价值;而且在识别存储数据阶段,还能保证用户数据隐私。附图说明图1为本发明基于区块链机制的ocr深度学习方法的流程示意图;图2为本发明实施例一的流程示意图。具体实施方式为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。本发明最关键的构思在于:通过区块链的数据共享特征,保证被学习数据可以被所有机器复用;通过区块链的私有保护和确权属性,在训练模型阶段,保证产品私有性,有助于快速研发,提高企业价值;而且在识别存储数据阶段,还能保证用户数据隐私。本发明涉及的技术术语解释:技术术语解释ocr深度学习手写识别的自我学习能力区块链机制基于区块链网络的存储特性状态深度学习时传递的动作数据状态对应的回报动作发生后产生的结果数据模型希望达到的结果训练模型优化后的模型,即深度学习数据卷积深度学习通过卷积神经网络进行自我学习固定模型固定目标,防止学习过程发生抖动cnn卷积神经网络请参照图1,本发明提供基于区块链机制的ocr深度学习方法,包括:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据;私有存储模型至区块链网络的各节点;随机挑选模型中的状态进行训练,并获取状态对应的新回报;依据所述新回报优化模型,获取对应所述模型的训练模型,并将其私有存储至各节点;依据数量足够多的模型对应的训练模型集进行卷积深度学习;共享存储卷积深度学习的结果至各节点。从上述描述可知,本发明的有益效果在于:通过本申请进行新字体的ocr深度学习及识别,通过区块链存储的私有属性,首先可以保证所选取的学习数据的训练模型得以私有化保存,防止商业间谍;其次将学习数据存储于区块链网络中,只要满足单种字体的所有笔画学习,即可通过区块链网络平台的共享性将笔画组合成字体,无需对文字全部进行识别,大大减少所学习的时长。进一步的,所述获取对应所述模型的训练模型,具体为:固定优化后的模型,以固定后的模型作为所述模型的训练模型。由上述描述可知,通过将模型固定,防止训练时出现诸如抖动等问题,从而提高训练的稳定性和准确性。进一步的,还包括:共享存储ocr识别数据至区块链网络的各节点。由上述描述可知,利用区块链的共享机制,实现ocr识别数据的资源共享,以减少ocr识别的学习时间。进一步的,所述依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据,具体为:从ocr识别数据中选取一单字的学习数据;从所述学习数据中随机选取预设个数的子学习数据作为状态,学习结果作为状态对应的当下回报,创建由多个状态及其各自对应的当下回报构成的与所述一单字对应的模型。由上述描述可知,对应单字创建模型,并优化得到单个训练模型。在模型(单字)总数量足够多,足以覆盖该类字体所有笔画特征的情况下,便可只需通过对这些模型的深度学习,即可轻松、快速、准确地掌握这类字体的识别方法,而无需对所有的识别数据都进行学习,从而大大减少学习时间。进一步的,所述依据数量足够多的模型对应的训练模型集进行卷积深度学习,具体为:依据覆盖字体所有笔画特征的多个模型对应的训练模型集,通过5层卷积神经网络进行ocr深度学习。由上述描述可知,只需确保训练模型集能覆盖目标字体的所有笔画特征,便可通过深度学习掌握该类字体的识别方式,而无需对所有的识别数据都进行学习,不仅显著提升了学习效率,减少学习时间,而且又能保证学习的准确性。同时,在一具体实施方式中,通过5层cnn来保证学习的准确性。进一步的,所述依据所述新回报优化模型,具体为:通过bellman方程动态优化模型,获取由最接近模型的状态及其对应的回报构成的训练模型。由上述描述可知,在一具体实施方式中,通过上述方式优化模型,能高效自动筛选出最优策略,获取训练模型。本发明提供的另一个技术方案为:一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器处理时,能实现上述基于区块链机制的ocr深度学习方法所包含的步骤。对应本领域普通技术人员可以理解实现上述技术方案中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来实现的,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时,可包括如上述各方法的流程。其中,所述的存储介质可以是磁盘、光碟、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。实施例一请参照图2,本实施例为对图2的进一步限定,提供一种基于区块链机制的ocr深度学习方法,包括以下步骤:s1:搭建区块链网络平台。搭建一个区块链网络平台,即区块链网络,所述区块链网络平台的各个节点存储相同的数据,且默认开放使用。s2:共享存储ocr识别数据至区块链网络的各节点。基于区块链的数据共享特向,使得ocr识别数据可以被任一机器获取,实现可复用。例如,一款新的个性化字体面世,如果想要能够识别该字体,则需要对其ocr识别数据进行深度学习。s2:依据学习数据创建由各状态及其对应的当下回报构成的模型,所述各状态对应学习数据中各子学习数据。具体而言,可以包括以下子步骤:s21:从ocr识别数据中选取一单字的学习数据;s22:从该单字对应的学习数据中随机选取出一部分数据(即子学习数据)作为状态,对所选取的子学习数据进行学习后获取的学习结果作为该状态对应的当下回报;创建由预设个数的状态(依据预设个数进行对应次数的随机选取)及各个状态各自对应的当下回报所构成的模型。一个模型对应一个单字(的学习数据)。在ocr深度学习过程中,所述状态为卷积神经网络工作时,所传递的状态;所述状态对应的回报为状态传递后给出的结果。也就是说,当机器开始深度学习时,会传递一些状态数据,比如告诉网络进行扫描、窗口平移;状态对应的回报为:当状态发生后,所产生的回报数据,即结果,比如像素值。在本实施例中,所述状态为从学习数据中随机给定的一个状态,即随机选择的一个子学习数据;所述状态对应的回报为当下的这个状态行为所获得的回报,即学习时返回的结果。s3:私有存储模型至区块链网络的各节点。即将每一个状态和状态对应的当下回报私有存储于区块链网络中,即私有化、确权化,将模型保护起来,只有自己可查,一方面出于对产权信息的保护及快速开发理念,需要对状态和状态对应的回报私有化;另一方面通过将企业自身构建的模型(企业自身产品)的私有性,有助于快速研发。s4:随机挑选模型中的状态进行训练,并获取状态对应的新回报;s5:依据所述新回报自动优化模型,获取对应所述模型的优化后的模型。即随机从模型中挑选出一些状态进行训练,并使用这些状态对模型进行自动优化。可选的,通过bellman方程动态规划出最优的数据。这是由于状态和状态对应的回报是随机产生,越趋于正确的状态,所得到的回报越准确,因此,可以通过穷举分析找出最适的状态。所述的自动优化为系统在对状态对应的回报分析时,自动选出最接近模型的状态和状态对应的回报,优选通过bellman方程动态规划理论进行优化,不论初始状态和初始决策如何,以第一块决策所形成的阶段和状态作为初始条件考虑时,余下的决策对余下的问题而言也构成最优策略。以本实施例为例,当a方式为最优时,会通过ballman方程计算出下一步决策,自动筛选出后续所有的最优策略,即选择最接近既定模型的状态和状态对应的回报,得到优化后的模型。这样做的目的是使得训练样本之间的时间依赖消失。s6:固定优化后的模型,以固定后的模型作为所述模型的训练模型,并将训练模型私有存储至各节点。即将优化后的模型固定住,便得到对应该单字的训练模型,并私有存储于区块链网络中。所述的训练模型指的是对应所选取学习数据,经过优化选取的模型后得到的最优模型;需要对训练模型进行私有保护;这样固定住使得模型所得到的最优策略(即训练模型)不会发生变化,训练时不会出现诸如抖动等问题,从而提高学习准确性。s7:依据数量足够多的模型对应的训练模型集进行卷积深度学习。首先,所述数量足够多的模型,对应的是能够覆盖该类字体所有笔画特征的模型集合。单个训练模型对应的是该类字体一单字的目标学习模型,因此单个训练结果针对的是该类字体的某个单字做出的准确的学习结果。单个训练模型的深度学习结果,即单个训练结果也将私有存储在区块链网络中。由于一类字体(如汉字)的字体数量通常是庞大的,单个字无法作为样本数据,因此需要将单个训练结果私有保存下来,当获取能够覆盖该类字体全部笔画的字集合所对应的训练模型集合,并全部学习成果后,即对所有笔画全部识别成功后,即可实现对该类字体的所有字(所有汉字)进行及其自我的深度学习,而在此之前的训练结果仅是寻找最优策略,所以需要对单个训练结果私有存储。其次,卷积深度学习(cnn)指的是一种深度学习方式,中文为卷积神经网络,通常在ocr学习中,需要5层cnn保证学习准确性。s8:共享存储卷积深度学习的结果至各节点。此结果对应的是所有训练模型的学习结果,即为最终的学习结果(对应图2的训练结果)。此时已经完成了对该类字体的自我学习,因此可以将“ocr成果”即学习结果展示出来,为每个区块链用户所用。特别的,针对如今更多应用于金融行业,如票据、数字签名等的ocr识别,由于本实施例的训练模型集合私有性存储在各节点中,因此其识别过程是保密的。由此便可实现在对上述具有安全性要求的待识别内容进行识别时,能够同时对用户数据进行隐私保护。实施例二本实施例为对应实施例一的一具体运用场景:基于区块链机制的ocr深度学习方式,可以针对于目前日益变化的个性化汉字、英文及火星文、繁体中文、外语等非常规文字。例如当一款新的个性化文字面世后,它的字体是非常规的,在已知的字库中可能无法寻找到,那么如果机器想要学习这样的文字识别需要进行深度学习,而使用实施例一所述的方法可达到安全且快速的目的。具体而言,在识别新个性字体时,先选取笔画较少的字。首先根据深度学习方式,对应一个字给予一个模板(即既定模型,深度学习是通过给出既定目标后,机器进行学习,这里的模板指既定的目标);字体在识别中,随机选择一些状态,得到这些状态对应的回报,再在回报中选取出最优的策略,即识别率高、准确的数值。我们将这样的状态和状态对应的回报(即上述的训练模板)存储在区块链网络平台的私有空间中。再次选取其他笔画不一致的字体依据上述方式进行识别,当选取足够多笔画可以覆盖字体时(优选先选取笔画少的,通过这些字学习其中的笔画,最终,只要学习足够多的字,就能覆盖所有笔画的学习,比如学习有横竖撇捺的字,然后再学习横折、点、勾等笔画的字,当学习足够的笔画后就可以覆盖所有的汉字),这些状态和对应的状态对应的回报(即对应的训练模板集合)就满足此次深度学习的学习数据,这些存储在区块链网络私有空间的数据永远无法被非授权的人看到,可以保证我们核心数据的安全性。我们将这些训练模型固定在了区块链的私有空间,接下来通过5层cnn网络进行ocr的识别,这样在过程中由于数据固定,并不会导致我们的训练发生抖动等问题。而我们固定的数据和模型数据均为私有,在区块链网络平台中得到最优的保护。当训练结果出来后,我们把结果存储在区块链网络中,注意,这次的存储是公开的,因为我们已经针对该个性字体完成了自我学习的,是时候展示我们的ocr成果。鉴于区块链网络的公共性和极高流传度,我们的结果会被每个区块链用户获取。以上例子我们以某个性化汉字作为实验体,而针对英文或其他外文时,由于语言问题,可能需要针对每个字母进行识别,以个性英文字体为例,我们需要对26个英文字母,分别选取最优状态和状态对应的回报,将最优的策略存储在区块链私有空间,然后针对字母组合做出正确的顺序识别即可。通过本实施例方式进行新字体的ocr深度学习及识别,可以利用区块链存储的私有属性,首先可以保证我们所选取的学习数据得以私有化保存,防止商业间谍;其次将数据存储于区块链网络中,只要满足单种字体的所有笔画学习,即可通过区块链网络平台的共享性将笔画组合成字体,无需对文字全部进行识别,大大减少所学习的时长。实施例三本实施例对应实施例一或实施例二,提供一种计算机可读存储介质,其上存储有计算机程序,所述程序在被处理器处理时,能实现上述实施例一或实施例二所述的基于区块链机制的ocr深度学习方法所包含的步骤。具体的步骤内容在此不进行复述,详情请参阅实施例一或实施例二的记载。对应本领域普通技术人员可以理解实现上述实施例一或实施例二的技术方案中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来实现的,所述的程序可存储于一计算机可读取的存储介质中,该程序在执行时,可包括如上述各方法的流程。其中,所述的存储介质可以是磁盘、光碟、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。综上所述,本发明提供的基于区块链机制的ocr深度学习方法、存储介质,可以实现学习数据的资源共享;可以对自我学习成果进行有效保护,提高学习价值,同时有助于加快研发进度;还可以保证用户数据隐私性。因而具备广阔的运用前景。以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的
技术领域
,均同理包括在本发明的专利保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1