一种基于外接数位设备和大数据智能分析的书法矫正器的制作方法

文档序号:16665185发布日期:2019-01-18 23:13阅读:271来源:国知局
一种基于外接数位设备和大数据智能分析的书法矫正器的制作方法

本发明涉及一种书法矫正器,具体涉及一种基于外接数位设备和大数据智能分析的书法矫正器。



背景技术:

书法是指文字符号的书写法则。换言之,书法是指按照文字特点及其含义,以其书体笔法、结构和章法书写,使之成为富有美感的艺术作品。汉字书法为汉族独创的表现艺术,被誉为:无言的诗,无行的舞;无图的画,无声的乐等。

书法文化是中国传统文化,现在在互联网大潮和电子化产品逐渐占据主流的时代下,这项民族文化流失较为严重,而且相对门槛较高。在大部分青少年群体中,存在着“学习时间长、注意力不集中、学习过程中缺乏引导和针对性、容易被周边娱乐化电子化产品(比如手机)所干扰、难以打基础”等诸多问题。



技术实现要素:

本发明提供了一种书法矫正器,从现代化计算机技术的发展出发,将时下相对热门的大数据分析与人工智能相结合,与中国这门传统文化进行衔接,通过对前辈书家的大量字库数据源分析,对书法练习者进行的笔法、章法等要点的学习给出矫正建议,在短期内打下书法学习的基础。

为了实现本发明的发明目的,下面对本发明采用的部分基础技术进行说明。

①外接数位屏:数位板,又名绘图板、绘画板、手绘板等等,是计算机输入设备的一种,通常是由一块板子和一支压感笔组成,它和手写板等作为非常规的输入产品相类似,都针对一定的使用群体。数位板的板子内,有一块电路板,俗称天线板,上面有横竖均衡排列的铜线条,将数位板切割成一定数量的正方形,板面上方产生均衡的纵横交错的磁场,笔尖在数位板上移动的时候,切割磁场,从而产生电信号,通过多点定位,数位板芯片就可以精确的确定数位板笔尖的位置,它还能做很多意想不到的事情。它可以模拟各种各样的画家的画笔,例如模拟最常见的毛笔,当我们用力的时候毛笔能画很粗的线条,当我们用力很轻的时候,它可以画出很细很淡的线条,它可以模拟喷枪,当你用力一些的时候它能喷出更多的墨和更大的范围,而且还能根据你的笔倾斜的角度,喷出扇形等等的效果……除了模拟传统的各种画笔效果外,它还可以利用电脑的优势,作出使用传统工具无法实现的效果,因此,用数位板作为书写者的路径录入终端完全可实现;

②大数据分析技术:大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据能够帮助各行各业的企业从原本毫无价值的海量数据中挖掘出用户的需求,使数据能够从量变到质变,而人工智能,是指研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术以及应用系统的一门新的技术科学,是由人工制造出来的系统所表现出来的智能。2006年,hinton教授提出“深度学习”神经网络使得人工智能性能获得突破性进展,“深度学习”神经网络主要机理是通过深层神经网络算法来模拟人的大脑学习过程,通过输入与输出的非线性关系将低层特征组合成更高层的抽象表示,最终达到掌握运用的水平。数据量的丰富程度决定了是否有充足数据对神经网络进行训练,进而使人工智能系统经过深度学习训练后达到强人工智能水平。因此,能否有足够多的数据对人工神经网络进行深度训练,提升算法有效性是人工智能能否达到类人或超人水平的决定因素之一。随着移动互联网的爆发,数据量呈现出指数级的增长,大数据的积累为人工智能提供了基础支撑。同时受益于计算机技术在数据采集、存储、计算等环节的突破,人工智能已从简单的算法+数据库发展演化到了机器学习+深度理解的状态。

下面对本发明的具体实现方案进行说明。

本发明提供了一种基于外接数位设备和大数据智能分析的书法矫正器,包括:

输入输出控制器、云端大数据库及ai最优路径计算系统,所述输入输出控制器与云端大数据库相连并向云端大数据库输入书写数据,云端大数据库包括书法数据库和云端算法库,云端大数据库与ai最优路径计算系统相连,ai最优路径计算系统输出书写路径建议到输入输出控制器。

更进一步的方案是:

所述输入输出控制器为数位屏,以及光学笔;数位屏上集成了云端网络访问系统,与云端书法数据库连接。

更进一步的方案是:

所述云端大数据库的书法数据库,包括一级流派集、二级分类子集和三级字符次子集;

所述一级流派集author_name,收纳中国书法家协会及书法网提供的需要被传承的书家类别,提供string类型的外键,存储书家流派名称,并按照流派名称全拼进行ascii编码排序,组成基础库;

所述二级分类集category存储楷书、行书、篆书、草书、行楷等分类表格,并将分类集名作为外键,供输入终端选择流派,检索找到对应的表,以便进行三级检索;

所述三级字符次子集为核心数据库,分为汉字的笔画表集及3000常用汉字表集两部分。其中3000常用汉字表集按照汉字全拼首字母进行排序存储,字体拼音作为模糊查询键,字体本身提供唯一的外键用于输入精确查询。每个字符集的数据,都将单独存储该字体的不同流派下的规范写法图像url集。其中规范写法图像的采集需要前期采集,并二次加工处理存放于服务器。

更进一步的方案是:

所述ai最优路径计算系统,用于承载云端字库大数据的数据源输入,同时将云计算作为技术支持,对字库资源的遍历算法进行反复学习,包括对单独汉字的路径趋势走向分析,单独汉字的笔法结构的路径分析,对整体字形、偏旁部首等等的相互搭配,对多个汉字之间的排版、章法架构关系等等,生成大量的学习结果报告,并将这些大量的报告分类整理存储,做神经网络模式的对应与层级关系建立,一旦检测到控制器有光电信号的录入,快速将录入信息与当前汉字的模式一起倒入核心计算结果进行处理分析,将最优解与当前用户录入的信息做比对,最终给出矫正建议。

本发明中,基础外接数位屏与云端服务器建立连接,保证每一次录入都有迹可循,每一次输出和建议都能在云端备份,对路径错误率高频度的字体建立个人字库;

对现当代书法名家的书体风格建立特定的数据库,并按照书法流派归类,最后对每个分类建立特定汉字的子库,形成特定汉字的数据源;

对每一个涵盖大量数据源的汉字库进行路径分析,总结出单独汉字具有的笔法的共性和独特性,以及多个汉字组合的时候的章法排布总体走势,生成最优计算路径,存储于云端算法库,并将经典汉字的笔法建议备份至云服务器,方便及时检索查询。

本发明的采用,可抛弃传统的字帖矫正或者枯燥单一的书面式的风格矫正,通过将书法样式分门别类,对特定种类特定汉字进行云端字库路径遍历,及时、准确的对练习者提出矫正建议,增强练习者对笔法的结构的认知强度。

附图说明

图1为本发明书法矫正器的示意图;

图2为本发明一个实施例的神经网络层级示意图;

图3为本发明一个实施例的三层神经网络模式示意图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步的详细说明。

如附图1所示,本发明的书法矫正器,具有三个基本组成模块,即:输入输出控制器、云端大数据库及ai最优路径计算系统。

①输入输出终端总控制器:总控制器是整个系统架构的核心,此模块主要分为两大核心交互——基础输入与复杂输出。基础输入装置基于电磁感应模式的数位屏为载体,外连一只光学笔,模拟压感、倾斜、粗细的绘制方式,可选择钢笔硬笔和毛笔软笔的练习模式。核心载体——数位屏集成云端网络访问系统,可以及时与云端字库建立连接,书法练习者第一步通过集成系统选择练习的特定汉字,通过光学笔的传感录入,数位屏将精准记录此次生成的路径,并实施向本地智能分析缓存做传输比对;

②云端大数据库:该部分是一个数据仓库和ai核心算法学习基地,书法练习者所涉及到的书法分类(诸如楷书、行书、行楷、草书篆书等)以及每个分类下的流派(颜真卿、欧阳询、王羲之、启功、田蕴章等)统一做了基础库与子库的建立对应,是后续ai学习分析的数据供给。

同时,该架构模块还将集成云计算处理能力,对单独汉字笔法、字形,以及多个汉字的呼应、章法分别做映射,将路径计算结果生成报表,输出到核心的ai分析区;

1)基础库与子库建立规则如下:

流派集(基础库):建立一级流派表集author_name,收纳中国书法家协会及书法网提供的需要被传承的书家类别,提供string类型的外键,存储书家流派名称,并按照流派名称全拼进行ascii编码排序,组成基础库;

二级分类子集(子库):每个流派集表公用二级分类集category,该分类集存储楷书、行书、篆书、草书、行楷等分类表格,并将分类集名作为外键,供输入终端选择流派,检索找到对应的表,以便进行三级检索,注意,一级流派集不存在的分类,存储为null,返回终端显示为“该书家下没有此类别”;

三级字符次子集(子库):此级别字符集为核心数据库,分为汉字的笔画表集及3000常用汉字表集两部分。其中3000常用汉字表集按照汉字全拼首字母进行排序存储,字体拼音作为模糊查询键,字体本身提供唯一的外键用于输入精确查询。每个字符集的数据,都将单独存储该字体的不同流派下的规范写法图像url集。其中规范写法图像的采集需要前期采集,并二次加工处理存放于服务器。

2)路径的计算规则:

矫正参考字符路径计算需依赖前期图像文件的识别采集,然后进行大量遍历分析路径走向概率,生成矫正报告。举例说明:

对于汉字“书”,需先检索数据表,获取特定流派(如颜真卿)特定分类(如楷书)下的关于包含汉字“书”的图像url集合,转化成file流集合文件。遍历该文件集,运用加权平均法首先对图像进行灰度处理及二值化、腐蚀化处理、特征提取及降维过程(此过程详细实现见ai最优路径计算系统),经历这些处理过程,将汉字“书”url数组集长度的识别结果做平均值法计算,剔除小概率无用路径,提取大概率的能表现书家书写特色的路径做备份,新建为矫正方案表,此为与用户的书写路径做校对的标准规则路径;

③ai最优路径计算系统:相对前面两个模块的阐释,ai最优路径计算系统就是整个架构的最核心驱动模块,它一方面承载着云端字库大数据的数据源输入,同时将云计算作为技术支持,对字库资源的遍历算法进行反复学习,包括对单独汉字的路径趋势走向分析,单独汉字的笔法结构的路径分析,对整体字形、偏旁部首等等的相互搭配,对多个汉字之间的排版、章法架构关系等等,生成大量的学习结果报告,并将这些大量的报告分类整理存储,做神经网络模式的对应与层级关系建立,一旦检测到控制器有光电信号的录入,可快速将录入信息与当前汉字的模式一起倒入核心计算结果进行处理分析,将最优解与当前用户录入的信息做比对,最终给出矫正建议。

1)学习结果报告分类整理方案:

此模块用于学习者反复练习时的纠错方案及快速查找提供方便,具体实施方式可举例说明:若用户首次使用矫正器练习汉字“书”,选择流派及分类下输入“书”字进行检索,接着通过外置光电笔写下“书”字,系统会先启动第一次ai路径识别处理,生成路径分析报告,同时,调用流派分类选择检索出来的“书”字路径报告做校验,将区别之处单独提取生成新的报告文件,并且通过当前流派分类的检索信息,自动建立外键为“书”字的矫正表,并附带“流派名”及“分类名”的键值信息,用户第二次书写,路径识别结果直接与当前矫正方案做校对,生成第二次矫正方案,并更新当前内容;

2)神经网络模式的对应与层级关系建立方案:

①此模块首先依赖于前期图像采集处理:采用基于opencv+ocr图像处理字符的技术进行识别提取,首先,通过大数据库的检索结果提取到原始图像,根据重要性及其它指标,将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高,对蓝色敏感最低,因此,按下式对rgb三分量进行加权平均能得到较合理的灰度图像。

f(i,j)=0.30r(i,j)+0.59g(i,j)+0.11b(i,j))

注:其中,i、j代表一副图像横纵向的像素坐标,则f(i,j)表示图像中的像素在(i,j)位置处的灰度值,r(或g、b)(i,j)代表一幅图像在(i,j)处的r(或g、b)通道的灰度值。(r:红色通道g:绿色通道b:蓝色通道)

上面的公式可以看出绿色(g分量)所占的比重比较大,所以有时候也会直接取g分量进行灰度化。灰度处理完成,将图像上的点的灰度置为0或255,也就是将整个图像呈现出明显的黑白效果。即将256个亮度等级的灰度图像通过适当的阈值选取而获得仍然可以反映图像整体和局部特征的二值化图像。接着,使用opencv.jar包对图像进行腐蚀处理,最后,包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息,以便方便后面的处理。在这个步骤通常有:灰度化(如果是彩色图像)、降噪、二值化、字符切分以及归一化这些子步骤。经过二值化后,图像只剩下两种颜色,即黑和白,其中一个是图像背景,另一个颜色就是要识别的文字了;

②卷积神经网络层级对应:

由前期图像识别生成的汉字信息,作为输入,单位神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性变换后输出。每两个神经元之间的连接代表加权值,称之为权重(weight)。不同的权重和激活函数,则会导致神经网络不同的输出,如附图2所示(基于wx+b的形式,其中,1、x1、x2表示输入向量,w1、w2为权重,几个输入则意味着有几个权重,即每个输入都被赋予一个权重,b为偏置bias,z为激活参数,g(z)为激活函数,a为输出)。

本案例架构为输入端采集、云端数据库读取处理、ai解算及最终输出的模式符合三层神经网络模式,具体层级表现如附图3所示,具体为:

输入层(inputlayer),众多神经元(neuron)接受大量非线形输入讯息(在此方案中为前期图像识别信息),输入的讯息称为输入向量;

输出层(outputlayer),讯息在神经元链接中传输、分析、权衡,形成输出结果,输出的讯息称为输出向量;

隐藏层(hiddenlayer),简称“隐层”,是输入层和输出层之间众多神经元和链接组成的各个层面。如果有多个隐藏层,则意味着多个激活函数。具体实施中,则采用卷积神经网络的层次计算处理:

conv:卷积计算层,线性乘积求和;

relu:激励层,relu是激活函数的一种;

pool:池化层,简言之,即取区域平均或最大。

在本方案中,若检测到是图像输入,卷积计算层就是滤波器filter(带着一组固定权重的神经元),不同的滤波器filter会得到不同的输出数据,比如颜色深浅、轮廓。相当于如果想提取图像的不同特征,则用不同的滤波器filter,提取想要的关于图像的特定信息:颜色深浅或轮廓。并将此输出作为一次信息集存储。

③最终矫正方案:

通过以上用户输入及数据库检索、ai最优路径系统处理校对等流程,最终会反馈为两种矫正信号:

1)直接使用矫正结果,对用户存在的不规范路径进行标红显示,并将矫正建议及书写要领以文字标注的方式附加在屏幕书写区,同时支持用户选择重写或“查看原字帖”,若用户选择重写,清除当前路径,进入重新开始流程,若用户选择查看原字帖,可立即提取当前汉字对应的规范路径图像显示在书写区田字格中,供用户进行临摹矫正;

2)保存每一个汉字练习过程中产生的最新矫正报告,主要包括矫正建议及原字帖图像文件,并以汉字名及日期重命名,用于用户下次快速检索查看该汉字书写要领。

尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在本申请公开的原则范围和精神之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1