一种手写与按键结合的藏文输入系统及方法与流程

文档序号:12595135阅读:218来源:国知局
一种手写与按键结合的藏文输入系统及方法与流程

本发明属于图像数据处理技术领域,更进一步涉及字符识别技术领域中的一种手写与按键结合的藏文输入系统及方法。本发明可以用来在移动终端上输入藏文音节。



背景技术:

目前,移动终端上的藏文输入法,普遍采用藏文按键输入系统及键盘式藏文输入方法。由于藏文字母数量比较多,本地藏文和梵音藏文共有41个辅音字母和15个元音字母,使得现有的移动终端上的藏文输入法存在键盘式藏文输入系统过于复杂、藏文键盘键位数过多、输入方法不自然、输入效率低的问题。

尼玛扎西等四人在其申请的专利文献“藏文输入方法和系统”(公开号:CN105807949A,申请号:201610130611.7,申请日:2016-03-06)中提出了一种藏文输入方法和系统。该系统由输入模块、键盘定义模块、藏文字库和处理装置四个部分组成。通过按键输入的藏文字符存储在按键对应的存储单元中,由处理装置根据存储单元中的藏文字符和藏文字库确定目标藏文预组合字后输出。其中输入模块的输入方法采用47个输入键,用于用户输入藏文字符。该方法虽然能实现藏文字符的输入,但是该方法仍然存在的不足之处是:由于藏文字母数量较多,部分字母存在变形形式且字母间可以上下组合等因素,使得藏文的键盘输入需要较多的键位数,该方法的输入模块包含47个键,使得在移动终端上藏文的键盘输入步骤比较复杂,非常不便于人们使用。

青海师范大学在其申请的专利文献“一种基于36键位的藏文键盘布局和输入系统”(公开号:CN104503599A,申请号:201510015365.6,申请日:2015-01-13)中提出了一种基于36键位的藏文键盘布局和输入系统。该系统的输入方法通过主键盘、第一辅助键盘和第二辅助键盘来实现,每个键盘有36个键位。该系统的输入方法虽然解决了移动终端输入法按键过多的问题,但是,该输入方法仍然存在的不足之处是:该输入系统的键盘布局由主键盘、第一辅助键盘和第二辅助键盘组成,使得在移动终端上需翻页输入,仍然避免不了按键输入方式过于复杂的问题。

综上所述,虽然现有的移动终端上的输入系统及方法都可以实现藏文音节输入的功能,但是没有考虑到按键输入方式输入藏文字母所存在的缺陷,使得移动终端的藏文音节输入不够便捷。



技术实现要素:

本发明针对上述已有系统及方法的不足,提出了一种手写与按键结合的藏文输入系统及方法,以实现移动终端上藏文音节简易、高效、自然及准确的输入。采用这种方法的原因是,一个藏文音节由一个藏文基字字母和多个藏文附加字母按照藏文字母组成规律构成,根据藏文音节的基字字母和附加字母的组合规律,采用手写与按键结合的输入系统及方法,将基字藏文字母按照手写输入的方式,附加藏文字母按照按键输入的方式,进行藏文音节的输入,使得移动终端上的藏文音节输入的复杂性大大降低。

本发明的主要思路是:采用先手写输入藏文基字字母,后按键输入藏文附加字母的方式,完成手写与按键结合的藏文输入系统及方法的设计。藏文音节由藏文基字字母和藏文附加字母组成,藏文基字字母包括30种藏文辅音字母,藏文附加字母包括3种上加字母5种前加字母10种后加字母4种下加字母1种下加元音字母3种上加元音字母2种重后加字母和5种前加字母利用组成藏文音节的藏文基字字母和藏文附加字母的组成规律完成手写与按键结合的藏文输入系统及方法的设计。

为实现上述目的,本发明的系统包括藏文轨迹采集模块、藏文手写基字字母识别模块、图像显示模块、按键接收模块和藏文字母组合模块。

所述的藏文轨迹采集模块,用于采集用户在手写状态下输入的藏文手写基字字母轨迹点,将采集到的藏文手写基字字母轨迹点,以字符串的形式发送给藏文手写基字字母识别模块;

所述的藏文手写基字字母识别模块,用于接收从藏文轨迹采集模块发送来的字符串序列,利用特征提取算法,从字符串序列中,依次提取图像数组的特征,得到特征数组,利用欧氏距离分类器,对特征数组的特征向量和特征模版库中每个藏文基字字母的特征向量进行匹配,得到候选藏文基字字母编号序列,发送给图像显示模块;

所述的图像显示模块,用于接收藏文手写基字字母识别模块和按键接收模块发送来的藏文基字字母编号,从藏文字母图像库中,读取与藏文基字字母编号对应的藏文基字字母图像,在移动终端上显示藏文基字字母图像;

所述的按键接收模块,用于接收用户输入的藏文基字字母选择信号和藏文附加字母选择信号,将被选的藏文基字字母对应的编号发送给向图像显示模块,将被选的藏文基字字母对应的unicode编码及藏文附加字母对应的unicode编码发送给藏文字母组合模块;

所述的藏文字母组合模块,用于接收从按键接收模块发送来的藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码,将藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码存储在存储单元中,利用藏文音节的字母组合编码规则,输出组合编码后的藏文音节。

实现本发明的方法的具体步骤如下:

(1)建立数据库:

(1a)建立包含30个藏文基字字母、4个藏文元音字母和5个藏文反写字母的藏文字母图像库;

(1b)将藏文字母图像库中的30个藏文基字字母按照0到29的顺序依次对应编号;

(1c)建立包含1000套藏文手写字符数据,每套数据包含30个藏文辅音字母、4个藏文元音字母和5个藏文反写字母的藏文手写字符数据库;

(1d)利用特征提取算法,对藏文手写字符库中的数据进行特征提取后得到特征数组,建立由特征数组组成的特征模版库;

(2)输入手写藏文基字字母:

藏文轨迹采集模块采集用户在手写状态下输入的藏文手写基字字母轨迹点,将采集到的藏文手写基字字母轨迹点,以字符串的形式发送给藏文手写基字字母识别模块;

(3)识别手写藏文基字字母:

(3a)藏文手写基字字母识别模块接收从藏文轨迹采集模块发送来的字符串序列,利用特征提取算法,从字符串序列中,依次提取图像数组的特征,得到特征数组;

(3b)利用欧氏距离分类公式,藏文手写基字字母识别模块将特征数组的特征向量与特征模版库中每个藏文基字字母的特征向量进行匹配,得到匹配度数组;

(3c)藏文手写基字字母识别模块将匹配度数组中的元素,按照从小到大的顺序进行排序,得到排序后的匹配度数组;

(3d)藏文手写基字字母识别模块,将排序后的匹配度数组对应的候选藏文基字字母编号序列,发送给图像显示模块;

(4)显示候选藏文基字字母图像:

(4a)图像显示模块接收候选藏文基字字母编号序列;

(4b)图像显示模块从藏文字母图像库中,依次读取与候选藏文基字字母编号序列对应的候选藏文基字字母图像;

(4c)图像显示模块在移动终端上显示读取的候选藏文基字字母图像;

(5)选择藏文基字字母:

(5a)按键接收模块接收用户输入的候选藏文基字字母选择信号;

(5b)按键接收模块向图像显示模块发送被选的藏文基字字母对应的编号;

(5c)按键接收模块向藏文字母组合模块发送藏文基字字母对应的unicode编码;

(6)显示被选藏文基字字母图像:

(6a)图像显示模块接收从按键接收模块发送来的被选的藏文基字字母对应的编号;

(6b)图像显示模块从藏文字母图像库中读取与被选的藏文基字字母对应的编号对应的被选藏文基字字母的图像;

(6c)图像显示模块在移动终端上显示被选藏文基字字母的图像;

(7)存储与藏文基字字母对应的unicode编码:

(7a)藏文字母组合模块接收从按键接收模块发送来的藏文基字字母对应的unicode编码;

(7b)藏文字母组合模块将藏文基字字母对应的unicode编码存储在存储单元中;

(8)输入藏文附加字母:

按键接收模块接收用户通过按键输入的藏文附加字母的按键选择信号,将藏文附加字母对应的unicode编码发送给藏文字母组合模块;

(9)存储藏文附加字母对应的unicode编码:

藏文字母组合模块接收从按键接收模块发送来的藏文附加字母对应的unicode编码,将藏文附加字母对应的unicode编码存储在存储单元中;

(10)输出藏文音节:

利用藏文音节的字母组合编码规则,藏文字母组合模块将藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码进行组合编码,藏文字母组合模块输出组合编码后的藏文音节。

本发明与现有技术相比较具有如下的优点:

第一,由于本发明的藏文输入系统采用了藏文轨迹采集模块和藏文手写基字字母识别模块,对用户在移动终端输入的藏文手写基字字母进行采集、识别,采用按键接收模块对藏文附加字母进行输入,采用藏文字母组合模块对基字字母和附加字母进行组合输出,克服了现有技术中移动终端上键盘式藏文输入系统过于复杂的问题,使得本发明在移动终端上实现了藏文音节高效、准确的输入。

第二,由于本发明的藏文输入方法采用了手写输入藏文基字字母的方式,克服了现有技术中移动终端上藏文输入方式不自然的问题,使得本发明在移动终端上实现了藏文基字字母自然的输入。

第三,由于本发明的藏文输入方法采用了按键输入藏文附加字母的方式,克服了现有技术中移动终端上键盘式藏文输入方法输入效率低和键位数过多的问题,使得本发明在移动终端上实现了藏文附加字母高效、便捷的输入。

附图说明

图1为本发明的手写与按键结合的藏文输入系统的模块结构示意图;

图2为本发明的藏文输入方法的具体步骤示意图;

图3为本发明的藏文输入方法的特征提取算法的具体步骤示意图;

图4为本发明的藏文输入方法的Bresenham直线算法流程示意图;

图5为本发明的藏文输入方法的藏文手写基字字母的输入界面示意图;

图6为本发明的藏文输入方法的候选藏文基字字母图像显示界面示意图;

图7为本发明的藏文输入方法的藏文附加字母输入界面示意图;

图8为本发明的藏文输入方法的藏文音节输入界面示意图。

具体实施方式

下面结合附图对本发明做进一步的描述。

参照附图1,对本发明的藏文输入系统做详细的描述。

本发明的系统包括藏文轨迹采集模块、藏文手写基字字母识别模块、图像显示模块、按键接收模块和藏文字母组合模块。

藏文轨迹采集模块,用于采集用户在手写状态下输入的藏文手写基字字母轨迹点,将采集到的藏文手写基字字母轨迹点,以字符串的形式发送给藏文手写基字字母识别模块。

藏文手写基字字母识别模块,用于接收从藏文轨迹采集模块发送来的字符串序列,利用特征提取算法,从字符串序列中,依次提取图像数组的特征,得到特征数组,利用欧氏距离分类器,对特征数组的特征向量和特征模版库中每个藏文基字字母的特征向量进行匹配,得到候选藏文基字字母编号序列,发送给图像显示模块。

图像显示模块,用于接收藏文手写基字字母识别模块和按键接收模块发送来的藏文基字字母编号,从藏文字母图像库中,读取与藏文基字字母编号对应的藏文基字字母图像,在移动终端上显示藏文基字字母图像。

按键接收模块,用于接收用户输入的藏文基字字母选择信号和藏文附加字母选择信号,将被选的藏文基字字母对应的编号发送给向图像显示模块,将被选的藏文基字字母对应的unicode编码及藏文附加字母对应的unicode编码发送给藏文字母组合模块。

藏文字母组合模块,用于接收从按键接收模块发送来的藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码,将藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码存储在存储单元中,利用藏文音节的字母组合编码规则,输出组合编码后的藏文音节。

参照附图2,对本发明的藏文输入方法的具体步骤做详细的描述。

步骤1,建立数据库。

建立包含30个藏文基字字母、4个藏文元音字母和5个藏文反写字母的藏文字母图像库。

藏文字母图像库中的30个藏文基字字母包括4个藏文元音字母包括

将藏文字母图像库中的30个藏文基字字母按照0到29的顺序依次对应编号。

建立包含1000套藏文手写字符数据,每套数据包含30个藏文辅音字母、4个藏文元音字母和5个藏文反写字母的藏文手写字符数据库。

建立藏文手写字符数据库的具体步骤如下。

第1步,开发基于安卓系统的藏文手写字符采集软件,藏文手写字符采集软件的开发参考了西安电子科技大学立人智能信息技术研究所暨智能信号处理与模式识别实验室许亚美博士的手写维文构件采集软件,藏文手写字符采集软件的开发、设计和运行都是基于Android手机操作系统的。

第2步,采集藏文手写字符,藏文手写字符由藏族同胞通过移动终端的藏文手写字符采集软件进行手写采集。共100人书写,每人书写了10套,共收集藏文手写字符数据1000套。所有采集的藏文手写字符样本的书写笔顺无任何限制,使得采集样本具有真实性、全面性以及代表性。

利用特征提取算法对藏文手写字符库中的数据进行特征提取后得到特征数组,建立由特征数组组成的特征模版库。

参照附图3,对本发明的藏文输入方法的利用特征提取算法对藏文手写字符库中的数据进行特征提取后得到特征数组的具体步骤做详细的描述。

第1步,对藏文手写字符库中的藏文手写图像数组进行线性归一化处理,得到线性归一化后的藏文手写图像数组。

线性归一化是将图像在水平方向和垂直方向上,按照线性比例进行放大或缩小,缩放成规定尺寸大小的图像。该方法的优点是算法简单,失真较小,不会改变其原有字母的形状和特征。

对藏文手写图像数组进行线性归一化处理的方法是,利用线性归一化公式,对藏文手写图像数组进行线性缩放,使得归一化后的图像大小为256×256。

按照下式,对藏文手写字符库中的图像数组进行线性归一化:

RatioX=N/(xmax-xmin)

RatioY=N/(ymax-ymin)

x'=xRatioX

y'=yRatioY

其中,(x,y)表示线性归一化前藏文手写字符库中藏文手写图像的字母轨迹点的横纵坐标,xmin表示线性归一化前藏文手写图像的字母轨迹点序列中横坐标最小的字母轨迹点的横坐标值,xmax表示线性归一化前藏文手写图像的字母轨迹点序列中横坐标最大的字母轨迹点的横坐标值,ymin表示线性归一化前藏文手写图像的字母轨迹点序列中纵坐标最小的字母轨迹点的纵坐标值,ymax表示线性归一化前藏文手写图像的字母轨迹点序列中纵坐标最大的字母轨迹点的纵坐标值,N表示线性归一化后藏文手写图像的宽高值,本发明中N的值取256,N×N表示线性归一化后的藏文手写图像的大小,本发明中线性归一化后的藏文手写图像的大小为256×256,RatioX表示藏文字母图像在水平方向上的线性缩放比率,RatioY表示藏文字母图像在垂直方向上的线性缩放比率,(x',y')表示线性归一化后的藏文手写图像的字母轨迹点的横纵坐标。

第2步,将线性归一化后的藏文手写图像数组进行基于点密度均衡的非线性归一化处理,得到非线性归一化后的藏文手写图像数组。

基于点密度均衡的非线性归一化处理的方法是,利用投影密度公式,得到线性归一化后藏文手写图像的字母轨迹点在水平方向和垂直方向上的投影密度函数,对投影密度函数进行均匀化处理,使得原本分布不均匀的投影密度函数均匀化,从而调整藏文手写图像中字母变形严重的部分,将手写字母的重心位置调整到了藏文手写图像的中心。

按照下式,得到线性归一化后藏文手写图像的字母轨迹点在水平方向和垂直方向上的投影密度函数:

其中,f(x,y)表示线性归一化后藏文手写图像的灰度函数,藏文手写图像字母轨迹点的点列坐标映射的图像为二值形式,图像灰度函数f(x,y)的值为1,表示笔画像素点,图像灰度函数f(x,y)的值为0,表示背景空白点,(x,y)表示线性归一化后藏文手写图像中字母轨迹点的横纵坐标,X表示字母轨迹点序列中横坐标最大的字母轨迹点的横坐标值,Y表示字母轨迹点序列中纵坐标最大的字母轨迹点的纵坐标值,H(x)表示线性归一化后的藏文手写图像的字母轨迹点在水平方向上的投影密度函数,V(y)表示线性归一化后的藏文手写图像的字母轨迹点在垂直方向上的投影密度函数,αH表示水平修正参数,αV表示垂直修正参数,αH和αV的值取0,修正参数的数值与修正效果成反比。

利用基于点密度均衡的非线性归一化公式,对线性归一化后的藏文手写图像做基于点密度均衡的非线性归一化处理。使得非线性归一化后的手写字母轨迹点均匀分布在256×256的图像上,手写字母图像轨迹的重心位置被调整到字母轨迹点阵的中心。

按照下式,对线性归一化后的藏文手写数组图像进行基于点密度均衡的非线性归一化处理:

其中,M表示线性归一化后藏文手写图像中轨迹点的横坐标,N表示线性归一化后藏文手写图像中轨迹点的纵坐标,m表示非线性归一化后藏文手写图像中轨迹点的横坐标,n表示非线性归一化后藏文手写图像中轨迹点的纵坐标,H(k)表示线性归一化后的藏文手写图像的字母轨迹点在水平方向上的投影密度函数,V(l)表示线性归一化后的藏文手写图像的字母轨迹点在垂直方向上的投影密度函数,x表示藏文手写图像的字母轨迹点的当前点的横坐标的值,y表示藏文手写图像的字母轨迹点的当前点的纵坐标的值,k表示藏文手写图像的字母轨迹点的第k个点的横坐标,l表示藏文手写图像的字母轨迹点的第l个点的纵坐标,X表示线性归一化后的藏文手写图像的字母轨迹点的横坐标的最大值,Y表示线性归一化后的藏文手写图像的字母轨迹点的纵坐标的最大值。

第3步,将非线性归一化后的藏文手写图像数组进行三点线性平滑处理,得到平滑处理后的藏文手写图像数组。

按照下式,对非线性归一化后的藏文手写图像中的字母轨迹进行三点线性平滑去噪处理:

其中,S={xi|1≤i≤n}表示手写藏文字母轨迹点列中的一个笔画,S′={xi′|1≤i≤n}表示笔画S经过三点线性平滑处理后的笔画,i表示笔画中的第i个点,x(xi)表示平滑处理前笔画中第i个点的横坐标,x(xi-1)表示平滑处理前笔画中第i-1个点的横坐标,x(xi+1)表示平滑处理前笔画中第i+1个点的横坐标,y(xi)表示平滑处理前笔画中第i个点的纵坐标,y(xi-1)表示平滑处理前笔画中第i-1个点的纵坐标,y(xi+1)表示平滑处理前笔画中第i+1个点的纵坐标,x(xi′)表示平滑处理后笔画中第i个点的横坐标,y(xi′)表示平滑处理后笔画中第i个点的纵坐标,λ123表示平滑系数,根据经验值,本发明中取λ1的值为0.4,取λ2的值为0.2,取λ3的值为0.4。

第4步,将平滑处理后的藏文手写图像数组进行基于Bresenham直线插值算法的插值处理,得到插值处理后的藏文手写图像数组。

对三点线性平滑处理后的藏文手写图像数组采用Bresenham直线算法进行插值处理,Bresenham直线算法的流程图如图4所示。其原理是,手写字母轨迹中的任意一点,计算相邻两点的横轴向增量和纵轴向增量,若其中的较大值大于给定的插值步长,则在两点之间进行插值。插值位置利用两点间的斜率和步长来进行计算,插值进取方向为增量较大的方向,以保证在另一个方向上插值点间的距离都小于插值步长。

第5步,对插值处理后的藏文手写图像数组进行最邻近重采样操作,得到重采样后的藏文手写图像数组。

首先检测手写藏文字母笔画的关键点,手写藏文字母笔画的关键点包括笔画的起点、终点、拐点和尖点,其中笔画的起点和终点信息已知,笔画的拐点和尖点可依据道格拉斯-普克Douglas-Peucker算法来检测。检测出笔画的关键点后,保留所有的关键点,对两相邻关键点之间的笔画段进行等间距重采样。预设重采样阈值,本发明的重采样阈值设为3,以两相邻关键点之间笔画段的起始点为基准点,依次计算从基准点开始的相邻两点间的距离,并进行累加,当某点对应的累加距离大于重采样阈值,就删除基准点与该点之间的点,并把该点作为新的基准点重复上述步骤,直到所有点采样操作完成。

第6步,对重采样操作后的藏文手写图像数组进行点密度的弹性网格划分,得到弹性网格划分后的藏文手写图像数组。

使用8×8的弹性网格将重采样后的藏文手写字母图像进行网格划分,该弹性网格根据笔划密度函数来划分,笔划密度小的区域网格密,笔划密度大的区域网格疏。

第7步,对弹性网格划分后的藏文手写图像数组中每个网格内的每个像素点,提取方向线素特征,将每个网格内每个像素点的方向线素特征存在藏文手写图像数组中。

提取每个弹性网格内每个像素点的八方向线素特征的原理是,将每个网格内每个像素点的八方向线素特征进行每个分量上的累加,就得出了该网格的方向线素特征向量。

按照下式,对个网格内每个像素点的方向线素特征进行每个分量上的累加:

其中,N表示该网格中的像素点个数,i表示第i个网格,f1,f2,…,fN表示该网格内每个像素点的方向线素特征向量,fi.a1,fi.a2,…,fi.a8表示该网格内每个像素点的方向线素特征向量的8个方向线素特征分量,F.a1,F.a2,…,F.a8表示该网格的8个方向线素特征分量,F=(a1,a2,a3,a4,a5,a6,a7,a8)表示该网格的方向线素特征向量,它是由每个网格内每个像素点的特征向量进行每个分量上的累加得到。

步骤2,输入手写藏文基字字母。

藏文轨迹采集模块采集用户在手写状态下输入的藏文手写基字字母轨迹点,将采集到的藏文手写基字字母轨迹点,以字符串的形式发送给藏文手写基字字母识别模块。

藏文轨迹采集模块采集用户在手写状态下输入的藏文手写基字字母轨迹点的原理是,用户在基于安卓系统的移动终端的手写状态下触屏的瞬间会触发触摸MotionEvent事件,用户的手指在屏幕上滑动时会触发滚动条onScroll事件,安卓手机每隔500毫秒采集一次当前触摸点的横纵坐标,将采集到的藏文手写基字字母轨迹点坐标序列以字符串的形式发送给藏文手写基字字母识别模块。藏文手写基字字母在基于安卓系统的移动终端上的输入界面示意图如图5所示。

步骤3,识别手写藏文基字字母。

藏文手写基字字母识别模块接收从藏文轨迹采集模块发送来的字符串序列,利用特征提取算法,从字符串序列中,依次提取图像数组的特征,得到特征数组。

特征提取算法的具体步骤如下。

第1步,对藏文手写图像数组进行线性归一化处理,得到线性归一化后的藏文手写图像数组。

线性归一化是将图像在水平方向和垂直方向上,按照线性比例进行放大或缩小,缩放成规定尺寸大小的图像。该方法的优点是算法简单,失真较小,不会改变其原有字母的形状和特征。

对藏文手写图像数组进行线性归一化处理的方法是,利用线性归一化公式,对藏文手写图像数组进行线性缩放,使得归一化后的图像大小为256×256。

按照下式,对藏文手写图像数组进行线性归一化:

RatioX=N/(xmax-xmin)

RatioY=N/(ymax-ymin)

x'=xRatioX

y'=yRatioY

其中,(x,y)表示线性归一化前藏文手写图像的字母轨迹点的横纵坐标,xmin表示线性归一化前藏文手写图像的字母轨迹点序列中横坐标最小的字母轨迹点的横坐标值,xmax表示线性归一化前藏文手写图像的字母轨迹点序列中横坐标最大的字母轨迹点的横坐标值,ymin表示线性归一化前藏文手写图像的字母轨迹点序列中纵坐标最小的字母轨迹点的纵坐标值,ymax表示线性归一化前藏文手写图像的字母轨迹点序列中纵坐标最大的字母轨迹点的纵坐标值,N表示线性归一化后藏文手写图像的宽高值,本发明中N的值取256,N×N表示线性归一化后的藏文手写图像的大小,本发明中线性归一化后的藏文手写图像的大小为256×256,RatioX表示藏文字母图像在水平方向上的线性缩放比率,RatioY表示藏文字母图像在垂直方向上的线性缩放比率,(x',y')表示线性归一化后的藏文手写图像的字母轨迹点的横纵坐标。

第2步,将线性归一化后的藏文手写图像数组进行基于点密度均衡的非线性归一化处理,得到非线性归一化后的藏文手写图像数组。

基于点密度均衡的非线性归一化处理的方法是,利用投影密度公式,得到线性归一化后藏文手写图像的字母轨迹点在水平方向和垂直方向上的投影密度函数,对投影密度函数进行均匀化处理,使得原本分布不均匀的投影密度函数均匀化,从而调整藏文手写图像中字母变形严重的部分,将手写字母的重心位置调整到了藏文手写图像的中心。

按照下式,得到线性归一化后藏文手写图像的字母轨迹点在水平方向和垂直方向上的投影密度函数:

其中,f(x,y)表示线性归一化后藏文手写图像的灰度函数,藏文手写图像字母轨迹点的点列坐标映射的图像为二值形式,图像灰度函数f(x,y)的值为1,表示笔画像素点,图像灰度函数f(x,y)的值为0,表示背景空白点,(x,y)表示线性归一化后藏文手写图像中字母轨迹点的横纵坐标,X表示字母轨迹点序列中横坐标最大的字母轨迹点的横坐标值,Y表示字母轨迹点序列中纵坐标最大的字母轨迹点的纵坐标值,H(x)表示线性归一化后的藏文手写图像的字母轨迹点在水平方向上的投影密度函数,V(y)表示线性归一化后的藏文手写图像的字母轨迹点在垂直方向上的投影密度函数,αH表示水平修正参数,αV表示垂直修正参数,αH和αV的值取0,修正参数的数值与修正效果成反比。

利用基于点密度均衡的非线性归一化公式,对线性归一化后的藏文手写图像做基于点密度均衡的非线性归一化处理。使得非线性归一化后的手写字母轨迹点均匀分布在256×256的图像上,手写字母图像轨迹的重心位置被调整到字母轨迹点阵的中心。

按照下式,对线性归一化后的藏文手写数组图像进行基于点密度均衡的非线性归一化处理:

其中,M表示线性归一化后藏文手写图像中轨迹点的横坐标,N表示线性归一化后藏文手写图像中轨迹点的纵坐标,m表示非线性归一化后藏文手写图像中轨迹点的横坐标,n表示非线性归一化后藏文手写图像中轨迹点的纵坐标,H(k)表示线性归一化后的藏文手写图像的字母轨迹点在水平方向上的投影密度函数,V(l)表示线性归一化后的藏文手写图像的字母轨迹点在垂直方向上的投影密度函数,x表示藏文手写图像的字母轨迹点的当前点的横坐标的值,y表示藏文手写图像的字母轨迹点的当前点的纵坐标的值,k表示藏文手写图像的字母轨迹点的第k个点的横坐标,l表示藏文手写图像的字母轨迹点的第l个点的纵坐标,X表示线性归一化后的藏文手写图像的字母轨迹点的横坐标的最大值,Y表示线性归一化后的藏文手写图像的字母轨迹点的纵坐标的最大值。

第3步,将非线性归一化后的藏文手写图像数组进行三点线性平滑处理,得到平滑处理后的藏文手写图像数组。

按照下式,对非线性归一化后的藏文手写图像中的字母轨迹进行三点线性平滑去噪处理:

其中,S={xi|1≤i≤n}表示手写藏文字母轨迹点列中的一个笔画,S′={xi′|1≤i≤n}表示笔画S经过三点线性平滑处理后的笔画,i表示笔画中的第i个点,x(xi)表示平滑处理前笔画中第i个点的横坐标,x(xi-1)表示平滑处理前笔画中第i-1个点的横坐标,x(xi+1)表示平滑处理前笔画中第i+1个点的横坐标,y(xi)表示平滑处理前笔画中第i个点的纵坐标,y(xi-1)表示平滑处理前笔画中第i-1个点的纵坐标,y(xi+1)表示平滑处理前笔画中第i+1个点的纵坐标,x(xi′)表示平滑处理后笔画中第i个点的横坐标,y(xi′)表示平滑处理后笔画中第i个点的纵坐标,λ123表示平滑系数,根据经验值,本发明中取λ1的值为0.4,取λ2的值为0.2,取λ3的值为0.4。

第4步,将平滑处理后的藏文手写图像数组进行基于Bresenham直线插值算法的插值处理,得到插值处理后的藏文手写图像数组。

对三点线性平滑处理后的藏文手写图像数组采用Bresenham直线算法进行插值处理。其原理是,手写字母轨迹中的任意一点,计算相邻两点的横轴向增量和纵轴向增量,若其中的较大值大于给定的插值步长,则在两点之间进行插值。插值位置利用两点间的斜率和步长来进行计算,插值进取方向为增量较大的方向,以保证在另一个方向上插值点间的距离都小于插值步长。

第5步,对插值处理后的藏文手写图像数组进行最邻近重采样操作,得到重采样后的藏文手写图像数组。

首先检测手写藏文字母笔画的关键点,手写藏文字母笔画的关键点包括笔画的起点、终点、拐点和尖点,其中笔画的起点和终点信息已知,笔画的拐点和尖点可依据道格拉斯-普克Douglas-Peucker算法来检测。检测出笔画的关键点后,保留所有的关键点,对两相邻关键点之间的笔画段进行等间距重采样。预设重采样阈值,本发明的重采样阈值设为3,以两相邻关键点之间笔画段的起始点为基准点,依次计算从基准点开始的相邻两点间的距离,并进行累加,当某点对应的累加距离大于重采样阈值,就删除基准点与该点之间的点,并把该点作为新的基准点重复上述步骤,直到所有点采样操作完成。

第6步,对重采样操作后的藏文手写图像数组进行点密度的弹性网格划分,得到弹性网格划分后的藏文手写图像数组。

使用8×8的弹性网格将重采样后的藏文手写字母图像进行网格划分,该弹性网格根据笔划密度函数来划分,笔划密度小的区域网格密,笔划密度大的区域网格疏。

第7步,对弹性网格划分后的藏文手写图像数组中每个网格内的每个像素点,提取方向线素特征,将每个网格内每个像素点的方向线素特征存在藏文手写图像数组中。

提取每个弹性网格内每个像素点的八方向线素特征的原理是,将每个网格内每个像素点的八方向线素特征进行每个分量上的累加,就得出了该网格的方向线素特征向量。

按照下式,对个网格内每个像素点的方向线素特征进行每个分量上的累加:

其中,N表示该网格中的像素点个数,i表示第i个网格,f1,f2,…,fN表示该网格内每个像素点的方向线素特征向量,fi.a1,fi.a2,…,fi.a8表示该网格内每个像素点的方向线素特征向量的8个方向线素特征分量,F.a1,F.a2,…,F.a8表示该网格的8个方向线素特征分量,F=(a1,a2,a3,a4,a5,a6,a7,a8)表示该网格的方向线素特征向量,它是由每个网格内每个像素点的特征向量进行每个分量上的累加得到。

利用欧氏距离分类公式,藏文手写基字字母识别模块将特征数组的特征向量与特征模版库中每个藏文基字字母的特征向量进行匹配,得到匹配度数组。

欧氏距离分类公式如下:

其中,d表示特征数组的特征向量与特征模版库中藏文基字字母的特征向量之间的欧式距离,d的值越小,特征数组的特征向量与特征模版库中的藏文基字字母的特征向量之间的匹配度越高,d的值越大,特征数组的特征向量与特征模版库中的藏文基字字母的特征向量之间的匹配度越低,n表示特征向量中特征分量的总数,i表示特征向量的第i个特征分量,k表示特征数组的特征向量的特征分量个数,m表示特征模版库中藏文基字字母的特征向量的特征分量个数,X(x1,x2,…,xm)表示特征模版库中藏文基字字母的特征向量的m个特征分量,Y(y1,y2,…,yk)表示特征数组的特征向量的k个特征分量,k、m和n的取值相等。

欧氏距离分类器是目前常用的最小距离分类器中的一种。欧氏距离分类器相对于最邻近分类器的优点是响应速度快,非常适合应用于有实时要求的系统上。同时欧氏距离适合应用于衡量各个分量的量纲一致并且各个分量的分布(期望,方差等)都相同的向量之间的距离关系,而本发明所采用的方向线素特征满足以上条件。因此,本发明最终采用欧氏距离分类器作为联机手写藏语单字符识别的分类器。

藏文手写基字字母识别模块将匹配度数组中的元素按照从小到大的顺序进行排序,得到排序后的匹配度数组。

藏文手写基字字母识别模块将排序后的匹配度数组对应的藏文基字字母编号序列发送给图像显示模块。

步骤4,显示候选藏文基字字母图像。

图像显示模块接收候选藏文基字字母编号序列。

图像显示模块从藏文字母图像库中,依次读取与候选藏文基字字母编号序列对应的候选藏文基字字母图像。

图像显示模块在移动终端上显示读取的候选藏文基字字母图像。

图像显示模块接收藏文手写基字字母识别模块发送来的藏文基字字母编号序列,从藏文字母图像库中读入候选基字字母编号对应的藏文基字字母图像,在移动终端上显示候选藏文基字字母图像。在软件安装完成时,该软件会自动将手写识别算法训练出来的分类器加载到手机中。图像显示模块接收藏文手写基字字母识别模块发送来的藏文基字字母编号序列,经过分类器识别,按照匹配度从高到低的顺序,从藏文字母图像库中读入候选基字字母编号对应的藏文基字字母图像,在移动终端上显示候选藏文基字字母图像。在移动终端上显示候选藏文基字字母图像的示意图如图6所示。

步骤5,选择藏文基字字母。

按键接收模块接收用户输入的候选藏文基字字母选择信号。

按键接收模块接收用户输入的候选基字字母选择信号,得到被选基字字母的编号和被选基字字母对应的unicode编码。按键接收模块接收用户输入的候选基字字母选择信号的原理是,当按键接收模块收到点击屏幕的触摸MotionEvent事件通知时,按键接收模块根据触摸点的横纵坐标信息,接收用户输入的候选基字字母选择信号,得到被选基字字母的编号和被选基字字母对应的unicode编码。

按键接收模块向图像显示模块发送被选的藏文基字字母对应的编号。

按键接收模块向藏文字母组合模块发送藏文基字字母对应的unicode编码。

步骤6,显示被选藏文基字字母图像。

图像显示模块接收从按键接收模块发送来的被选的藏文基字字母对应的编号。

图像显示模块从藏文字母图像库中读取与被选的藏文基字字母对应的编号对应的被选藏文基字字母的图像。

图像显示模块在移动终端上显示被选藏文基字字母的图像。

步骤7,存储与藏文基字字母对应的unicode编码。

藏文字母组合模块接收从按键接收模块发送来的藏文基字字母对应的unicode编码。

藏文字母组合模块将藏文基字字母对应的unicode编码存储在存储单元中。

步骤8,输入藏文附加字母。

按键接收模块接收用户通过按键输入的藏文附加字母的按键选择信号。在移动终端上输入藏文附加字母的示意图如图7所示。

用户输入的附加藏文字母是指藏文音节的上加字母、前加字母、后加字母、下加字母、下加元音字母、上加元音字母和重后加字母,按键接收模块接收用户输入的上加字母、前加字母、后加字母、下加字母、下加元音字母、上加元音字母和重后加字母的选择信号的原理是,按键接收模块收到用户在屏幕上点击的触摸MotionEvent事件通知时,根据触摸点的横纵坐标信息,接收用户输入的上加字母、前加字母、后加字母、下加字母、下加元音字母、上加元音字母和重后加字母的选择信号,得到用户输入的藏文附加字母对应的unicode编码。

按键接收模块将藏文附加字母对应的unicode编码发送给藏文字母组合模块。

步骤9,存储藏文附加字母对应的unicode编码。

藏文字母组合模块接收从按键接收模块发送来的藏文附加字母对应的unicode编码,将藏文附加字母对应的unicode编码存储在存储单元中。

步骤10,输出藏文音节。

利用藏文音节的字母组合编码规则,藏文字母组合模块将藏文基字字母对应的unicode编码和藏文附加字母对应的unicode编码进行组合编码,输出组合编码后的藏文音节。移动终端上输出显示藏文音节的示意图如图8所示。本发明的藏文字母的unicode编码如表1所示,藏文音节的字母组合编码示例如表2所示。

表1藏文字母的unicode编码

表2藏文音节的字母组合编码示例

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1