基于音节字的全手写联机藏文输入系统的制作方法

文档序号：14940651发布日期：2018-07-13 20:38阅读：220来源：国知局

本发明属于模式识别中的文字模式识别领域，更进一步涉及手写体识别领域中的基于音节字的全手写联机藏文输入系统，可用于在移动电话、平板电脑等移动终端上实现藏文音节字的完整输入。

背景技术：

藏族是我国的56个民族之一，有自己的语言和文字。藏语历史悠久，国内使用人口约为800万，不丹、印度、尼泊尔、巴基斯坦四个国家，也有人说藏语。藏文中独立的语音和书写单位是藏文音节字，一个完整的藏文音节字由藏文字母组成，每个音节字中最多可以有6个辅音字母和1个元音字母，除基字字母外的其他字母都可缺省。

目前英语与汉语识别技术已经成熟，并且广泛地应用在各领域。相比于中英文，藏文的识别由于研究起步较晚，技术并不成熟，尤其是藏语的输入还停留在键盘编码的方式上。例如，青海师范大学在其申请的专利文献“一种基于36键位的藏文键盘布局和输入系统”(公开号：cn104503599a，申请号：201510015365.6，申请日：2015-01-13)中，公开了一种基于36键位的藏文键盘布局和输入系统，该输入系统包含主键盘、第一辅助键盘和第二辅助键盘，每个键盘有36个按键，通过按键输入藏文的每个字母来完成完整藏文音节字的输入。该输入系统虽然最终能够实现藏文音节字的输入，但是需要较多的键位数，且键盘的布局由三个键盘组成，使得在移动终端上输入完整的藏文音节字时需上下翻页输入，输入方式较为复杂，导致输入效率低，不便于使用。

随着科技的进步和各种移动设备的普及，高效简洁的藏文输入方式也越来越被人们重视和需要，手写输入与人类自然书写方式有更多相同之处，因此可实时自动识别字符的联机手写输入方式已成为人机交互的一种重要方式。如卢朝阳等人在其申请的专利文献“一种手写与按键结合的藏文输入系统及方法”(公开号：cn106814880a，申请号：201710023646.5，申请日：2017-01-13)中，公开了一种手写与按键结合的藏文输入系统，该系统通过藏文手写基字字母识别模块完成联机的基字字母输入，通过按键接收模块完成附加字母的输入，并由藏文字母组合模块将所有字母组合来完成完整藏文音节的输入。该输入系统降低了传统全键盘输入系统的复杂度，输入效率得到一定的提升，但是需要将完整藏文音节拆分为不同字母分别进行手写或按键输入。

综上所述，虽然现有藏文输入系统能够完成藏文音节的输入过程，但是由于对藏文音节的部分字母仍需使用键盘来完成输入，导致输入系统较为复杂，同时影响输入效率和输入的便捷性，且输入方式不够自然。

技术实现要素：

本发明的目的在于针对上述已有技术的不足，提出一种基于音节字的全手写联机藏文输入系统，旨在简化输入系统结构，并提高输入的效率和便捷性。

为实现上述目的，本发明采用的技术方案为：

基于音节字的全手写联机藏文输入系统，包括应用在移动终端上的音节字数据库模块、音节字手写轨迹提取模块、音节字特征提取模块、音节字分类识别模块和音节字候选输出模块，其中：

所述音节字数据库模块，用于通过采集不同人手写的藏文音节字，构建藏文音节字的手写特征模板库，实现与待输入藏文音节字的特征匹配；

所述音节字手写轨迹提取模块，用于采集待输入藏文音节字的手写轨迹点序列并发送；

所述音节字特征提取模块，用于对待输入藏文音节字的手写轨迹点序列进行预处理和特征提取，并将特征提取生成的待识别藏文音节字的特征向量发送给音节字分类识别模块；

所述音节字分类识别模块，用于通过分类器对待输入藏文音节字的特征向量与手写特征模板库中不同人手写的藏文音节字的特征模板进行匹配，并将匹配得到的候选藏文音节字发送给音节字候选输出模块；

所述音节字候选输出模块，用于按照匹配度由高到低的顺序将候选的藏文音节字显示在移动终端输入界面的候选框内，并根据用户在候选框内对藏文音节字的选择信号，将相应的藏文音节字输出到移动终端。

上述基于音节字的全手写联机藏文输入系统，所述音节字数据库模块，包括数据采集模块和特征模板库模块，其中：

所述数据采集模块，用于通过采用藏文音节字采集软件，以无限制的书写方式采集不同人手写的藏文音节字样本，建立包含n套手写体藏文音节字样本的手写样本库，n≥2；

所述特征模板库模块，用于对藏文音节字手写样本库中每个音节字的手写样本进行预处理，并提取每个音节字的特征向量，构建藏文音节字的手写特征模板库。

上述基于音节字的全手写联机藏文输入系统，所述音节字特征提取模块，包括预处理模块和特征向量模块，其中：

所述预处理模块，用于通过对待输入藏文音节字的手写轨迹点序列进行插点、重采样、倾斜校正、线性归一化和非线性归一化，以消除手写轨迹的抖动，并均衡手写轨迹的密度；

所述特征向量模块，用于提取预处理后的藏文音节字手写轨迹点序列的初始特征，并使用降维算法对初始特征进行特征选择，将生成的待识别藏文音节字的特征向量发送给音节字分类识别模块。

本发明与现有技术相比，具有如下优点：

第一，本发明由于采用了音节字手写轨迹提取模块提取一个完整藏文音节字的手写轨迹，无需借助键盘实现按完整藏文音节进行联机输入，简化了输入系统的结构，同时避免了现有技术中输入藏文音节字时需要将音节字拆分为字母分别手写或按键输入，导致输入效率偏低的缺陷，有效地提高了在移动终端上对藏文音节字输入的效率和便捷性。

第二，本发明由于采用了音节字手写轨迹提取模块、音节字特征提取模块和音节字分类识别模块完成以全手写的输入方式输入藏文音节字，避免了用键盘输入藏文的附加字母时需切换按键界面和记忆输入规则的问题，更加贴近用户写字习惯，在移动终端上对藏文音节的输入更加自然流畅，增强人机交互体验。

附图说明

图1为本发明的结构示意图；

图2为基于本发明的藏文音节字输入方法流程图；

图3为本发明音节字特征提取算法的实现流程图；

图4为本发明的藏文音节字输入界面示意图；

图5为本发明的藏文音节字候选界面示意图。

具体实施方式

下面结合附图和具体实施例，对本发明作进一步的详细描述。

参照图1，基于音节字的全手写联机藏文输入系统，包括应用在移动终端上的音节字数据库模块、音节字手写轨迹提取模块、音节字特征提取模块、音节字分类识别模块和音节字候选输出模块。

音节字数据库模块，包括数据采集模块和特征模板库模块。其中数据采集模块，用于通过采用藏文音节字采集软件，以无限制的书写方式采集不同人手写的藏文音节字样本，建立藏文音节字的手写样本库，本发明共采集了不同的60个人手写的藏文音节字的样本。其中特征模板库模块，用于对藏文音节字手写样本库中每个音节字的手写样本进行预处理，并提取每个音节字的特征向量，构建藏文音节字的手写特征模板库。

音节字手写轨迹提取模块，用于采集待输入藏文音节字的手写轨迹点序列。本发明采用谷歌公司推出的输入法框架，当监听点击屏幕信息的事件被用户触发后，开始记录用户的手写轨迹坐标点，若连续1秒未接收到屏幕点击信号，将采集到的手写轨迹点序列发送给音节字特征提取模块。

音节字特征提取模块，包括预处理模块和特征向量模块。由于人为采集数据时会产生书写抖动，造成采集的手写数据样本产生噪声和畸变，因此需要对采集样本进行预处理操作，以滤除数据中的噪声和干扰。其中预处理模块，通过对待输入藏文音节字的手写轨迹点序列进行插点、重采样、倾斜校正、线性归一化和非线性归一化，用于消除手写轨迹的抖动，并均衡手写轨迹的密度。其中特征向量模块，用于通过对预处理后藏文音节字的手写轨迹点序列提取初始特征，并使用降维算法对初始特征进行特征选择，将生成的待识别藏文音节字的特征向量发送给音节字分类识别模块。

音节字分类识别模块，用于将待输入藏文音节字的特征向量与手写特征模板库中不同人手写的藏文音节字的特征模板进行匹配，并将待输入藏文音节字的特征向量与特征模板库中每个音节字的特征模板按照匹配度由高到低的顺序排序，将得到的n个候选藏文音节字发送给音节字候选输出模块，本发明里将候选的30个藏文音节字发送给了音节字候选输出模块。分类器可采用欧氏距离、支持向量机、决策树、神经网络等分类器，本发明里采用的是欧氏距离分类器。

音节字候选输出模块，用于按照匹配度由高到低的顺序将候选的藏文音节字显示在移动终端输入界面的候选框内，并根据用户在候选框内对藏文音节字的选择信号，将相应的藏文音节字输出到移动终端，从而完成一个完整藏文音节字的输入过程。

参照图2，基于本发明的藏文音节字输入方法包括如下步骤：

步骤1，建立音节字手写样本库。

本发明的藏文音节字手写样本由藏族同胞通过藏文音节字采集软件进行采集，在数据采集过程中，对书写人员的书写方式无限制，从而保证采集的手写样本具代表性。本发明建立了共包含60套藏文音节字数据，每套数据包含579个音节字的手写样本库。此音节字是根据藏文音节字的结构动态比率数据统计得出的藏文常用音节字(见“汉语及少数民族语言语音学研讨会”简介[j].江荻.民族语文,1998(4):19-19)，如下表1所示，其中共包含25种字母组合结构的藏文音节字。

表1.藏文音节字的结构动态比率数据表

步骤2，建立音节字手写特征模板库

参照图3，对采集的60套音节字手写样本提取方向特征，组成579个藏文音节字的特征模板库，具体步骤如下。

步骤2.1，对采集的手写样本进行相邻点间插点处理。具体的方法是在每个笔画内点列的相邻点间插入新点列使笔画连接起来，由于原本的点是离散的状态，需要将其连接成实密的曲线，近似的认为在每两个点之间为直线连接，并计算斜率，并通过计算出的直线方程进行插点的操作。

步骤2.2，对插点处理后的音节字数据进行3点重采样处理。重采样的过程就是在插入新的点列后形成的连接的点列中进行每隔3点采样，采样出的轨迹点列中的部分点作为新的笔画点列。

步骤2.3，对重采样处理后的音节字数据进行裁剪处理。

裁剪过程为提取整个点列中样本图像中的最小x坐标xmin、最小y坐标ymin，最大x坐标xmax，最大y坐标ymax，设剪切前的坐标点为(x,y)，剪切后的该点对应坐标为(x',y')，则剪切公式为：

x'＝x-xmin

y'＝y-ymin

步骤2.4，将裁剪后的数据进行基于水平投影的倾斜校正处理。倾斜矫正时将藏文音节字进行旋转，旋转步长为1°，旋转范围为-15°到15°。对每次旋转得到的新的音节字数据进行水平投影，得到在当前矫正角度下水平方向上的笔画点个数，如果当前矫正角度的个数大于前面矫正角度的个数，则更新最佳角度为当前矫正角度，将矫正后的水平投影笔画点列最多的行作为藏文音节字的基线。

步骤2.5，将倾斜校正后的音节字数据进行多点加权平滑处理。平滑处理可消除由于手写的随意性、手写的速度和人手的抖动等因素造成的影响。平滑采用多点加权平均的方法，考虑前后5个点(当前点和其前后各两点)，权值的分配参考与当前点距离的远近。5点平滑公式如下：

式中yk是当前笔画点，w1至w5是平滑系数，yk+1、yk+2是当前笔画点的后两点，是当前笔画点前两点(上标a表示点已经平滑过)。

步骤2.6，将多点加权平滑处理后的音节字数据进行线性归一化处理。由于每个样本书写人员在手写框中写字的位置和写字的大小都不相同，为减少差异性，使每个藏文音节字大小相同，就需要对手写藏文音节字进行线性归一化处理。线性归一化的方法是将音节字在水平和垂直两方向上进行线性缩放，使得归一化后的图像大小为512×512。

步骤2.7，将线性归一化处理后的音节字数据进行非线性归一化处理。非线性归一化是对音节字调整笔画密度和重心位置，使得偏长或偏短、较粗或较细的笔画更加均匀。非线性归一化处理的公式如下：

其中m和n分别表示线性归一化后藏文手写音节字的横、纵坐标；m和n分别表示非线性归一化后图像中轨迹点的横、纵坐标；h(k)，v(l)分别表示线性归一化后图像轨迹点在水平方向和垂直方向上的投影密度函数；x，y分别表示当前点的横、纵坐标值；k，l分别表示藏文手写图像中轨迹点的第k个点的横坐标和第l个点的纵坐标的值，x，y分别表示线性归一化图像中轨迹点的横、纵坐标的最大值。

步骤2.8，对非线性归一化处理后的藏文音节字数据提取方向特征。

提取方向特征的方法是计算采样坐标点在标准方向上的方向特征。对采样点pi的方向向量做垂直投影，其映射到最近邻的两个标准方向上，投影分量分别记为其特征值大小分别为和定义每一个采样点pj＝(xj,yj)方向向量为：

如果pj＝(xj,yj)不是中间点，只需对dx,dy的计算稍作修改。如果pj＝(xj,yj)是中间点，计算出

其中，dx＝|xj+1-xj-1|，dy＝|yj+1-yj-1|，

点pi的方向量的垂直投影，映射到哪两个标准方向上是根据x，y坐标的数值所决定的。

由此可得到每个音节字手写样本的方向特征，并组成60套藏文音节字的手写特征模板库。

步骤3，手写输入藏文音节字。

音节字手写输入模块采集用户在手写状态下输入的藏文手写音节字的轨迹点序列，并按照采集顺序发送给音节字特征提取模块。在基于安卓的移动终端上手写输入藏文音节字的输入窗口界面示意图如图4所示。

步骤4，识别手写体藏文音节字。

音节字分类识别模块接收音节字特征提取模块发送来的轨迹点序列，参考步骤2建立特征模板库时对数据进行的一系列预处理和特征提取操作，得到待识别音节字的特征向量，并由欧氏距离分类器和音节字手写特征模板库进行对比。分类器计算的具体过程如下。

欧氏距离分类器是目前常用的最小距离分类器中的一种。给定n维空间中的两个点x(x1,x2,...,xn)和y(y1,y2,...,yn)，x和y之间的欧式距离d为：

计算待识别手写藏文音节字特征与特征模板库中音节字手写特征模板的欧氏距离，对计算结果按照大小由高到低排序，发送给音节字候选模块。

步骤5，显示候选的藏文音节字。

音节字候选模块接收藏文音节字手写识别模块发送来的候选的藏文音节字，按照顺序将其显示在输入界面的候选框内，如示意图5所示，等待用户选择正确的藏文音节字。

步骤6，选择并输出藏文音节字。

选择输出模块接收用户在输入界面候选框内输入的藏文音节字的选择信号，输出被选的藏文音节整字，完成藏文音节字的输入过程。

综上所述，本发明的基于音节字的全手写联机藏文输入系统，利用音节字数据库模块、音节字手写轨迹提取模块、音节字特征提取模块、音节字分类识别模块和音节字候选输出模块，实现以全手写的方式输入完整的藏文音节字，使得在移动终端的藏文音节字的输入能够更加高效、自然和便捷，满足人们的日常使用。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卢朝阳;赵晓艳;李静;袁道昱
技术所有人：西安电子科技大学
我是此专利的发明人

上一篇：一种功能调控方法、功能调控装置及终端设备与流程
上一篇：一种触摸屏的单手操作方法及单手操作装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。