一种联机手写藏文音节识别方法及装置的制造方法

文档序号：9304834阅读：182来源：国知局

一种联机手写藏文音节识别方法及装置的制造方法
【技术领域】
[0001] 本发明涉及字符识别技术领域，尤其涉及一种联机手写藏文音节识别方法及装置。
【背景技术】
[0002] 藏文的输入方式主要包括手写输入和键盘输入。与键盘输入相比，手写输入更符合人们的表达习惯，是一种易被用户使用、有效的实时工具，而且携带方便，操作简单。随着智能手机、平板电脑、电子白板、iPad等移动终端设备的进步和广泛应用，联机手写藏文输入（笔输入）算法的研究得到了越来越多的应用和关注，目前相关研究主要是以藏文字符识别为主，并且已有支持以藏文字符为输入单元的手写输入法。然而，由于藏族语言自身的特殊性，藏族地区的人们更希望手写藏文输入能够支持连续书写，以藏文音节为手写输入单元，这样更符合藏族地区人们的书写习惯，但目前在联机手写藏文音节识别上的研究相对较少，这方面的技术还没有相关的文献或专利的报道。
[0003] 在实现本发明的过程中，发明人发现现有技术中至少存在如下技术问题：
[0004] 现有的联机手写藏文音节识别方法，不能对用户连续手写输入的藏文音节进行高效识别，不能满足藏文用户的书写习惯和需求。

【发明内容】

[0005] 本发明提供一种联机手写藏文音节识别方法及装置，能够对用户连续手写输入的藏文音节进行高效识别，满足藏文用户的书写习惯和需求。
[0006] 本发明提供的联机手写藏文音节识别方法，包括：
[0007] 对用户连续手写输入的藏文音节的点轨迹进行预处理；
[0008] 对预处理后的藏文音节先后从水平方向和垂直方向进行过分割，得到两层标记结果的子结构块序列；
[0009] 采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果；
[0010] 根据所述最优的分割路径及部件串的识别结果，确定所述用户输入的手写藏文音节类别。
[0011] 本发明提供的联机手写藏文音节识别装置，包括：
[0012] 预处理单元，用于对用户连续手写输入的藏文音节的点轨迹进行预处理；
[0013] 过分割单元，用于对预处理后的藏文音节先后从水平方向和垂直方向进行过分害J，得到两层标记结果的子结构块序列；
[0014] 分割假设验证单元，用于采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果；
[0015] 确定单元，用于根据所述最优的分割路径及部件串的识别结果，确定所述用户输入的手写藏文音节类别。
[0016] 本发明提供的联机手写藏文音节识别方法及装置，首先对用户连续手写输入的藏文音节的点轨迹进行预处理，然后对预处理后的藏文音节先后从水平方向和垂直方向进行过分割，得到两层标记结果的子结构块序列，并采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果，最后根据所述最优的分割路径及部件串的识别结果，确定所述用户输入的手写藏文音节类别。与现有技术相比，本发明能够对用户连续手写输入的藏文音节进行高效识别，满足藏文用户的书写习惯和需求。
【附图说明】
[0017] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。
[0018] 图1为本发明实施例一提供的联机手写藏文音节识别方法流程图；
[0019] 图2为本发明实施例二提供的藏文音节的结构组成示意图；
[0020] 图3为本发明实施例二提供的藏文音节在水平方向的字符分割的示例图；
[0021] 图4为本发明实施例二提供的藏文音节在水平方向的错误字符分割检测及正确分割的不例图；
[0022] 图5为本发明实施例二提供的藏文字符在垂直方向的部件分割的示例图；
[0023] 图6为本发明实施例三提供的联机手写藏文音节识别装置的结构示意图。
【具体实施方式】
[0024] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0025] 实施例一
[0026] 本实施例提供一种联机手写藏文音节识别方法，如图1所示，所述方法包括：
[0027] S11、对用户连续手写输入的藏文音节的点轨迹进行预处理。
[0028] S12、对预处理后的藏文音节先后从水平方向和垂直方向进行过分割，得到两层标记结果的子结构块序列。
[0029] S13、采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果。
[0030] S14、根据所述最优的分割路径及部件串的识别结果，确定所述用户输入的手写藏文音节类别。
[0031] 本发明实施例提供的联机手写藏文音节识别方法，首先对用户连续手写输入的藏文音节的点轨迹进行预处理，然后对预处理后的藏文音节先后从水平方向和垂直方向进行过分割，得到两层标记结果的子结构块序列，并采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果，最后根据所述最优的分割路径及部件串的识别结果，确定所述用户输入的手写藏文音节类别。与现有技术相比，本发明能够对用户连续手写输入的藏文音节进行高效识别，满足藏文用户的书写习惯和需求。
[0032] 进一步地，所述对用户连续手写输入的藏文音节的点轨迹进行预处理可以包括：对用户连续手写输入的藏文音节的点轨迹进行去除孤立点、等距离重采样及高斯平滑处理。
[0033] 进一步地，所述对预处理后的藏文音节先后从水平方向和垂直方向进行过分割，得到两层标记结果的子结构块序列可以包括：对预处理后的藏文音节先后进行水平方向的字符分割和垂直方向的部件分割，得到两层标记结果的子结构块序列。
[0034] 进一步地，所述采用基于半马尔科夫条件随机场的分割假设验证方法，对所述两层标记结果的子结构块序列进行分割假设验证，获取最优的分割路径及部件串的识别结果可以包括：通过不同的权值将部件分类器、几何上下文及语言上下文集成到一个统一的识别框架下，对所述两层标记结果的子结构块序列进行不同的分割假设验证，获取最优的分割路径及部件串的识别结果。
[0035] 可选地，连接所述部件分类器、几何上下文及语言上下文的权值以及所述部件分类器、几何上下文及语言上下文各自的参数可以通过基于最小化负对数似然度损失函数的准则训练得到。
[0036] 实施例二
[0037] 本实施例提供一种联机手写藏文音节识别方法。本实施例采用中国科学院软件研究所基础软件国家工程研究中心的多语言处理研究组的MRG-0HTC样本数据库。该数据库包括了 150位不同书写者的手写藏文音节样本，每位书写者完成预先选取的827个高频音节的书写，其中，两字符音节456个，三字符音节309个，四字符音节62个。选取其中130 套（书写人）样本进行训练，剩余的20套样本进行测试。此外，150套样本均采用半监督的标定工具进行字符层和音节层的标记。
[0038] 本实施例提供的联机手写藏文音节识别方法具体过程如下：
[0039] (1)点轨迹预处理
[0040] 将一个联机手写藏文音节的输入表示为手写轨迹的

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马龙龙;吴健;
技术所有人：中国科学院软件研究所;
我是此专利的发明人

上一篇：自助发卡退卡一体机及其控制方法
上一篇：基于hmm和决策树的阿拉伯语光学字母识别方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。