一种联机手写藏文音节识别方法及装置的制造方法

文档序号:9304834阅读:182来源:国知局
一种联机手写藏文音节识别方法及装置的制造方法
【技术领域】
[0001] 本发明涉及字符识别技术领域,尤其涉及一种联机手写藏文音节识别方法及装 置。
【背景技术】
[0002] 藏文的输入方式主要包括手写输入和键盘输入。与键盘输入相比,手写输入更符 合人们的表达习惯,是一种易被用户使用、有效的实时工具,而且携带方便,操作简单。随着 智能手机、平板电脑、电子白板、iPad等移动终端设备的进步和广泛应用,联机手写藏文输 入(笔输入)算法的研究得到了越来越多的应用和关注,目前相关研究主要是以藏文字符 识别为主,并且已有支持以藏文字符为输入单元的手写输入法。然而,由于藏族语言自身的 特殊性,藏族地区的人们更希望手写藏文输入能够支持连续书写,以藏文音节为手写输入 单元,这样更符合藏族地区人们的书写习惯,但目前在联机手写藏文音节识别上的研究相 对较少,这方面的技术还没有相关的文献或专利的报道。
[0003] 在实现本发明的过程中,发明人发现现有技术中至少存在如下技术问题:
[0004] 现有的联机手写藏文音节识别方法,不能对用户连续手写输入的藏文音节进行高 效识别,不能满足藏文用户的书写习惯和需求。

【发明内容】

[0005] 本发明提供一种联机手写藏文音节识别方法及装置,能够对用户连续手写输入的 藏文音节进行高效识别,满足藏文用户的书写习惯和需求。
[0006] 本发明提供的联机手写藏文音节识别方法,包括:
[0007] 对用户连续手写输入的藏文音节的点轨迹进行预处理;
[0008] 对预处理后的藏文音节先后从水平方向和垂直方向进行过分割,得到两层标记结 果的子结构块序列;
[0009] 采用基于半马尔科夫条件随机场的分割假设验证方法,对所述两层标记结果的子 结构块序列进行分割假设验证,获取最优的分割路径及部件串的识别结果;
[0010] 根据所述最优的分割路径及部件串的识别结果,确定所述用户输入的手写藏文音 节类别。
[0011] 本发明提供的联机手写藏文音节识别装置,包括:
[0012] 预处理单元,用于对用户连续手写输入的藏文音节的点轨迹进行预处理;
[0013] 过分割单元,用于对预处理后的藏文音节先后从水平方向和垂直方向进行过分 害J,得到两层标记结果的子结构块序列;
[0014] 分割假设验证单元,用于采用基于半马尔科夫条件随机场的分割假设验证方法, 对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路径及部件串的 识别结果;
[0015] 确定单元,用于根据所述最优的分割路径及部件串的识别结果,确定所述用户输 入的手写藏文音节类别。
[0016] 本发明提供的联机手写藏文音节识别方法及装置,首先对用户连续手写输入的藏 文音节的点轨迹进行预处理,然后对预处理后的藏文音节先后从水平方向和垂直方向进行 过分割,得到两层标记结果的子结构块序列,并采用基于半马尔科夫条件随机场的分割假 设验证方法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路 径及部件串的识别结果,最后根据所述最优的分割路径及部件串的识别结果,确定所述用 户输入的手写藏文音节类别。与现有技术相比,本发明能够对用户连续手写输入的藏文音 节进行高效识别,满足藏文用户的书写习惯和需求。
【附图说明】
[0017] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它 的附图。
[0018] 图1为本发明实施例一提供的联机手写藏文音节识别方法流程图;
[0019] 图2为本发明实施例二提供的藏文音节的结构组成示意图;
[0020] 图3为本发明实施例二提供的藏文音节在水平方向的字符分割的示例图;
[0021] 图4为本发明实施例二提供的藏文音节在水平方向的错误字符分割检测及正确 分割的不例图;
[0022] 图5为本发明实施例二提供的藏文字符在垂直方向的部件分割的示例图;
[0023] 图6为本发明实施例三提供的联机手写藏文音节识别装置的结构示意图。
【具体实施方式】
[0024] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它 实施例,都属于本发明保护的范围。
[0025] 实施例一
[0026] 本实施例提供一种联机手写藏文音节识别方法,如图1所示,所述方法包括:
[0027] S11、对用户连续手写输入的藏文音节的点轨迹进行预处理。
[0028] S12、对预处理后的藏文音节先后从水平方向和垂直方向进行过分割,得到两层标 记结果的子结构块序列。
[0029] S13、采用基于半马尔科夫条件随机场的分割假设验证方法,对所述两层标记结果 的子结构块序列进行分割假设验证,获取最优的分割路径及部件串的识别结果。
[0030] S14、根据所述最优的分割路径及部件串的识别结果,确定所述用户输入的手写藏 文音节类别。
[0031] 本发明实施例提供的联机手写藏文音节识别方法,首先对用户连续手写输入的藏 文音节的点轨迹进行预处理,然后对预处理后的藏文音节先后从水平方向和垂直方向进行 过分割,得到两层标记结果的子结构块序列,并采用基于半马尔科夫条件随机场的分割假 设验证方法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路 径及部件串的识别结果,最后根据所述最优的分割路径及部件串的识别结果,确定所述用 户输入的手写藏文音节类别。与现有技术相比,本发明能够对用户连续手写输入的藏文音 节进行高效识别,满足藏文用户的书写习惯和需求。
[0032] 进一步地,所述对用户连续手写输入的藏文音节的点轨迹进行预处理可以包括: 对用户连续手写输入的藏文音节的点轨迹进行去除孤立点、等距离重采样及高斯平滑处 理。
[0033] 进一步地,所述对预处理后的藏文音节先后从水平方向和垂直方向进行过分割, 得到两层标记结果的子结构块序列可以包括:对预处理后的藏文音节先后进行水平方向的 字符分割和垂直方向的部件分割,得到两层标记结果的子结构块序列。
[0034] 进一步地,所述采用基于半马尔科夫条件随机场的分割假设验证方法,对所述两 层标记结果的子结构块序列进行分割假设验证,获取最优的分割路径及部件串的识别结果 可以包括:通过不同的权值将部件分类器、几何上下文及语言上下文集成到一个统一的识 别框架下,对所述两层标记结果的子结构块序列进行不同的分割假设验证,获取最优的分 割路径及部件串的识别结果。
[0035] 可选地,连接所述部件分类器、几何上下文及语言上下文的权值以及所述部件分 类器、几何上下文及语言上下文各自的参数可以通过基于最小化负对数似然度损失函数的 准则训练得到。
[0036] 实施例二
[0037] 本实施例提供一种联机手写藏文音节识别方法。本实施例采用中国科学院软件研 究所基础软件国家工程研究中心的多语言处理研究组的MRG-0HTC样本数据库。该数据库 包括了 150位不同书写者的手写藏文音节样本,每位书写者完成预先选取的827个高频音 节的书写,其中,两字符音节456个,三字符音节309个,四字符音节62个。选取其中130 套(书写人)样本进行训练,剩余的20套样本进行测试。此外,150套样本均采用半监督的 标定工具进行字符层和音节层的标记。
[0038] 本实施例提供的联机手写藏文音节识别方法具体过程如下:
[0039] (1)点轨迹预处理
[0040] 将一个联机手写藏文音节的输入表示为手写轨迹的
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1