一种联机手写藏文音节识别方法及装置的制造方法_3

文档序号:9304834阅读:来源:国知局
音节类 别。
[0068] 表1和表2分别列出了采用基于半马尔科夫条件随机场的分割假设验证方法融合 几何上下文和语言上下文的效果,从表中可看出几何上下文和语言上下文都改进了藏文音 节识别的精度,在语言上下文中,基于部件的bi-gram比基于字符的bi-gram对藏文音节识 别精度的贡献更大,这主要是因为整个音节的识别框架是在部件层构建。
[0069] 表1几何上下文对音节识别精度的影响
[0070]
[0071] 表2语言上下文对音节识别精度的影响^ '[0072]
[0073]
[0074] 实施例三
[0075] 本发明实施例提供一种联机手写藏文音节识别装置,如图6所示,所述装置包括:
[0076] 预处理单元11,用于对用户连续手写输入的藏文音节的点轨迹进行预处理;
[0077] 过分割单元12,用于对预处理后的藏文音节先后从水平方向和垂直方向进行过分 害J,得到两层标记结果的子结构块序列;
[0078] 分割假设验证单元13,用于采用基于半马尔科夫条件随机场的分割假设验证方 法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路径及部件 串的识别结果;
[0079] 确定单元14,用于根据所述最优的分割路径及部件串的识别结果,确定所述用户 输入的手写藏文音节类别。
[0080] 本发明实施例提供的联机手写藏文音节识别装置,首先对用户连续手写输入的藏 文音节的点轨迹进行预处理,然后对预处理后的藏文音节先后从水平方向和垂直方向进行 过分割,得到两层标记结果的子结构块序列,并采用基于半马尔科夫条件随机场的分割假 设验证方法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路 径及部件串的识别结果,最后根据所述最优的分割路径及部件串的识别结果,确定所述用 户输入的手写藏文音节类别。与现有技术相比,本发明能够对用户连续手写输入的藏文音 节进行高效识别,满足藏文用户的书写习惯和需求。
[0081] 进一步地,所述预处理单元11,用于对用户连续手写输入的藏文音节的点轨迹进 行去除孤立点、等距离重采样及高斯平滑处理。
[0082] 进一步地,所述过分割单元12,用于对预处理后的藏文音节先后进行水平方向的 字符分割和垂直方向的部件分割,得到两层标记结果的子结构块序列。
[0083] 进一步地,所述分割假设验证单元13,用于通过不同的权值将部件分类器、几何上 下文及语言上下文集成到一个统一的识别框架下,对所述两层标记结果的子结构块序列进 行不同的分割假设验证,获取最优的分割路径及部件串的识别结果。
[0084] 可选地,连接所述部件分类器、几何上下文及语言上下文的权值以及所述部件分 类器、几何上下文及语言上下文各自的参数通过基于最小化负对数似然度损失函数的准则 训练得到。
[0085] 本发明实施例提供的联机手写藏文音节识别方法及装置,可以适用于对用户连续 手写输入的藏文音节进行识别,但不仅限于此。
[0086] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以 通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质 中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁 碟、光盘、只读存储记忆体(Read-OnlyMemory,ROM)或随机存储记忆体(RandomAccess Memory,RAM)等。
[0087] 以上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应 涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
【主权项】
1. 一种联机手写藏文音节识别方法,其特征在于,包括: 对用户连续手写输入的藏文音节的点轨迹进行预处理; 对预处理后的藏文音节先后从水平方向和垂直方向进行过分割,得到两层标记结果的 子结构块序列; 采用基于半马尔科夫条件随机场的分割假设验证方法,对所述两层标记结果的子结构 块序列进行分割假设验证,获取最优的分割路径及部件串的识别结果; 根据所述最优的分割路径及部件串的识别结果,确定所述用户输入的手写藏文音节类 别。2. 根据权利要求1所述的方法,其特征在于,所述对用户连续手写输入的藏文音节的 点轨迹进行预处理包括:对用户连续手写输入的藏文音节的点轨迹进行去除孤立点、等距 离重采样及高斯平滑处理。3. 根据权利要求1所述的方法,其特征在于,所述对预处理后的藏文音节先后从水平 方向和垂直方向进行过分割,得到两层标记结果的子结构块序列包括:对预处理后的藏文 音节先后进行水平方向的字符分割和垂直方向的部件分割,得到两层标记结果的子结构块 序列。4. 根据权利要求1所述的方法,其特征在于,所述采用基于半马尔科夫条件随机场的 分割假设验证方法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的 分割路径及部件串的识别结果包括:通过不同的权值将部件分类器、几何上下文及语言上 下文集成到一个统一的识别框架下,对所述两层标记结果的子结构块序列进行不同的分割 假设验证,获取最优的分割路径及部件串的识别结果。5. 根据权利要求4所述的方法,其特征在于,连接所述部件分类器、几何上下文及语言 上下文的权值以及所述部件分类器、几何上下文及语言上下文各自的参数通过基于最小化 负对数似然度损失函数的准则训练得到。6. -种联机手写藏文音节识别装置,其特征在于,包括: 预处理单元,用于对用户连续手写输入的藏文音节的点轨迹进行预处理; 过分割单元,用于对预处理后的藏文音节先后从水平方向和垂直方向进行过分割,得 到两层标记结果的子结构块序列; 分割假设验证单元,用于采用基于半马尔科夫条件随机场的分割假设验证方法,对所 述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路径及部件串的识别 结果; 确定单元,用于根据所述最优的分割路径及部件串的识别结果,确定所述用户输入的 手写藏文音节类别。7. 根据权利要求6所述的装置,其特征在于,所述预处理单元,用于对用户连续手写输 入的藏文音节的点轨迹进行去除孤立点、等距离重采样及高斯平滑处理。8. 根据权利要求6所述的装置,其特征在于,所述过分割单元,用于对预处理后的藏文 音节先后进行水平方向的字符分割和垂直方向的部件分割,得到两层标记结果的子结构块 序列。9. 根据权利要求6所述的装置,其特征在于,所述分割假设验证单元,用于通过不同的 权值将部件分类器、几何上下文及语言上下文集成到一个统一的识别框架下,对所述两层 标记结果的子结构块序列进行不同的分割假设验证,获取最优的分割路径及部件串的识别 结果。10.根据权利要求9所述的装置,其特征在于,连接所述部件分类器、几何上下文及语 言上下文的权值以及所述部件分类器、几何上下文及语言上下文各自的参数通过基于最小 化负对数似然度损失函数的准则训练得到。
【专利摘要】本发明提供一种联机手写藏文音节识别方法及装置,涉及字符识别技术领域,用于解决现有技术不能对用户连续手写输入的藏文音节进行高效识别的问题。所述方法包括:对用户连续手写输入的藏文音节的点轨迹进行预处理;对预处理后的藏文音节先后从水平方向和垂直方向进行过分割,得到两层标记结果的子结构块序列;采用基于半马尔科夫条件随机场的分割假设验证方法,对所述两层标记结果的子结构块序列进行分割假设验证,获取最优的分割路径及部件串的识别结果;根据所述最优的分割路径及部件串的识别结果,确定所述用户输入的手写藏文音节类别。本发明适用于对用户连续手写输入的藏文音节进行识别。
【IPC分类】G06K9/72, G06K9/62
【公开号】CN105023029
【申请号】CN201510370046
【发明人】马龙龙, 吴健
【申请人】中国科学院软件研究所
【公开日】2015年11月4日
【申请日】2015年6月29日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1