多方向的手写文本识别方法、装置、设备及存储介质与流程

文档序号:35277530发布日期:2023-08-31 20:25阅读:28来源:国知局
多方向的手写文本识别方法、装置、设备及存储介质与流程

本发明涉及计算机,尤其涉及一种多方向的手写文本识别方法、装置、设备及存储介质。


背景技术:

1、联机手写文本行识别是一种把一行手写文字的动态笔迹转换为字符串的技术。与印刷体识别相比,手写识别也由于要应付因人而异的书写习惯而更为困难;与脱机手写识别相比,联机手写识别则由于有额外的时序信息和较少的背景噪声而更有希望达到较高的准确性。

2、目前来说,大部分现有的联机手写识别系统都是针对横写设计的。然而,中日韩等语言传统上是竖写的,而且时至今日仍然在一些场合上使用。有时候横写和竖写还会混合使用,例如对联使用竖写而上方的横批使用横写。因此,同时支持横写和竖写而不需要用户切换模式的联机手写识别方法是有广阔的前景。


技术实现思路

1、鉴于以上技术问题,本发明提供了一种多方向的手写文本识别方法、装置、设备及存储介质,以实现对联机手写文本行的书写方向识别。

2、本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。

3、根据本发明的一方面,提出了一种多方向的手写文本识别方法,所述识别方法包括:

4、估计手写文本的书写方向;

5、根据估计的书写方向,对所述手写文本的输入笔画进行排序;

6、利用端到端的可训练的序列到序列模型把排序后的所述输入笔画转换为字符串。

7、进一步的,所述估计手写文本的书写方向,包括:

8、对所述手写文本的笔画序列进行重新采样,使得同一笔画上相邻采样点间的笔画长度在预设阈值范围浮动;

9、计算采样所得的所有采样点所组成集合的各二阶中心矩;

10、根据所述各二阶中心矩,计算所述采样点的集合的长轴方向;

11、根据所述长轴方向,估计所述手写文本的书写方向。

12、进一步的,所述对所述手写文本的笔画序列进行重新采样,包括:

13、设定所述手写文本的输入笔画由m条笔画组成,其中,第i条笔画由ni个采样点组成(j=1,…,ni),记所述采样点的总数为

14、所述计算采样所得的所有采样点所组成集合的各二阶中心矩,包括:

15、根据所述采样点的总数,将其重心坐标表示为进而,所述各二阶中心矩表示为:

16、

17、所述计算计算所述采样点的集合的长轴方向,包括:

18、基于所述各二阶中心矩,计算所述采样点的集合的距离及距离平方和最小的直线与x轴的夹角θ,夹角θ表示为:或从而得到θ=θi,θ=θi即为估计的所述手写文本的书写方向,其中:

19、

20、进一步的,所述对所述手写文本的输入笔画进行排序,包括:

21、在估计的书写方向较接近竖写的方向时,按从上到下的顺序对所有的输入笔画进行排序;

22、在估计的书写方向较接近横写的方向时,按从左到右的顺序对所有的输入笔画进行排序。

23、进一步的,所述利用端到端的可训练的序列到序列模型中,其训练样本包括以下情况的一种或多种:

24、所述训练样本中的输入笔画按照估计的书写方向进行排序;

25、所述训练样本中包括人类书写的横写文本行样本;

26、所述训练样本中包括利用手写单字符样本沿随机方向按语料排布合成的样本。

27、进一步的,所述训练样本的合成方法包括:

28、从语料库中随机取一个长度在预设范围内的第一文本片段;

29、设置一条具有固定倾角的射线;

30、从联机手写单字符数据集中取出的第二文本片段中取出对应于第一个字符的其中一种轨迹,将其平移到以所述射线起点为中心并加入正在合成的轨迹中;

31、对于所述第二文本片段中余下的字符,继续从联机手写单字符数据集中找出对应的轨迹,将其平移到中心在所述射线上并加入正在合成的所述轨迹中,且与前一字符的中心的距离符合正态分布;

32、对所述轨迹进行浮动范围内的形变。

33、根据本公开的第二方面,提供一种多方向的手写文本识别装置,包括识别模块,所述识别模块用于估计手写文本的书写方向;处理模块,所述处理模块用于根据估计的书写方向,对所述手写文本的输入笔画进行排序;转换模块,所述转换模块用于利用端到端的可训练的序列到序列模型把排序后的所述输入笔画转换为字符串。

34、根据本公开的第三方面,提供一种多方向的手写文本识别设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器:估计手写文本的书写方向;根据估计的书写方向,对所述手写文本的输入笔画进行排序;利用端到端的可训练的序列到序列模型把排序后的所述输入笔画转换为字符串。

35、根据本公开的第四方面,提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时上述的识别方法。

36、本公开的技术方案具有以下有益效果:

37、本发明能够把沿各种方向书写的手写轨迹识别为字符串,以适用于更多的使用场景,而且可以进一步地支持倒笔书写识别。



技术特征:

1.一种多方向的手写文本识别方法,其特征在于,所述识别方法包括:

2.根据权利要求1所述的多方向的手写文本识别方法,其特征在于,所述估计手写文本的书写方向,包括:

3.根据权利要求2所述的多方向的手写文本识别方法,其特征在于,所述对所述手写文本的笔画序列进行重新采样,包括:

4.根据权利要求1所述的多方向的手写文本识别方法,其特征在于,所述对所述手写文本的输入笔画进行排序,包括:

5.根据权利要求1所述的多方向的手写文本识别方法,其特征在于,所述利用端到端的可训练的序列到序列模型中,其训练样本包括以下情况的一种或多种:

6.根据权利要求4所述的多方向的手写文本识别方法,其特征在于,所述训练样本的合成方法包括:

7.一种多方向的手写文本识别装置,包括:

8.一种多方向的手写文本识别设备,包括:

9.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6中任一所述的多方向的手写文本识别方法。


技术总结
本发明公开一种多方向的手写文本识别方法、装置、设备及存储介质,识别方法包括:估计手写文本的书写方向;根据估计的书写方向,对所述手写文本的输入笔画进行排序;利用端到端的可训练的序列到序列模型把排序后的所述输入笔画转换为字符串。本发明能够把沿各种方向书写的手写轨迹识别为字符串,以适用于更多的使用场景,而且可以进一步地支持倒笔书写识别。

技术研发人员:庄建明,陈颂光
受保护的技术使用者:深圳市泓宇星科技有限公司
技术研发日:
技术公布日:2024/1/14
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1