一种多字手写识别的方法及装置的制作方法

文档序号：6426646阅读：119来源：国知局

专利名称：一种多字手写识别的方法及装置的制作方法
技术领域：
本发明涉及一种模式识别技术，特别是涉及一种多字手写识别的方法，以及，一种多字手写识别的装置。
背景技术：
手写识别，是指将在手写设备上书写时产生的有序轨迹信息化转化为汉字内码的过程，实际上是手写轨迹的坐标序列到汉字的内码的一个映射过程，是人机交互最自然、最方便的手段之一。用户把要输入的汉字写在书写设备上，这种设备将笔尖走过的轨迹按时间采样后发送到计算机中，由计算机软件自动完成识别，并用机器内部的方式保存、显示。目前，用于手写输入的设备有许多种，比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。随着智能手机、掌上电脑等移动信息工具的普及，手写识别技术也进入了规模应用时代。过去的手写技术需要一个字一个字的输入，输入速度较慢，目前已有多字识别技术，用户输入多个字后，系统将多个字根据空间位置等信息切割为单个字，再对单个字进行识别得到候选字符，从而得到多个字的识别结果。以上现有技术存在以下的问题以往的多字手写识别技术根据分割后字符的单字识别得到候选字符，有时由于用户书写潦草、笔画错误等原因，用户原本想输入的字与手写出来的差别较大，进行单字识别后，候选字符可能不包含用户原本要输入字，或者由于该字符在单字识别中的概率太小造成最终识别结果错误。使得最终的多字识别结果错误，大大降低了多字识别的准确率。因此，目前需要本领域技术人员迫切解决的一个技术问题就是提供一种能提高多字识别准确率和鲁棒性的多字手写识别方法及装置。

发明内容
本发明所要解决的技术问题是提供一种多字手写识别的方法，用以提高多字识别准确率和鲁棒性。相应的，本发明还提供了多字手写识别的装置，用以保证上述方法在实际中的实现及应用。为了解决上述问题，本发明公开了一种多字手写识别方法，包括采集多字输入的字符笔迹，对所述字符笔迹进行逐个单字识别；依据语言模型获取所述逐个单字识别出的在先字符的关联字符，将所述关联字符添加至下一个单字的候选识别结果中。优选的，所述依据语言模型获取逐个单字识别出的在先字符的关联字符的步骤包括依据语言模型搜索与逐个单字识别出的在先字符相关联的字符，并计算所述关联字符和单个字符的关联概率；提取所述关联概率大于预设阈值的关联字符。优选的，所述依据语言模型获取逐个单字识别出的在先字符的关联字符的步骤还包括依据语言模型搜索与逐个单字识别出的单个字符及其在先m个字符的关联字符，并计算所述关联字符和单个字符的关联概率；所述m为正整数；提取所述关联概率大于预设阈值的关联字符。优选的，所述将关联字符添加至下一个单字的候选识别结果中的步骤包括获取各个单字候选识别结果的字符间的第一关联概率，以及，所述各个单字与切分后的字符笔迹的第二关联概率；依据所述第一关联概率和第二关联概率生成的字符匹配概率选取大于预设阈值的候选识别结果。优选的，所述各单字的候选识别结果为多个，还包括对所述各单字的候选识别结果按照字符匹配概率值从大到小进行排序。本发明还提供了一种多字手写识别装置，包括采集模块，用于采集多字输入的字符笔迹，逐字识别模块，用于对所述字符笔迹进行逐个单字识别；语言模型预测模块用于依据语言模型获取所述逐个单字识别出的在先字符的关联字符；识别结果添加模块用于将所述关联字符添加至下一个单字识别结果中。优选的，所述语言模型预测模块包括单字预测子模块用于依据语言模型搜索与逐个单字识别出的在先字符相关联的字符；概率计算子模块，用于计算所述关联字符和单个字符的关联概率，并提取所述关联概率大于预设阈值的关联字符。优选的，所述语言模型预测模块包括多字预测子模块用于依据语言模型搜索与逐个单字识别出的单个字符及其在先m 个字符的关联字符；概率计算子模块，计算所述关联字符和单个字符的关联概率；所述m为正整数，提取所述关联概率大于预设阈值的关联字符。优选的，所述逐字识别模块包括字符切分子模块，用于将所采集的多字输入的字符笔迹进行切分；单字识别子模块，用于对所述切分后的字符笔迹进行单字识别。所述识别结果添加模块包括概率获取子模块，用于获取各个候选识别结果的字符间的第一关联概率，以及，所述各个单字与切分后的字符笔迹的第二关联概率；概率计算子模块，用于依据所述第一关联概率和第二关联概率生成的字符匹配概率选取大于预设阈值的候选识别结果。与现有技术相比，本发明包括以下优点
本发明通过在多字识别过程中，基于语言模型对已识别出的在先字符进行关联字符预测，并将符合预置规则的关联字符添加至下一个单字的候选识别结果中，从而大大提高了多字识别的准确率和鲁棒性。

图1是本发明的一种多字手写识别方法实施例1的流程图；图2是本发明的一种多字手写识别方法实施例2的流程图；图3是本发明的一种多字手写识别的装置实施例的结构框图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式
对本发明作进一步详细的说明。用户进行多字手写输入时经常会出现书写潦草、笔画错误等问题，例如，用户手写输入“学校”两个字，但是“校”字写得比较潦草，对这两个字进行逐字单字识别时，“校”可能识别为“较”，“极”，“板”等字，由于手写的“校”字与该字本身差别比较大，识别结果不包括“校”字。此时，手写输入的结果与用户本想输入的结果不一样。本发明实施例的核心构思之一在于，在多字识别过程中，基于语言模型对已识别出的在先字符进行关联字符预测，并将符合预置规则的关联字符添加至下一个单字的候选识别结果中。参考图1，示出了本发明的一种多字手写识别方法实施例1的流程图，具体可以包括以下步骤步骤101、采集多字输入的字符笔迹，对所述字符笔迹进行逐个单字识别；步骤102、依据语言模型获取所述逐个单字识别出的在先字符的关联字符，将所述关联字符添加至下一个单字的候选识别结果中。在本发明的一种优选实施例中，所述步骤102可以包括如下子步骤子步骤S11、依据语言模型搜索与逐个单字识别出的在先字符相关联的字符，并计算所述关联字符和单个字符的关联概率；子步骤S12、提取所述关联概率大于预设阈值的关联字符。另外，本发明的方法还包括，由以上单字识别的候选结果得到多字识别结果。在本发明实施例中，语言模型是用来计算字符间关联概率的概率模型，主要有两个用途1、计算关联概率；2、已知若干个字符，预测下一个字符。字符间的关联信息可以通过概率表示，可以用语言模型来计算。将逐个单字识别的结果根据语言模型组合成字、词、短语或句子，语言模型可以计算短语或句子的概率。如“木”和“交”组成一个字“校”，“学”和“校”组成一个词“学校”，对于每个词、句、短语或句子，语言模型会计算出正确的概率有多大。例如，单字识别结果 “学”和“校”组成一个词“学校”，另一个识别结果“字”和“校”组成一个词“字校”，由语言模型可知。“学校”的概率要大于“字校”的概率。在本实施例中，语言模型用于根据前一个字符预测下一字符。语言模型包含字、词、短语和句子，在其中搜索与在先字符相关的字符，对应的搜索出来的短语或句子都有各自的关联概率，上面的“学校”例子中，“校”字比较潦草，可以在语言模型中搜索与“学”相关的字符，例如，与“学”相关的字符可以组成“学校”、“学习”、“学无止境”等，对应这三个词，关联概率值分别是A、B、C，其中与“学”相关的字符分别是“校”、“习”、“无”，将这三个字符作为“学”的语言模型获取的关联字符。用语言模型得到所述关联字符及对应的关联概率后，选取关联概率大于预设阈值，如关联概率大于60%的关联字符，将这些关联字符添加到“校”的候选识别结果中。在本发明另一种优选的实施例中，所述步骤102可以包括如下子步骤子步骤S21、依据语言模型搜索与逐个单字识别出的单个字符及其在先m个字符的关联字符，并计算所述关联字符和单个字符的关联概率；所述m为正整数；子步骤S22、提取所述关联概率大于预设阈值的关联字符。应用语言模型时，一种简单的方法是只考虑前后两个字的概率，如“校”前面“学” 的概率是多少，但是实际情况中，相邻的两个字不一定是一个常见的词，但是再加上前面的多个字可能会更常见，例如，“天安门，，这个词中，“安”和“门，，组成的“安门，，并不常见，但是加上“天”后，组成“天安门”是较为常见的词，所以在实际情况中也可以考虑前前字(或者更多的字)，即在本实施例中，语言模型用于根据前面多个字符预测下一字符。应用本实施例，计算量和存储空间会增加很多。参考图2，示出了本发明的一种多字手写识别方法实施例2的流程图，具体可以包括以下步骤步骤201，采集多字输入的字符笔迹。用户写入的字符可能包括中文文字，标点符号，英文字母等形式，可以是以行，列或叠字的方式输入。采集用户连续输入的字符笔迹，所述字符笔迹是以笔画形式输入的信息。采集用户笔迹的设备有多种，比如电磁感应手写板、压感式手写板、触摸屏、触控板、超声波笔等。不同设备在采集时都是利用设备上安装的感应装置记录下用户书写的笔迹点。通常将落笔的位置记为一个笔画的起始位置，抬笔的位置记为一个笔画的终止位置，落笔和抬笔间的一系列笔迹电构成一个输入笔画。步骤202，将所采集的多字输入的字符笔迹进行切分。对字符进行切分是为了得到单个字符，以进行接下来的单字识别。由于用户输入的方式不同，各个字符间的相对位置也不同，因此切分的方式也有不同。若字符以行连续输入，则根据字符笔迹中笔画的左右位置进行切分；若字符以列连续输入，则根据字符笔迹中笔画的上下位置进行切分；若字符以叠字连续输入，则根据输入顺序和字符笔迹中笔画的相对位置进行切分。所述切分是指将采集到的字符笔迹以候选切分点进行笔画切分，切分后的笔画根据候选切分点组合成不同的切分路径，对于同样一组字符笔迹，切分后得到至少一条切分路径。若字符以行连续输入，则根据字符笔迹中笔画的左右位置进行切分，包括将字符笔迹中所有笔画的坐标点向X轴投影，若两个笔画在X轴投影的间隙满足预置阀值，则所述两个笔画间之间为候选切分点；若不满足，则将所述两个笔画合为一个切
7分块，并继续将该切分块与左或右相邻的笔画进行上述投影间隙的判断；切分后的笔画或切分块根据候选切分点组合成不同的切分结果。若字符以列连续输入，则根据字符笔迹中笔画的上下位置进行切分，包括将字符笔迹中所有笔画的坐标点向Y轴投影，若两个笔画在Y轴投影的间隙满足预置阀值，则所述两个笔画间之间为候选切分点；若不满足，则将所述两个笔画合为一个切分块，并继续将该切分块与上或下相邻的笔画进行上述投影间隙的判断；切分后的笔画或切分块根据候选切分点组合成不同的切分结果。若字符以叠字连续输入，则根据输入顺序和字符笔迹中笔画的相对位置进行切分，包括若笔画的起始点在叠字输入的区域的左上角位置，则在该笔画与上一个输入的笔画之间为候选切分点；若笔画的起始点在叠字输入的区域的右下角位置，则将该笔画与上一个输入的笔画合并为一个切分块；若笔画的起始点在上一个输入笔画的下方或是右方位置，则将该笔画与上一个输入的笔画合并为一个切分块；切分后的笔画或切分块根据候选切分点组合成为不同的切分结果。以上各个切分方式得到至少一个切分结果，例如输入“学校”，对应的可以切分为学/木/交/、学/校、学木/交/、学木交。接下来对所述字符笔迹进行逐个单字识别。步骤203，对所述切分后的字符笔迹进行单字识别，获得单字的候选识别结果。对所述字符笔迹的切分结果进行单字识别，得到单字的候选识别结果，及所述候选识别结果和切分结果相似度的单字概率值；各个切分结果中的单字进行识别后，可能会得到多个单字的候选识别结果，每个单字的候选识别结果和切分结果的相似度不同，以单字概率值表示所述相似度。例如对于“学校”，对应的4条切分结果“学/木/交/、学/校、学木/交/、学木交”分别进行识别，针对其中一个切分结果“学/校”进行单字识别，倘若“校”字写得比较潦草，“对应“校学”就可能会识别为“较”、“极”、“板”等等，每个单字的候选识别结果都得到一个单字概率值，对应的“较”、“极”、“板”的单字概率值为a、b、c。由于用户手写出来的与该字本身差别较大，候选识别结果可能就不包括“校”字，或者“校”字对应的概率远远小于前面三个字的概率；同样对于“学”也进行单字识别得到一个或多个候选识别结果以及每个候选识别结果的单字概率值。其他切分方式的单字识别过程相同，不再一一详述。步骤204，依据语言模型获取所述逐个单字识别出的在先字符的关联字符，将所述关联字符添加至下一个单字的候选识别结果中。在本发明的一种优选实施例中，所述将关联字符添加至下一个单字的候选识别结果中的步骤具体可以包括以下子步骤子步骤S31，获取各个候选识别结果的字符间的第一关联概率，以及各个单字与切分后的字符笔迹的第二关联概率。进行单字识别得到候选识别结果的同时还得到了单字候选识别结果与切分后的字符笔迹的单字概率值即第二关联概率，用语言模型计算各个单字识别结果的字符间的第一关联概率值；得到关联字符的同时还得到了各关联字符对应的关联概率即第一关联概率，将关联字符返回单字识别计算各个单字与切分后的字符笔迹的第二关联概率。子步骤S32，依据所述第一关联概率和第二关联概率生成字符匹配概率，选取字符匹配概率大于预设阈值的候选识别结果。如上例，对“学校”进行单字识别时，“校”字比较潦草，现有技术进行单字识别后候选识别结果中可能不包含“校”或者“校”的概率过小，本发明利用语言模型将“校”加入候选识别结果。由于输入笔迹与原本想输入的字差别较大，与其他的单字识别结果“较”、“极”、 “板”相比，其第二关联概率值可能会比较小，但其与“学”组成的“学校”与“学较”、“学极”、 “学板”相比，“校”的第一关联概率会大很多，这样，“校”字符匹配概率就可能大于其他三个字，被用户采纳的可能性就会大大增加。计算字符匹配概率时，一种简单的方法是将第一关联概率和第二关联概率进行加权相加，得到单字候选识别结果中每个单字对应的一个字符匹配概率。当然，也可以采用其他更复杂的计算方法，本发明实施例在此不做限定。优选的，所述单字候选识别结果为多个，在这种情况下，本发明实施例还可以包括以下步骤对所述单字候选识别结果按照字符匹配概率值从大到小进行排序，得到字符匹配概率从大到小的单字候选识别结果。另外，本发明的方法还包括，由以上单字的候选识别结果得到多字识别结果。综上所述，本发明提供了一种基于语言模型的一种多字识别方法，当用户手写的字与原本想输入的字笔迹差别较大时，根据字符之间的关联性对字符进行预测，并添加到多字候选识别结果中，从而大大提高了多字识别的准确率。需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明并不受所描述的动作顺序的限制，因为依据本发明，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本发明所必须的。参考图3，示出了本发明的一种多字手写识别的装置实施例的结构框图，具体可以包括以下模块采集模块301，用于采集多字输入的字符笔迹，逐字识别模块302，用于对所述字符笔迹进行逐个单字识别；语言模型预测模块303，用于依据语言模型获取所述逐个单字识别出的在先字符的关联字符；识别结果添加模块304，用于将所述关联字符添加至下一个单字的候选识别结果中。在本发明的实施例中，所述逐字识别模块包括字符切分子模块S11，用于将所采集的多字输入的字符笔迹进行切分；单字识别子模块S12，用于对所述切分后的字符笔迹进行单字识别。在本发明一种优选的实施例中，所述语言模型预测模块可以包括如下子模块单字预测子模块S21，用于依据语言模型搜索与逐个单字识别出的在先字符相关联的字符；概率计算子模块S22，用于计算所述关联字符和单个字符的关联概率，并提取所述关联概率大于预设阈值的关联字符。在本发明另一种优选的实施例中，所述语言模型预测模块可以包括如下子模块多字预测子模块S31，用于依据语言模型搜索与逐个单字识别出的单个字符及其在先m个字符的关联字符；概率计算子模块S32，计算所述关联字符和单个字符的关联概率；所述m为正整数，提取所述关联概率大于预设阈值的关联字符。在本发明的一种优选实施例中，所述识别结果添加模块，包括概率获取子模块S41，用于获取各个单字的候选识别结果的字符间的第一关联概率，以及，所述各个单字与切分后的字符笔迹的第二关联概率；概率计算子模块S42，用于依据所述第一关联概率和第二关联概率生成的字符匹配概率选取大于预设阈值的单字候选识别结果。由于所述装置实施例基本相应于前述图1和图2所示的方法实施例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此就不赘述了。本发明可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。以上对本发明所提供的一种多字手写识别的方法以及一种多字手写识别的装置进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式
及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。
权利要求
1.一种多字手写识别方法，其特征在于，包括采集多字输入的字符笔迹，对所述字符笔迹进行逐个单字识别；依据语言模型获取所述逐个单字识别出的在先字符的关联字符，将所述关联字符添加至下一个单字的候选识别结果中。
2.根据权利要求1所述的方法，其特征在于，所述依据语言模型获取逐个单字识别出的在先字符的关联字符的步骤包括依据语言模型搜索与逐个单字识别出的在先字符相关联的字符，并计算所述关联字符和单个字符的关联概率；提取所述关联概率大于预设阈值的关联字符。
3.根据权利要求1所述的方法，其特征在于，所述依据语言模型获取逐个单字识别出的在先字符的关联字符的步骤还包括依据语言模型搜索与逐个单字识别出的单个字符及其在先m个字符的关联字符，并计算所述关联字符和单个字符的关联概率；所述m为正整数；提取所述关联概率大于预设阈值的关联字符。
4.根据权利要求1、2或3所述的方法，其特征在于，所述对字符笔迹进行逐个单字识别的步骤包括将所采集的多字输入的字符笔迹进行切分，对所述切分后的字符笔迹进行单字识别。
5.根据权利要求4所述的方法，其特征在于，所述将关联字符添加至下一个单字的候选识别结果中的步骤包括获取各个单字候选识别结果的字符间的第一关联概率，以及，所述各个单字与切分后的字符笔迹的第二关联概率；依据所述第一关联概率和第二关联概率生成的字符匹配概率选取大于预设阈值的候选识别结果。
6.根据权利要求5所述的方法，其特征在于，所述各单字的候选识别结果为多个，还包括对所述各单字的候选识别结果按照字符匹配概率值从大到小进行排序。
7.一种多字手写识别装置，其特征在于，包括采集模块，用于采集多字输入的字符笔迹，逐字识别模块，用于对所述字符笔迹进行逐个单字识别；语言模型预测模块，用于依据语言模型获取所述逐个单字识别出的在先字符的关联字符；识别结果添加模块，用于将所述关联字符添加至下一个单字识别结果中。
8.根据权利要求7所述的装置，其特征在于，所述语言模型预测模块包括单字预测子模块，用于依据语言模型搜索与逐个单字识别出的在先字符相关联的字符；概率计算子模块，用于计算所述关联字符和单个字符的关联概率，并提取所述关联概率大于预设阈值的关联字符。
9.根据权利要求7所述的装置，其特征在于，所述语言模型预测模块包括多字预测子模块，用于依据语言模型搜索与逐个单字识别出的单个字符及其在先m个字符的关联字符；概率计算子模块，计算所述关联字符和单个字符的关联概率；所述m为正整数，提取所述关联概率大于预设阈值的关联字符。
10.根据权利要求7、8或9所述的装置，其特征在于，所述逐字识别模块包括字符切分子模块，用于将所采集的多字输入的字符笔迹进行切分；单字识别子模块，用于对所述切分后的字符笔迹进行单字识别；所述识别结果添加模块包括概率获取子模块，用于获取各个候选识别结果的字符间的第一关联概率，以及，所述各个单字与切分后的字符笔迹的第二关联概率；概率计算子模块，用于依据所述第一关联概率和第二关联概率生成的字符匹配概率选取大于预设阈值的候选识别结果。
全文摘要
本发明提供了一种多字手写识别方法及装置。所述方法包括采集多字输入的字符笔迹，对所述字符笔迹进行逐个单字识别；依据语言模型获取所述逐个单字识别出的在先字符的关联字符，将所述关联字符添加至下一个单字的候选识别结果中。本发明可以提高多字识别准确率和鲁棒性。
文档编号G06K9/68GK102236799SQ201110166459
公开日2011年11月9日申请日期2011年6月20日优先权日2011年6月20日
发明者李健, 郑晓明申请人:北京捷通华声语音技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李健;郑晓明
技术所有人：北京捷通华声语音技术有限公司
我是此专利的发明人

上一篇：便携式个人服务终端的制作方法
上一篇：Rfid阅读器及控制该rfid阅读器的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。