一种手绘形状识别的方法及装置的制作方法

文档序号:6464263阅读:234来源:国知局

专利名称::一种手绘形状识别的方法及装置的制作方法
技术领域
:本发明涉及模式识别领域,特别涉及一种手绘形状识别的方法及一种手绘形状识别的装置。
背景技术
:模式识别是利用计算机对表征事物或现象的各种形式(如数值形式、文字形式和逻辑关系形式)的信息,比如图片、文字、符号、声音等进行自动识别的技术。目前,手写识别技术作为模式识别的一个方面,得到了广泛的应用。手写识别技术是基于对手写输入笔画的识别,将用户通过某种输入设备(如移动终端、手写板等)输入的信息转换成计算机可识读并能直接处理的形式。现有技术中,手写识别技术主要用于字符识别,如移动终端、手写板的手写输入法的应用等。而对于字符之外的手绘形状输入,如表格、形状图形、框图等,则需要通过各种软件编辑器(如Word、Visio等)提供的形状工具进行输入。在这种情况下,用户需要先掌握所用软件编辑器的用法,然后才能按照该软件编辑器设定的规则进行形状输入,并且,使用这种软件编辑器输入手绘形状时,会受到软件编辑器的功能限制,一般只能支持输入有限种类的内置图形。可以看出,这种手绘形状输入方式并非自然输入方式,对用户要求比4交高,用户无法随意输入软件编辑器尚不支持的形状图形,用户体验较差。如中国专利公开号为CN1607540,名称为"检测以墨水输入的手绘对象的系统和方法"的专利申请在2005年4月20日公开的一种提供了一个可识别诸如以墨水输入的图示或图表之类的绘图的形状识别器。该形状识别器可包括用于在绘图中识别闭合容器的容器识别器和识别未闭合连接器的连接器识别器。容器识别器可包括任何数量的形状分类器,包括椭圆形/圓形分类器、多边形识别器、三角形识别器、四边形分类器等等。连接器识别器可包括基干识别器、箭头识别器和和各种其它的识别器以识别绘图中容器之间的连接器的类型。该发明可通过对每个容器进行容器识别以识别闭合的形状(包括圆形、三角形、四边形、五边形、六边形等等)来识别手绘形状。然后对每个连接器进行连接器识别以识别包括基干箭头等等在内的未闭合的连接器的形状。对笔划输入次序和形成手绘形状的笔划数量不敏感。另外,可用于识别绘图中任何闭合容器的和未闭合的连接器。可以看出,这种方法所识别的手绘形状有限,只能识别极少的图形对象,对于一些复杂的手绘形状则无法识别。因而,本领域技术人员迫切需要发展出一种创新的手绘形状识别机制,用以筒单、灵活地实现各种手绘形状输入,尤其是复杂手绘形状的输入,使用户获得更好的使用体验。
发明内容本发明所要解决的技术问题是提供一种手绘形状识别方法,使用该方法能简单、灵活地实现各种手绘形状输入,尤其是复杂手绘形状的输入,使用户获得更好的使用体验。本发明还提供了一种手绘形状识别装置,用以保证上述方法在实际中的实现及应用。为解决上述技术问题,本发明实施例公开了一种手绘形状识别方法,包括采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;接收用户输入的待识别笔画数据,当所述待识别笔画数据中包括符合预置规则的手绘形状笔画数据时,提取所述手绘形状笔画数据的特征信息;将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;提取所述手绘形状特征模板对应的标准形状模板为识别结果。优选的,所述的方法,还包括根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。优选的,所述的方法,还包括用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。优选的,在所述待识别笔画数据中识别符合预置规则的手绘形状笔画数据的步骤进一步包括对所述待识别笔画数据进行采样预处理;在所述采样预处理结果中识别出手绘形状笔画数据;对构成单独形状的手绘形状笔画数据进行组合;当所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。优选的,所述待识别笔画数据包括文字笔画数据、手绘形状笔画数据和模糊笔画数据,在所述采样预处理结果中识别出手绘形状笔画数据的步骤进一步包括提取所述采样预处理结果中单笔画的特征信息,对所述单笔画特征信息进行决策树分析,识别出文字笔画数据、手绘形状笔画数据和模糊笔画数据;按照预设要求从所述模糊笔画数据中进一步识别出手绘形状笔画数据。优选的,所述组合构成单独形状的手绘形状笔画数据的步骤进一步包括计算所述手绘形状笔画数据之间的距离值,当所述距离值小于或等于一定距离阈值时,组合所述手绘形状笔画数据。优选的,所述生成形状特征模板库的步骤进一步包括获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;8对所述目标区域中的归一化笔画数据提取特征向量;将所述特征向量保存至手绘形状特征模板库。优选的,对所述目标区域中的归一化笔画数据提取特征向量的步骤进一步包括以所述目标区域的中心为顶点,将所述目标区域均勻划分成多个扇面区域;在各个扇面区域中提取特征点,计算所述特征点与顶点的距离,获得所述归一化笔画数据的特征向量。优选的,所述提取手绘形状笔画数据的特征信息的步骤进一步包括将所述手绘形状的笔画数据归一化至所述预置大小的目标区域中;对所述目标区域中的归一化笔画数据提取特征向量。优选的,所述特征模板匹配步骤包括计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离,获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。优选的,所述手绘形状特征模板具有相应的第一标识属性,所述标准形状模板具有相应的第二标识属性,所述建立关联的步骤为依据所述手绘形状特征模板与标准形状模板的对应关系,通过所述第一标识属性和第二标识属性建立关联。优选的,所述标准形状才莫板位于标准形状才莫板库中。本发明实施例还公开了一种手绘形状识别装置,包括模板库生成模块,用于采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;接口模块,用于接收用户输入的待识别笔画数据;判定模块,用于判断所述待识别笔画数据中是否包括符合预置规则的手绘形状笔画数据,若是,则触发特征提取模块;特征提取模块,用于提取所述手绘形状笔画数据的特征信息;模板匹配模块,用于将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;结果获取模块,用于提取所述手绘形状特征模板对应的标准形状模板为识别结果。优选的,所述的装置,还包括自动更新模块,用于根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。优选的,所述的装置,还包括手动添加更新模块,用于使用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,手动删除更新模块,用于使用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。优选的,所述判定模块进一步包括笔画采样子模块,用于对所述待识别笔画数据进行采样预处理;分割子模块,用于在所述采样预处理结果中识别出手绘形状笔画数据;组合子模块,用于对构成单独形状的手绘形状笔画数据进行组合;封闭形状判定子模块,用于在判定所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规贝'J的手绘形状笔画数据。优选的,所述模板库生成模块进一步包括第一归一化子模块,用于获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提取特征向量;保存子模块,用于将所述特征向量保存至手绘形状特征模板库。优选的,所述特征提取模块进一步包括第二归一化子模块,用于将所述手绘形状的笔画数据归一化至所述10预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提取特征向量。优选的,所述模板匹配模块包括欧式距离计算子模块,用于计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离;最高匹配度获取子模块,用于获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。与现有技术相比,本发明实施例具有以下优点首先,本发明通过采集手绘形状特征模板,生成特征模板库,并建立各个手绘形状特征模板与预置的标准显示形状的关联;在此基础上,识别用户的原始输入中手绘形状的输入,经过匹配特征模板库,得到匹配度最高的特征模板;并通过该特征模板与预置标准形状的关联,将对应的标准形状作为形状识别结果返回给用户,从而筒单、灵活地实现把计算机无法识别的、包含具有任意形状的封闭图形的原始输入,转换成计算机可以识别的图形,简化了用户操作,使用户获得较好的使用体验。再者,本发明通过提供对手绘形状特征模板库的自动更新和手动更新的方式,可以使用户输入无需受到预置形状模板的限制,可随意输入用户自定义的形状图形,甚至是较为复杂的形状图形,从而有效提高了手绘形状识别的灵活度,进一步使用户获得较好的使用体验。最后,本发明对于服务提供商来说,技术实现筒单,无技术障碍,无特殊保密算法,成本和风险较低。图1是本发明的一种手绘形状识别方法实施例的流程图2是本发明的手绘形状识别过程中,一种原始笔画的点列示意图3是将图2所示的原始笔画的点列进行重新采样后的点列示意图4是一种笔画的外围矩形示意图5是两个外围矩形之间的距离示意图;图6是本发明的一个具体例子中,等腰三角形的标准形状示意图;图7是本发明的一个具体例子中,采集的手绘形状Tx的形状示意图;图8是本发明的一个具体例子中,采集的手绘形状Ty的形状示意图;图9是本发明的一个具体例子中,接收用户输入的待识别笔画数据的形状示意图10是本发明的一个具体例子中识别结果的显示示意图11是本发明的一个具体例子中,用户输入的待识别笔画数据中形状中又包含形状的示意图12是本发明的一种手绘形状识别装置实施例的结构框图13是应用图12所示的优选实施例进行手绘形状识别的方法流程图。具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。本发明实施例进行手绘形状识别的目的之一在于,把计算机无法识别的、包含具有任意形状的封闭图形的原始输入,转换成计算机可以识别的图形。基于上述目的,本发明实施例的核心构思之一在于,釆集手绘形状特征模板,生成特征模板库,并建立各个手绘形状特征模板与预置的标准显示形状的关联;在此基础上,识别用户的原始输入中手绘形状的输入,经过匹配特征模板库,得到匹配度最高的特征模板;并通过该特征模板与预置标准形状的关联,将对应的标准形状作为形状识另U结果返回给用户;从而为用户提供一种简单、方便的在计算机处理系统中输入手绘形状的方法。本发明实施例可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。参考图1,示出了本发明的一种手绘形状识别方法实施例的流程图,具体可以包括以下步骤步骤IOI、采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;步骤102、接收用户输入的待识别笔画数据,当所述待识别笔画数据中包括符合预置规则的手绘形状笔画数据时,提取所述手绘形状笔画数据的特征信息;步骤103、将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;步骤104、提取所述手绘形状特征模板对应的标准形状模板为识别结果。在本实施例中,所述采集手绘形状特征模板生成形状特征模板库的过程是进行手绘形状识别的基础之一。采集并生成手绘形状特征模板库的主要任务是收集所支持识别的手绘形状的原始笔迹及其对应的特征模板,这些特征模板在手绘形状识别过程中可用于与用户原始输入的手绘形状数据进行匹配,是获得手绘形状识别结果的一个重要判定依据。优选的,所述采集并生成形状特征模板库的步骤可以包括以下子步骤子步骤A1、获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;所谓归一化,是指归纳统一样本的统计分布性,在本实施例中,归一化处理主要是为了将原始形状笔画数据的大小变换为预置标准的大小,从而避免因形状大小造成的识别错误。在实际中,归一化的处理的方法是多种多样的,本领域技术人员在此采用任一种归一化的方法都是可行的,如采用线性变换的方式等,本发明对此不作限制。子步骤A2、对所述目标区域中的归一化笔画数据提取特征向量;子步骤A3、将所述特征向量保存至手绘形状特征模板库。更为优选的,所述子步骤A2还可以包括以下子步骤子步骤A21、以所述目标区域的中心为顶点,将所述目标区域均匀13划分成多个扇面区域;子步骤A22、在各个扇面区域中提取特征点,计算所述特征点与顶点的距离,获得所述归一化笔画数据的特征向量。以下以一种具体的特征模板提取算法来进一步说明上述采集并生成形状特征模板库的过程al、以构成原始形状的笔画数据为输入,计算这些笔画的外围矩形作为整个形状的原始大小;a2、设定一个目标矩形,用线性变换的方式,将构成原始形状笔画的点数据变换到目标矩形中,以便在同一大小的区域里进行特征提取;a3、在得到上述归一化形状笔画数据的基础上,以目标矩形的中心为顶点,把整个平面均匀地划分成12个扇面。每个扇面上提取一个特征点。所述特征点的提取可以采用以下方法如果组成笔画的点有落在该扇面中的,则挑选到扇面顶点距离最远的点作为特征点;否则取扇面顶点作为特征点。a4、获得12个特征点后,参照顶点按照顺时针方向排列这12个特征点;a5、分别计算这12个特征点到中心点的距离,获得该原始形状笔画数据对应的特征向量。当然,上述手绘形状特征模板采集的方法仅仅用于示例,本领域技术人员根据实际需要或经验采用任一种方法都是可行的,本发明对此不需要进行限定。在实际中,所述标准形状模板可以由用户或开发人员任意预置,还可以生成一个标准形状模板库来存放这些标准形状模板。为在手绘形状特征模板和标准形状模板之间建立关联,可以针对所述手绘形状特征模板分配相应的第一标识属性,并针对所述标准形状模板分配相应的第二标识属性,在这种情况下,所述建立关联的步骤可以为依据所述手绘形状特征模板与标准形状模板的对应关系,通过所述第一标识属性和第二标识属性建立关联。例如,假设标准形状模板库的内容如下表所示<table>tableseeoriginaldocumentpage15</column></row><table>为每个手绘形状特征模板分配一个标识ID,并获取该特征模板对应的标准形状模板,通过它们的ID进行关联,生成手绘形状特征模板库的内容可以参见下表<table>tableseeoriginaldocumentpage15</column></row><table>形状特征模板Tn特征模板Id:templateld=n对应的标准形状Id:shapeld=1特征向量features=[1.8,6.2,1.2.,2.6...…,2.9]需要说明的是,上述表格的内容仅仅作为示例,本领域技术人员还可以根据实际需要或经验添加其它属性或作其它设置,本发明对此不作限制。从上述表中可以看出,手绘形状特征模板库中的每一个形状特征模板都有一个对应的标准形状ID值,即shapeld,该属性即是手绘形状特征模板与标准形状关联的依据。在这种情况下,当一个待识别的手绘形状笔画数据通过模板匹配算法得到所属的手绘形状特征模板时(如形状特征模板Id=1),则可以通过对应的shapeld(如shapeld=1),定位对应的标准形状;在显示识别结果时,则可以纟是耳又标准形状库中相应的标准形状(如shapeld为1的标准形状),根据该形状定义的标准图形(形状矢量)进行显示。在实际中,所述手绘形状特征模板与标准形状模板的关联还可以记录在关联表中,如下表形状显示库(s)特征模板库(T)SITlTnS2T2当然,本领域技术人员采用任一种方法建立所述手绘形状特征模板与对应的标准形状模板的关联都是可行的,本发明对此不需要进行限定。本发明在进行手绘形状识别的核心构思之一在于,通过采集用户的待识别笔画数据,并对所述待识别笔画数据重新进行采样;然后将文字与非文字笔画区分开,这些非文字笔画可能包含图形形状,也可能包含表格等其它非文字笔画;此时,对非文字笔画依据笔画之间的距离分成多个非文字笔画组;对各组非文字笔画组按照一定规则判断其是否构成16封闭形状;如果是,则对封闭形状取特征,然后使用模板匹配算法与特征模板库中的特征模板进行匹配,并对匹配结果进行排序,选择匹配度最高的特征模板对应的定制形状类别作为待识别形状的识别结果类别,然后通过获取与该形状类别对应的标准显示图形作为形状识别结果。在实际中,当用户通过手写输入设备输入待识别笔画数据时,本发明实施例可以通过以下子步骤在所述待识别笔画数据中识别符合预置规则的手绘形状笔画数据子步骤Bl、对所述待识别笔画数据进行采样预处理;笔画采样即通过手写输入设备采集用户输入的笔画数据,采样结果一般为由一系列点表示的一条笔画。笔画数据的特点是相邻的点和点之间的间隔较小,而且手写输入的随机干扰易造成明显波动,通常会在采样过程中会对原始笔画数据进行平滑等预处理,以减小笔画的波动。优选的,为便于后续步骤的计算处理,可以对原始笔画的点进行重新采样处理。即经过处理的点列信息中,点和点之间的距离相对较大并且比较均匀,点列的波动相对于原始笔画减小。具体可以参考图2所示的原始笔画的点列示意图和图3所示的重新采样后的点列示意图,可以看出,经过采样处理的笔画比原始笔画更平滑,点的个数也相对减少,点间距也相对均匀。子步骤B2、在所述采样预处理结果中识别出手绘形状笔画数据;用户输入的待识别笔画数据中可能包括文字笔画数据、手绘形状笔画数据(非文字笔画数据),以及,不能识别其类别的笔画数据(模糊笔画数据),在这种情况下,可以通过以下子步骤在所述待识别笔画数据中识别符合预置规则的手绘形状笔画数据子步骤B21、提取所述采样预处理结果中单笔画的特征信息,对所述单笔画特征信息进行决策树分析,识别出文字笔画数据、手绘形状笔画数据和模糊笔画数据;子步骤B22、按照预设要求从所述模糊笔画数据中进一步识别出手绘形状笔画数据。对单笔画取特征,通过决策树分析,得到采用单笔画特征分割的具体模型,利用该模型实现笔画的初步分类,即将所有笔画分为三类文字类、非文字类、不能确定类别的笔画类(模糊类)。例如,所述单笔画特征信息可以包括笔画的长度信息;笔画外围矩形的宽、高信息;笔画的长度信息以及笔画的曲率信息等。将这些单笔画特征信息作为输入,通过决策树分析的方法找到决策模型,从而判定出笔画的类别。当然,上述方法仅仅作为示例,本领域技术人员采用任一种单笔画特征的选取方法都是可以行,本发明对此不需要进行限定。在通过单笔画特征对待识别笔画数据进行初步分类的基础上,对于不能确定类别的笔画数据(模糊笔画数据)可以进一步采用上下文特征分析法,利用启发式思维进行分类。例如,采用的手绘形状笔画数据上下文特征可以包括通过端点和非文字笔画首尾相连的笔画;连接非文字笔画的笔画(要求端点和非文字笔画相交);周围(左右两侧、上下两侧)一定范围内笔画类别为非文字类的笔画。对符合这三种上下文特征要求的笔画则可以判定为非文字笔画,否则为文字笔画。本发明在使用上下文特征分析法进行笔画类别判定时,并不限定具体采用的上下文特征,本领域技术人员可以根据需要选定其它的上下文特征进行笔画分类,本发明对此不作限制。可以理解的是,本实施例是针对实际中手绘形状与文本字符结合输入的情形,当仅针对手绘形状输入的情形时,本领域技术人员易于想到现有技术中的任一种方法来实现,如直接把可能构成定制形状的笔画挑选出来,或者通过其它分类方式挑选等;也就是说,本领域技术人员采用任一种方法识别出手绘形状笔画数据都是可行的,本发明对此并不需要进行限定。子步骤B3、对构成单独形状的手绘形状笔画数据进行组合;本步骤的处理主要是针对包含多种输入形状的情形,优选的,可以通过以下子步骤组合构成单独形状的手绘形状笔画数据子步骤B31、计算所述手绘形状笔画数据之间的距离值,当所述距离值小于或等于一定距离阈值时,组合所述手绘形状笔画数据。也就是说,可以依据笔画之间的距离将各个输入形状区别开。如果两条笔画之间的距离小于"非文字笔画成组阈值",则认为这两条笔画属于同一个组。而且,文字笔画和非文字笔画无论距离大小,都不属于同一个组。经过本步骤的成组处理,每一组都能构成一个单独的形状。在计算笔画间距离时,本实施例可以采用通过计算笔画的外围矩形之间的距离来获得。笔画的外围矩形是指把一条笔画上所有的点都包围在内的最小矩形,由两条水平边和两条竖直边构成,可以参照图4所示;外围矩形之间的距离是指两个矩形的水平方向间隔5b和竖直方向间隔5a之和,可以参照图5所示。当然,本发明也无需限定计算笔画间距离的方法,本领域技术人员也可以通过其它方式来计算笔画之间的距离。而且,也不必要限定笔画成组的依据,以笔画之间的距离来划分笔画组合是一种比较简单的划分方式,本领域技术人员也可以参考其它因素进行判断。子步骤B4、当所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。优选的,所述判定是否构成封闭形状的方法可以为使用图的最短路径检测算法,查找出图中所有的闭合回路;若存在这样的回路,则对应的手绘形状笔画数据组合构成封闭形状;否则,不构成封闭形状。在本实施例中,所谓图的构成原则可以为以笔画为单位(每个笔画有两个端点),收集所有的笔画端点,使彼此距离小于给定阈值的端点聚合成一个单位,以作为图结构的顶点。对应顶点的端点之间的笔画构成图结构的边,每条边可以包含多条笔画,同时单条边还可以构成环。其中,还可以包括一种特殊处理为通过某个顶点相交叉的两个回路合并。回路的边对应的所有笔画就构成一个封闭的形状。当然,上述方法仅仅用作示例,本领域技术人员采用任一种封闭形状的判定方法都是可行的,本发明对此无需作出限定。如果一组手绘形状笔画数据被判定为封闭形状,则可以针对该手绘形状笔画数据提取特征信息,所述提取的方法与生成形状特征模板库过程中提取特征向量模板的方法相同。具体地,可以包括以下子步骤子步骤Cl、将所述手绘形状的笔画数据归一化至所述预置大小的目200810113658.8说明书第15/23页标区域中;子步骤C2、对所述目标区域中的归一化笔画数据提取特征向量。对于上述子步骤的具体处理过程可以参考前述生成形状特征模板库的相关部分,本发明在此就不赘述了。在获得用户输入的待识别笔画数据中,符合预置规则的手绘形状笔画数据的特征信息后,则可以使用模板匹配算法把所述特征信息与手绘形状特征模板库中的特征模板匹配计算距离,模板匹配的方法可以为计算两个特征向量之间的欧式距离,距离越小则匹配度越高;具体地,所述特征模板匹配步骤可以包括以下子步骤子步骤D1、计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离,获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。在实际中,可以根据距离把模板号排序,距离小的排在前面,则为匹配度最高的手绘形状特征模板,提取这个手绘形状特征模板对应的标准形状模板即为此次识别的结果。实际中还有一种用户输入的情形,即用户输入的某个手绘形状笔画数据绘中不仅包括构成单独形状的手绘形状笔画数据组合,还包含在单独形状中填充的笔画数据,如某个填充有内容的表格方框等,在这种情况下,所述组合构成单独形状的手绘形状笔画数据的步骤还可以包括以下子步骤子步骤B5、获取所述单独形状的边界范围,当某个手绘形状笔画数据的外围矩形包含在所述边界范围之内,则在所述单独形状中添加所述手绘形状笔画数据。本步骤实现的核心构思之一在于,将落在单独形状范围内的输入笔画作为形状内容进行填充。则本实施例的具体实现方案可以为确定一个单独形状,计算得到该形状对应的位置信息;然后搜索落在形状之内的笔画作为这个形状内的填充内容,内容可能是字符,也可能是手绘形状的笔画数据。具体判断方式可以为如果一条笔画的外围矩形全部包含在单独形状的边界范围之内,则将这条笔画作为形状的内容加入该形20状。需要说明的是,本发明的形状识别过程中,涉及到多个阈值的定义及使用,本领域技术人员对这些阈值的取值采用经验值,或根据不同的应用情况,重新设置相应的阈值都是可行的,本发明对此不作限制。特征模板库,相应地,一种自动更新的步骤可以为根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。采用这种自动更新的方式,可以根据实际需求,将用户输入的、符合预置规则的、手绘形状笔画数据的特征信息添加至形状特征模板库,或作为更好的特征模板替换形状特征模板库中的相应模板,本方法对具体的更新处理方式无需作出限制。一种手动更新的步骤可以为用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。可以看出,在实际中,用户可以通过手动更新手绘形状特征模板、标准形状模板,以及它们之间的关联;这种手动更新的方式有效解决了用户定义个性化形状的问题。在这种情况下,用户输入的手绘形状完全不受到预置形状模板的限制,可以随意输入自己所需的形状图形,从而使本发明更具灵活性。以下通过一个具体的例子来进一步说明本发明。一、预置等腰三角形的标准形状模板;定义等腰三角形的标准形状显示如图6所示,在标准形状模板库中添加该标准形状模板,可以如下表所示标准形状S3标准形状Id:shapeId=S3标准形状模板的形状矢量pts=[(50,50],(100,50),(75,80)]其它属性...二、采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与所述标准形状模板的关联;采集的手绘形状Tx和Ty分别如图7和图8所示,通过特征提取得到相应形状笔迹的特征模板,在特征冲莫板库中添加所述模板,可以如下表所示;形状特征模板Tx特征才莫板Id:templateld=Tx对应的标准形状Id:shapeld=S3特征向量features=[通过特征提取得到对应的特征向量]形状特征模板Ty特征模板Id:templateld=Ty对应的标准形状Id:shapeld=S3特征向量features=[通过特征l是取得到对应的特征向量]可以看出,通过标准形状Id(shapeld)关联了对应的手绘形状特征模板与标准形状模板,优选的,还可以记录所述关联至关联表中,如下表所示形状显示库(s)特征模板库(T)S3TxTy三、接收用户输入的待识别笔画数据,如图9所示;四、对所述待识别笔画数据进行采样预处理,以减少笔画波动对识别造成的影响;五、在所述待识别笔画数据中区分文字笔画数据和非文字笔画数据,以识别出手绘形状笔画数据;六、当包含多个输入形状时,将多个形状区分开,将有可能组成一个单独形状的笔画组成一个笔画组;七、将针对每个笔画组进行形状识别判定,得到形状识别结果,具体操作过程可以为1、给定一个笔画组,判定其是否构成封闭形状;2、若封闭,则提取该封闭形状的特征模板;3、将封闭形状对应的特征模板与手绘形状特征模板库中的特征模板进行匹配,匹配的过程可以是计算两个向量之间的欧式距离,距离越近匹配度越高;提取匹配度最高的特征模板(假设本例中为Tx),此时通过该模板对应的shapeld属性即可得到形状识别的结果S3,识别结果如图10所示。4、如果用户输入的待识别笔画数据中存在如下情况形状中有文字(如图9所示);形状中又包含形状(如图11所示);则需要对形状中的内容进行识别,并将相应内容的识别结果填充到形状内的相应位置;这里对形状内容的识别处理过程包括对文字笔画数据与非文字笔画数据的识别处理。其中,文本内容可以采用现有技术中的任一种字符识别技术来处理;而对于非文本内容则可以按照本说明书中前述手绘形状识别的相关部分进行识别处理,本发明在此就不——描述了。对于前述的方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。参考图12,示出了本发明的一种手绘形状识别装置实施例的结构框图,具体可以包括以下模块模板库生成模块121,用于采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;23优选的,所述模板库生成模块可以进一步包括以下子模块第一归一化子模块,用于获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提取特征向量;保存子模块,用于将所述特征向量保存至手绘形状特征模板库。更为优选的,所述特征向量提取子模块进一步包括以下单元区域划分单元,用于以所述目标区域的中心为顶点,将所述目标区域均勻划分成多个扇面区域;特征点提取单元,用于在各个扇面区域中提取特征点;向量计算单元,用于计算所述特征点与顶点的距离,获得所述归一化笔画数据的特征向量。优选的,所述手绘形状特征模板具有相应的第一标识属性,所述标准形状模板具有相应的第二标识属性,在本实施例中,可以依据所述手绘形状特征模板与标准形状模板的对应关系,通过所述第一标识属性和第二标识属性建立关联。在实际中,所述标准形状模板可以保存至标准形状模板库中。接口模块122,用于接收用户输入的待识别笔画数据;判定模块123,用于判断所述待识别笔画数据中是否包括符合预置规则的手绘形状笔画数据,若是,则触发特征提取模块124;优选的,所述判定模块可以包括以下子模块笔画采样子模块,用于对所述待识别笔画数据进行采样预处理;分割子模块,用于在所述采样预处理结果中识别出手绘形状笔画数据;组合子模块,用于对构成单独形状的手绘形状笔画数据进行组合;封闭形状判定子模块,用于在判定所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。在实际中,所述待识别笔画数据可以包括文字笔画数据、手绘形状笔画数据和模糊笔画数据,所述分割子模块可以进一步包括以下单元单笔画特征分析单元,用于提取所述采样预处理结果中单笔画的特征信息,对所述单笔画特征信息进行决策树分析,识别出文字笔画数据、手绘形状笔画数据和模糊笔画数据;上下文特征分析单元,用于按照预设要求从所述模糊笔画数据中进一步识别出手绘形状笔画数据。在包含多个输入形状时,所述组合子模块可以进一步包括距离计算单元,该单元用于计算所述手绘形状笔画数据之间的距离值,当所述距离值小于或等于一定距离阈值时,组合所述手绘形状笔画数据。当用户输入的某个手绘形状笔画数据绘中不仅包括构成单独形状的手绘形状笔画数据组合,还包含在单独形状中填充的笔画数据时,所述组合子模块还可以进一步包括范围判定单元,该单元用于获取所述单独形状的边界范围,当某个手绘形状笔画数据的外围矩形包含在所述边界范围之内,则在所述单独形状中添加所述手绘形状笔画数据。特征提取模块124,用于提取所述手绘形状笔画数据的特征信息;在实际中,所述手绘形状笔画数据特征信息的提取方法可以采用前述手绘形状特征模板的提取方法,则所述特征提取模块可以进一步包括以下子模块第二归一化子模块,用于将所述手绘形状的笔画数据归一化至所述预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提取特征向量。模板匹配模块125,用于将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;优选的,所述模板匹配模块可以进一步包括以下子模块欧式距离计算子模块,用于计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离;最高匹配度获取子模块,用于获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。结果获取模块126,用于提取所述手绘形状特征模板对应的标准形状模板为识别结果。本发明的手绘形状模板库是开放的,可以进行自动更新或手动更新,在这种情况下,本实施例还可以包括自动更新模块,用于根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。和/或,手动添加更新模块,用于使用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,手动删除更新模块,用于使用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。参考图13,示出了应用图12所示的优选实施例进行手绘形状识别的方法流程图,具体可以包括以下步骤步骤1301、模板库生成模块采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;优选的,本步骤可以包括以下子步骤子步骤11、第一归一化子模块获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;子步骤12、特征向量提取子模块对所述目标区域中的归一化笔画数据提取特征向量;子步骤13、保存子模块将所述特征向量保存至手绘形状特征模板库。优选的,所述手绘形状特征模板具有相应的第一标识属性,所述标准形状模板具有相应的第二标识属性,在这种情况下,还可以包括子步骤14、依据所述手绘形状特征模板与标准形状模板的对应关系,通过所述第一标识属性和第二标识属性建立关联。步骤1302、接口模块接收用户输入的待识别笔画数据;步骤1303、判定模块判断所述待识别笔画数据中是否包括符合预置规则的手绘形状笔画数据,若是,则触发特征提取模块执行步骤1304;优选的,本步骤可以包括以下子步骤子步骤31、笔画采样子模块对所述待识别笔画数据进行采样预处理;子步骤32、分割子模块在所述采样预处理结果中识别出手绘形状笔画数据;子步骤33、组合子模块对构成单独形状的手绘形状笔画数据进行组合.子步骤34、封闭形状判定子模块在判定所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。步骤1304、特征提取模块提取所述手绘形状笔画数据的特征信息;优选的,本步骤可以包括以下子步骤子步骤41、第二归一化子模块将所述手绘形状的笔画数据归一化至所述预置大小的目标区域中;子步骤42、特征向量提取子模块对所述目标区域中的归一化笔画数据提取特征向量。步骤1305、模板匹配模块将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;优选的,本步骤可以包括以下子步骤子步骤51、欧式距离计算子模块计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离;子步骤52、最高匹配度获取子模块,用于获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。步骤1306、结果获取模块提取所述手绘形状特征模板对应的标准形状模板为识别结果。在实际应用中,本发明的手绘形状识别装置可以有多种应用形式。例如,可以作为一个单独的软件处理模块,安装到与输入设备相连的计算机中作为应用程序运行,或者安装到具有计算和处理能力的输入设备中运行;也可以作为单独的硬件设备存在,与输入设备相连来识别输入设备采集的原始输入。而且,还可以与字符识别系统相结合,应用到通过手写输入的电子文档编辑等方面,本发明对此不作限制。对于装置实施例而言,由于其基本相应于方法实施例,相关之处可以参见方法实施例的部分说明,在此不赘述。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句"包括一个......"限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上对本发明所提供的一种手绘形状识别方法及一种手绘形状识另'J装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。权利要求1、一种手绘形状识别方法,其特征在于,包括采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;接收用户输入的待识别笔画数据,当所述待识别笔画数据中包括符合预置规则的手绘形状笔画数据时,提取所述手绘形状笔画数据的特征信息;将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;提取所述手绘形状特征模板对应的标准形状模板为识别结果。2、如权利要求l所述的方法,其特征在于,还包括根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。3、如权利要求l所述的方法,其特征在于,还包括用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。4、如权利要求1、2或3所述的方法,其特征在于,在所述待识别笔画数据中识别符合预置规则的手绘形状笔画数据的步骤进一步包括对所述待识别笔画数据进行采样预处理;在所述采样预处理结果中识别出手绘形状笔画数据;对构成单独形状的手绘形状笔画数据进行组合;当所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。5、如权利要求4所述的方法,其特征在于,所述待识别笔画数据包括文字笔画数据、手绘形状笔画数据和模糊笔画数据,在所述采样预处理结果中识别出手绘形状笔画数据的步骤进一步包括提取所述采样预处理结果中单笔画的特征信息,对所述单笔画特征信息进行决策树分析,识别出文字笔画数据、手绘形状笔画数据和模糊笔画数据;按照预设要求从所述模糊笔画数据中进一步识别出手绘形状笔画数据。6、如权利要求5所述的方法,其特征在于,所述组合构成单独形状的手绘形状笔画数据的步骤进一步包括计算所述手绘形状笔画数据之间的距离值,当所述距离值小于或等于一定距离阈值时,组合所述手绘形状笔画数据。7、如权利要求l所述的方法,其特征在于,所述生成形状特征模板库的步骤进一步包括获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;对所述目标区域中的归一化笔画数据提取特征向量;将所述特征向量保存至手绘形状特征模板库。8、如权利要求7所述的方法,其特征在于,对所述目标区域中的归一化笔画数据提取特征向量的步骤进一步包括以所述目标区域的中心为顶点,将所述目标区域均匀划分成多个扇面区域;在各个扇面区域中提取特征点,计算所述特征点与顶点的距离,获得所述归一化笔画数据的特征向量。9、如权利要求7或8所述的方法,其特征在于,所述提取手绘形状笔画数据的特征信息的步骤进一步包括将所述手绘形状的笔画数据归一化至所述预置大小的目标区域中;对所述目标区域中的归一化笔画数据提取特征向量。10、如权利要求9所述的方法,其特征在于,所述特征模板匹配步骤包括计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离,获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。11、如权利要求l、2、3或10所述的方法,其特征在于,所述手绘形状特征模板具有相应的第一标识属性,所述标准形状模板具有相应的第二标识属性,所述建立关联的步骤为依据所述手绘形状特征模板与标准形状模板的对应关系,通过所述第一标识属性和第二标识属性建立关联。12、如权利要求1所述的方法,其特征在于,所述标准形状模板位于标准形状模板库中。13、一种手绘形状识别装置,其特征在于,包括模板库生成模块,用于采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;接口模块,用于接收用户输入的待识别笔画数据;判定模块,用于判断所述待识别笔画数据中是否包括符合预置规则的手绘形状笔画数据,若是,则触发特征提取模块;特征提取模块,用于提取所述手绘形状笔画数据的特征信息;模板匹配模块,用于将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;结果获取模块,用于提取所述手绘形状特征模板对应的标准形状模板为识别结果。14、如权利要求13所述的装置,其特征在于,还包括自动更新模块,用于根据所述手绘形状笔画数据的特征信息更新所述形状特征模板库。15、如权利要求13所述的装置,其特征在于,还包括手动添加更新模块,用于使用户在所述形状特征模板库中添加手绘形状特征模板,并新增所述手绘形状特征模板与对应的标准形状模板的关联;和/或,手动删除更新模块,用于使用户在所述形状特征模板库中删除手绘形状特征模板,并清除所述手绘形状特征模板与对应的标准形状模板的关联。16、如权利要求13、14或15所述的装置,其特征在于,所述判定模块进一步包括——笔画采样子模块,用于对所述待识别笔画数据进行采样预处理;分割子模块,用于在所述采样预处理结果中识别出手绘形状笔画数据;组合子模块,用于对构成单独形状的手绘形状笔画数据进行组合;封闭形状判定子模块,用于在判定所述手绘形状笔画数据组合构成的单独形状为封闭形状时,确定所述手绘形状笔画数据为符合预置规则的手绘形状笔画数据。17、如权利要求13所述的装置,其特征在于,所述模板库生成模块进一步包括第一归一化子模块,用于获取原始形状的笔画数据,将所述原始形状的笔画数据归一化至预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提耳又特征向量;保存子模块,用于将所述特征向量保存至手绘形状特征模板库。18、如权利要求17所述的装置,其特征在于,所述特征提取模块进一步包括第二归一化子模块,用于将所述手绘形状的笔画数据归一化至所述预置大小的目标区域中;特征向量提取子模块,用于对所述目标区域中的归一化笔画数据提取特征向量。19、如权利要求18所述的装置,其特征在于,所述模板匹配模块包括欧式距离计算子模块,用于计算所述手绘形状归一化笔画数据的特征向量,与所述手绘形状特征模板库中的特征向量的欧式距离;最高匹配度获取子模块,用于获取距离最近的所述手绘形状特征模板库中的特征向量,为匹配度最高的手绘形状特征模板。全文摘要本发明公开了一种手绘形状识别方法,包括采集手绘形状特征模板生成形状特征模板库,并建立所述手绘形状特征模板与对应的标准形状模板的关联;接收用户输入的待识别笔画数据,当所述待识别笔画数据中包括符合预置规则的手绘形状笔画数据时,提取所述手绘形状笔画数据的特征信息;将所述特征信息在手绘形状特征模板中进行匹配,获取匹配度最高的手绘形状特征模板;提取所述手绘形状特征模板对应的标准形状模板为识别结果。本发明可以简单、灵活地实现各种手绘形状输入,尤其是复杂手绘形状的输入,使用户获得更好的使用体验。文档编号G06K9/22GK101593270SQ200810113658公开日2009年12月2日申请日期2008年5月29日优先权日2008年5月29日发明者徐明庆,王利娟,王春明,薛军涛申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1