一种基于字型分类的手写字体库生成方法

文档序号:6605088阅读:370来源:国知局
专利名称:一种基于字型分类的手写字体库生成方法
技术领域
本发明融合了已经存在的字型分类,数字字体库以及加密技术,属于模式识别 技术的推广应用技术领域,具体为一种基于字型分类的手写字体库生成方法。
背景技术
随着计算机技术的发展,数字文档逐渐代替了纸质文档。目前传统字体库已经被 使用者在商业文档、私人书信中广泛使用。选择使用切合场合的字体是文档书写者必须要 注意的问题。但是传统字库存在如下的缺陷字体库单一,无法体现文档书写者的个性。在 需要文档书写者手写体的场合就需要借助复印,扫描等技术。

发明内容
本发明针对传统字体库的缺陷,提供了一种基于字型分类的手写字体库生成的方 法,该方法生成与使用者手写字体相应的加密数字字体库,字体库多样化,能够体现文档书 写者的个性。一种基于字型分类的手写字体库生成方法,其技术方案是这样的
其特征在于其包括获取手写字体图像模块、获取汉字结构单位模块、数字字体库生成 模块、字体库加密模块;获取汉字结构单位模块使用公知的字型分类技术,采集到的指定用 户的手写字体图像,获取该用户的字体结构单位数据库,通过数字字体库生成模块自动生 成对应于此对象的手写字体库,然后通过字体库加密模块对于相应用户的字体库加密,以 确保字体库只能为对应用户使用。其进一步特征在于其包括以下步骤
步骤1 在获取手写字体图像模块1中,从数据源获取字体图像,手写字图像的数据源 可以是扫描的手写字体图像,也可以是手写板获得的实时图像,采样图像数据的规模越大 获取的字体库与用户的手写字的相似程度就越高;
步骤2 在获取汉字结构单位模块2中,采用字型分类技术,获取汉字结构单位,该步骤 的具体实现可以分为如下三个子步骤
汉字预切分,初步获取图像中的汉字信息模块; 根据汉字字型结构分解汉字模块; 建立汉字结构单位数据库模块;
步骤3 在数字字体库生成模块3中,生成手写字字体库;
步骤4 在字体库加密模块4中,对与生成的手写字体库使用公知的ECC椭圆曲线加密 算法进行加密。对于相应用户的字体库加密,以确保字体库只能为对应用户使用。在文档书写的过程中,使用书写者的手写字体库,体现了文档书写者的专业素养, 提高了文档书写者的工作效率。由于数据源信息丰富,用户手写字体信息可以在数据库中 有多份数据,提高了字体库与用户手写字之间的相似度。对用户的数字字体库加密,保证了用户的相应权利。该方法可以使用在商业文案,私人信件,甚至数字签字等方面,具有很高 的经济效益和社会效应。


图1是本发明的工作流程图2是本发明中字型层次分类编码示例。
具体实施例方式
本发明包括获取手写字体图像模块1、获取汉字结构单位模块2、数字字体库生成模块 3、字体库加密模块4 ;获取汉字结构单位模块2使用公知的字型分类技术,采集到的指定 用户的手写字体图像,获取该用户的字体结构单位数据库,通过数字字体库生成模块3自 动生成对应于此对象的手写字体库,然后通过字体库加密模块4对于相应用户的字体库加 密,以确保字体库只能为对应用户使用。本发明的技术方案使用了如下几个关键步骤
图1中,获取汉字结构单位模块2,主要使用0RC (光学字符识别)方法对于采样所得图 像信息获得笔画特征信息,模块6初步获取汉字信息,根据汉字字形结构分解汉字,建立汉 字笔结构单位数据库;
汉字的整体性和可分解性是汉字识别中的两个重要影响因素。人类对于汉字的认 识机制是由整体,分层次结构和笔画多种途径符合得到的。在东方文字中,相邻的字符粘连 的可能性比较小,所以在模块201使用图像预处理技术,首先将数据源中获取的图片处理 为灰度图像,在对原灰度图像做边缘灰度增强;然后根据垂直方向的投影黑像素统计直方 图,设定截取汉字的个体字符图像。获得对于用户的汉字手写字符个体的认识作为生成字 体结构单位数据库的基础。汉字字型结构分解汉字模块7是对用户汉字手写字符的字型划分,获取字体结构 单位。字型划分是指一个汉字中彼此有一定间隔的几个部件之间的相互位置关系。组成汉 字的部件有一定的拓扑关系,通过一定的研究得到GB2312-80汉字存在独字,左右型,上下 型,左中右,上中下等字形结构。在本方法中,按照汉字的层次结构对汉字字型进行了完整 分类,层次顺序用数字编码。举左右型示例如图2所示。最终将GB2312-80的汉字划分为 30种。在对用户手写字符字型划分中,基于如上的字型划分理论,使用投影法对于图像区域 进行X轴,Y轴方向上的投影黑像素的统计直方图,通过垂直投影将相互分开的部件分离, 一旦部件粘连或者重叠,垂直投影图常常在最佳分割点上位投影值的谷值。在此设定阈值, 从而得到可能的分割位置,最终结合连通域设定确切的分割点。此时得到被认为是在本方 法中的构成汉字的最小结构单位。这些部件有单笔(如一,乙等)和多笔之分(如交叉,交联, 分离等)。在汉字结构单位数据库模块5将结构单位图像归一化以后存储成为该用户的基 本手写结构数据库,该数据库中应该包含独字,以及独字作为偏旁的多种数据。并且该数据 库可以根据用户手写字体数据源的更新实时更新。数字字体库生成模块3是使用得到的用户基本手写结构数据库中的汉字结构单 位并接GB2312-80汉字库中的所有汉字,生成字体库。在使用结构单位拼接汉字的过程中 使用分级拼接的方法。一级并接若字体是独字,则调用数据库中的独字信息;二级并接 若字体是左右型或是上下型,调用结构数据库中的偏旁信息。等等。这里使用上文中提到的字形划分的编码方法,示例如图2所示。字体库加密模块4对于字体库使用ECC椭圆曲线加密算法加密后交付用户使用。 在文档书写的过程中,使用书写者的手写字体库,体现了文档书写者的专业素养,提高了文 档书写者的工作效率。由于数据源信息丰富,用户手写字体信息可以在数据库中有多份数 据,提高了字体库与用户手写字之间的相似度。对用户的数字字体库加密,保证了用户的相 应权利。该方法可以使用在商业文案,私人信件,甚至数字签字等方面,具有很高的经济效 益和社会效应。本发明手写字体库具体生成步骤如下
步骤1 在获取手写字体图像模块1中,从数据源获取字体图像,手写字图像的数据源 可以是扫描的手写字体图像,也可以是手写板获得的实时图像,采样图像数据的规模越大 获取的字体库与用户的手写字的相似程度就越高;
步骤2 在获取汉字结构单位模块2中,采用字型分类技术,获取汉字结构单位,该步骤 的具体实现可以分为如下三个子步骤
汉字预切分,初步获取图像中的汉字信息模块6 ; 根据汉字字型结构分解汉字模块7 ; 建立汉字结构单位数据库模块5 ; 步骤3 在数字字体库生成模块3中,生成手写字字体库;
步骤4 在字体库加密模块4中,对与生成的手写字体库使用公知的ECC椭圆曲线加密 算法进行加密。对于相应用户的字体库加密,以确保字体库只能为对应用户使用。
权利要求
一种基于字型分类的手写字体库生成方法,其特征在于其包括获取手写字体图像模块、获取汉字结构单位模块、数字字体库生成模块、字体库加密模块;获取汉字结构单位模块使用公知的字型分类技术,采集到的指定用户的手写字体图像,获取该用户的字体结构单位数据库,通过数字字体库生成模块自动生成对应于此对象的手写字体库,然后通过字体库加密模块对于相应用户的字体库加密,以确保字体库只能为对应用户使用。
2.根据权利要求1所述的一种基于字型分类的手写字体库生成方法,其特征在于其包括以下步骤步骤1 在获取手写字体图像模块1中,从数据源获取字体图像,手写字图像的数据源 可以是扫描的手写字体图像,也可以是手写板获得的实时图像,采样图像数据的规模越大 获取的字体库与用户的手写字的相似程度就越高;步骤2 在获取汉字结构单位模块2中,采用字型分类技术,获取汉字结构单位,该步骤 的具体实现可以分为如下三个子步骤汉字预切分,初步获取图像中的汉字信息模块; 根据汉字字型结构分解汉字模块; 建立汉字结构单位数据库模块;步骤3 在数字字体库生成模块3中,生成手写字字体库;步骤4 在字体库加密模块4中,对与生成的手写字体库使用公知的ECC椭圆曲线加密 算法进行加密。
全文摘要
本发明提供了一种基于字型分类的手写字体库生成的方法,该方法生成与使用者手写字体相应的加密数字字体库,字体库多样化,能够体现文档书写者的个性。其技术方案是这样的其特征在于其包括获取手写字体图像模块、获取汉字结构单位模块、数字字体库生成模块、字体库加密模块;获取汉字结构单位模块使用公知的字型分类技术,采集到的指定用户的手写字体图像,获取该用户的字体结构单位数据库,通过数字字体库生成模块自动生成对应于此对象的手写字体库,然后通过字体库加密模块对于相应用户的字体库加密,以确保字体库只能为对应用户使用。
文档编号G06F21/00GK101853313SQ20101021493
公开日2010年10月6日 申请日期2010年7月1日 优先权日2010年7月1日
发明者袁存鼎, 马勇 申请人:无锡骏聿科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1