辅助信息附加法及字型文件构成法的制作方法

文档序号:6410507阅读:162来源:国知局
专利名称:辅助信息附加法及字型文件构成法的制作方法
技术领域
本发明涉及辅助信息附加法及字型文件构成法,特别是有关在将文字的轮廓切分为笔划或区段并对各笔划或区段(文字构成元素)的轮廓进行定义的同时,用构成元素的组合表示文字、并在文字输出之际将该文字构成元素的轮廓展开为位映象而输出的轮廓字型技术中的辅助信息附加法及字型文件构成法。
具有汉字、平假名及片假名三种不同文字的日本语是与只具有字母的欧美语有很大不同的语言。一般平假名与片假名设计图案较汉字稍小,但是将分别设计的汉字与假名进行组合也是可以的。
文字是在称作设计框架内制作,与字母的各字幅宽有差别的情况不同。另外,例如字母“P”的竖线设计成垂直线,但是“门”字的两条竖线在印刷体中却像“八”字那样稍为分开一些。这是为了校正字头部分太重造成的头重脚轻的不稳定感的所谓眼睛的错觉,这种视错觉校正为汉字所特有。
另外,由于汉字中竖线与横线很多,其平衡就很重要。线和线之间的空白称为白空,使此白空作与原设计相同的平衡再现是高品质的文字的条件之一。
在利用小点(点)集合表现具有这些特征的汉字时,要表现单位点以下的细部很困难。在点数少时,有时不仅不能表现原设计的细部,而且无法将所有的横线与竖线分开配置而弄成黑呼呼一团。在点数少不能表现文字的设计图案时就只剩下传达和记录信息的功能,因而重点应置于防止粘连提高可读性而不是设计图案。采用何种字体的所谓的设计性已经不重要了。
为了对人工制作的最合适的文字模式的位映象字型在保持其可读性的同时防止粘连,一般采用用改变文字整体平衡或去掉一部分竖线及横线的办法。对于在个人计算机及文字处理机内图象显示所使用的16点阵的文字而言,由于通常进行此种处理,特别注意选择所去掉的线,有时一眼看上去也可能察觉不出。
但是在采用位映象法时必须考虑各种大小的字形,需要大容量的存储器。于是,为了利用少量的数据再现各种大小的文字并且不损害字母的设计图案,就由位映象字型转变到轮廓字型显示技术。轮廓字型,如图34所示,文字的轮廓线是由例如纵横为1000×1000的XY坐标系中的坐标来表示,借助文字生成程序将轮廓线数据转换为位映象而输出。如此,轮廓字型当然可以做到多点指定(字形大小不同的印刷指定),对于无论多大的文字都可以在不损害字母的设计图案的情况下保持文字的品质。
遗憾的是现在的轮廓字型技术存在有缺点,就是文字的点数小时文字的品质会受损,即或在外行眼中字形也显得不好看。这是由在1000×1000的XY坐标系中所表现的文字的轮廓线用m×m点(例如16×16点)的物理坐标系表现时产生的舍入误差所引起的。图35为借助现有的轮廓字型及位映象字型而输出的文字的示例。(a)为现有的轮廓字型的示例,(b)为位映象字型的示例,两者中上面一行是24×24点阵,下行左边为18×18点阵,下行右边为14×14点阵的示例。在点阵数多的情况下,轮廓字型与位映象字型的品质差别不明显,但在文字大小较小时品质差别就很明显。即在18×18点阵的轮廓字型中各字的大小不一致(“视”字较其他字为大),而于14×14点阵的轮廓字型中使部分文字中发生粘连。在位映象字型的情况下,当点阵数少时为了保持可读性并同时防止发生粘连,由于采用变更整体平衡及去掉一部分竖线及横线的方法来构造字型,未发生粘连及字形大小的差异。另外,(c)为利用下面介绍的本发明的区段结构字型的文字示例。
如上所述,在现有的轮廓字型技术中无法进行位映象字型那种细部处理,当文字大小较小时会产生字形大小的差异和粘连。这是因为,如前所述,产生了舍入误差,并且无法施行一种利用视觉特性的“障眼法”之故。另外,在采用现有的轮廓字型运算处理时,为了提高可读性,有时由于不了解文字的哪一部分重要而将人们感到并不需要的细部加以强调并再现。
综上所述,虽然人工制作的位映象字型品质高,但需要大容量存储器,不符合DTP(Desk Top Publishing)(桌面印刷)的时代要求。另一方面,现有的轮廓字型虽然适合DTP等的使用,但由于是通过运算处理生成文字图象,在文字字号小时品质低劣。
因此,希望能利用轮廓字型生成与位映象字型同样高品质的文字图象。
汉字原本是多根竖线与横线的集合。但在现有轮廓字型技术中却把它们全部笼统地用轮廓线来表现,结果就出现上述问题。因此,如图36所示,轮廓线可分割成竖线、横线、斜线、捺、撇等一笔单元(称为笔划ST(i=1,2,…)),各笔划STi以其轮廓线表现,文字则以这些笔划的集合表示,通过文字生成程序将各轮廓线数据转换为位映象而输出。这样一来,竖线与横线等的关系明确,并且为了增加可读性,通过判断文字的哪一部分重要或者不需要而可以进行各种调节。
另外,将这种考虑再向前推进一步,由于对于小字号文字而言认识字形较之字体的差异更为重要,如果可以将代表字形的信息(骨架信息)与代表字体的信息(轮廓信息)分离,则从重视可读性的小号文字起直到再现其字体风格极其重要的大号字都可以生成高品质的文字。此处所说的骨架信息不是文字的润饰线,而是文字的基本结构信息。
有鉴于以上各点开发出并建议①将各个文字借助结构信息分割为笔划、②将笔划再分割为区段、③在定义各区段的同时将文字用区段的集合表示、④在文字输出时将构成该文字的区段的轮廓线展开为位映象图象而输出的轮廓字型技术。
图37为文字、笔划与区段的说明图。汉字“舞”被分割为笔划(文字笔划切分),并且进一步将笔划分割为区段(笔划区段切分),区段的集合就成为轮廓信息。图中的部件为说明方便而示出,在实际处理中并不采用。汉字“舞”被分割成多个笔划,各笔划又进一步切分为适当的区段(始段、中段、末段)而构成轮廓信息。
图38为骨架信息的说明图,其构成包括对每个文字依其笔顺对每个笔划赋予一个笔划号,依笔划号顺序列出了各该笔划的定位数据(起点位置、终点位置)及表示笔划类型的笔划代码。在该图中显示出汉字“仁”的骨架信息。
各区段的轮廓形状,如图39所示,是将区段外形的各折点P1-P6、Q1-Q4在区段坐标系内沿逆时针方向列出坐标值的方法来表示。图39(a)示出汉字“一”始段的区段形状,图39(b)示出汉字“一”末段的区段形状。
图40为用区段集合表现文字的字型文件的结构说明示意图。1a是头标部,为容纳字型名称及生成日期等有关字型的各种信息的部分,1b是字符指针部,存放用于指明相应于文字代码的区段指针组。2a是区段指针部,存放构成文字的所有区段的定位数据和区段轮廓线数据的指针。3a是轮廓线数据部,存放所有区段的区段轮廓线数据。在区段指针部2a中的区段定位数据是指示在轮廓字型坐标系(1000×1000点阵的坐标系)何处定位区段的数据,示出了区段原点(参见图39)的文字坐标系中的位置坐标。图40中的定位数据,如图41所示,为指示汉字“三”最下面的水平笔划(横)的始段的区段原点位置(56,493)、中段的区段原点位置(111,493)及末段的区段原点位置(953,493)的数据。
但是,在将逻辑坐标系表示的轮廓字型缩小到目标大小时,必然会出现小数部分。然而,由于印刷及屏幕显示都是只能以点为单位输出,必须将小数部分用四舍五入等方法取整。在这一取整运算中必然产生舍入误差而使文字品质劣化。因而,为了防止文字品质劣化,在区段轮廓形状数据中要附加辅助信息。
所谓辅助信息就是对品质决定上重要的轮廓坐标所附加的控制信息。辅助信息有控制线宽的辅助信息(主干辅助信息)、控制为活字字体使用而设计的文字的“贴附”部分的鳞片构成辅助信息、圆黑体的圆度修饰辅助信息等。
图42为主干辅助信息说明图。在需要将在1000×1000点阵的逻辑坐标系中表示的轮廓字型的大小转换到例如16×16的物理坐标系中,即缩小时,假设如(a)所示,点A和B的坐标值分别为6.5及5.3。在这种情况下,各Y坐标值四舍五入(坐标修正)取整而转换到物理坐标系。结果,如(b)所示,A点的Y坐标值变为7,B点的Y坐标值变为5,线宽变为2。但是实际的线宽为1.2(=6.5-5.3),所以四舍五入应为1。如此,如果没有任何辅助信息控制,线宽会变为2而输出的线过宽,输出的文字与所设计的文字相差太远。也即文字的品质劣化。
因此,对轮廓字型A点附加绝对主干辅助信息as,对B点附加相对辅助信息rs。如果这样附加辅助信息,则附加有绝对主干辅助信息as的A点的Y坐标值四舍五入得到5时,将舍去的部分0.3(=5.3-5.0)与附加有相对辅助信息rs的B点的Y坐标值6.5相减,并将其结果6.2(=6.5-0.3)四舍五入。因此B点的Y坐标值变为6,如(c)所示,线宽度为1并可防止文字品质劣化。
图43与图44为鳞片构成辅助信息说明图。对轮廓字型数据在逻辑坐标系中进行缩小放大时,作为各折点的坐标可得出如图43(a)所示的结果。在这种场合,利用现有的方式,将如图43(b)所示通过对逻辑坐标系各点的坐标值四舍五入(坐标修正)取整而转换到物理坐标系,根据该物理坐标系的数据可得到如图43(c)所示的位映象。然而,在这种现有的方式中,在坐标修正时,鳞片构成的点阵表示变大,较之笔划的主干宽度D为大,偏差变坏。因此,如图44(a)所示,在对鳞片点a进行坐标修正之际,要把在对带有主干辅助信息的点e的Y坐标值进行坐标修正时的增减值dy加到鳞片构成辅助信息的点a的Y坐标值上。由此,可以保持中段PM的主干辅助信息点e和末段PE的鳞片构成辅助信息点a之间的逻辑坐标系中的距离。在这种状态下,如图44(b)所示,对鳞片构成辅助信息点e的Y坐标值进行坐标修正。然后,根据坐标修正后的物理坐标系的数据生成如图44(c)所示的位映象。根据上面的叙述,可以使鳞片构成的点阵表示变小并防止文字品质的劣化。
如上所述,在轮廓字型技术中,在将文字的轮廓切分为区段并定义各区段的轮廓线的同时将文字以区段集合表示,而在输出文字时将构成该文字的区段轮廓线展开成位映象图象而输出,为此必须能高效率地将辅助信息附加于笔划或区段。但是,现在都是由操作员采取手工作业方式给每个笔划或区段附加辅助信息,因而需要很大的工作量。
另外,上述轮廓字型技术制作的字型的文件,即使数据可以共用,但由于对每个区段都需要保留其数据,字型文件很大,就存在一个需要大量存储器的问题。
如上所述,本发明的目的是提供一种能够高效率地给笔划或区段等文字构成元素附加辅助信息的辅助信息附加法。
本发明的另一目的是提供一种半自动辅助信息附加法,即将形状类似、需要附加同一辅助信息的文字构成元素自动归类,并且操作员通过操作仅对各类中的主元素附加辅助信息和使系统学习该辅助信息附加法,以后就由系统自动为其他构成元素附加辅助信息。
本发明的再一个目的是提供一种可减小所用存储器容量的字型文件构成法,其方法是将区段分组,组内可为区段共用的数据每组只准备一份,从而减小字型文件的大小。
本发明的又另一个目的是提供一种对区段的轮廓进行压缩描述,而且这种压缩描述所使用的控制数据在每一区段组内可以共用,从而可以进一步减小字型文件大小的字型文件构造法。
下面是附图的简单说明。


图1是本发明的第一原理说明图。
图2是本发明的第二原理说明图。
图3是字型制作工具构成图。
图4是字型制作工具的硬件构成图。
图5是辅助信息附加处理全处理过程流程图。
图6是笔划、笔划类说明图。
图7是辅助信息说明图。
图8是笔划分类处理流程图。
图9是笔划属性表生成处理流程图。
图10是笔划轮廓说明图。
图11是方向说明图。
图12是笔划属性表说明图。
图13是方向数据排列说明图。
图14是相同模式判定处理流程图。
图15是相同模式判定说明图。
图16是学习模式处理流程图。
图17是学习处理说明图。
图18是均值处理流程图(笔划轮廓均值算法)。
图19是均值处理说明图。
图20是均值处理另一说明图。
图21是最优匹配主笔划寻找处理流程图。
图22是最优匹配主笔划寻找处理说明图。
图23是各主笔划的面积、重合面积说明图。
图24是最优匹配主笔划寻找处理另一说明图。
图25表明自动辅助信息附加处理。
图26表明笔划轮廓均值算法。
图27是属性段对应说明图。
图28是缩放说明图。
图29是字型文件构成说明图。
图30是辅助信息表说明图。
图31是矢量类型说明图。
图32是控制数据的结构。
图33是区段的轮廓说明图。
图34是轮廓字型说明图。
图35是输出文字示例。
图36是应用本发明的轮廓字型说明图。
图37是文字、笔划和区段说明图。
图38是骨架信息说明图。
图39是区段坐标说明图。
图40是字型文件结构说明图。
图41是区段原点说明图。
图42是主干辅助信息说明图。
图43是鳞片构成辅助信息说明图(其一)。
图44是鳞片构成辅助信息说明图(其二)。
〔符号说明〕
1…笔划存储部2…笔划分类部3…分类笔划存储部4…附加辅助信息学习部5…主笔划辅助信息存储部6…自动辅助信息附加部(a)第1种解决问题的方法图1为本发明的第1种解决问题的方法的说明图,图中示出轮廓字形生成装置的构成,该装置将文字的轮廓切分为其各个构成元素(例如笔划)STi(i=1,2…)、在笔划STi上附加其形状控制辅助信息数据并以该笔划集合表示文字。标号1为存储笔划STi的笔划存储部;标号2为将具有类似轮廓的笔划STi分类为类Ci的笔划分类部;标号3对已分类的笔划按类存储的分类笔划存储部,标号4为对各类Ci的代表构成元素(主笔划)的轮廓的一定位置,通过操作员操作附加辅助信息的辅助信息附加学习部;标号5为通过操作员操作而附加辅助信息时存储辅助信息的主笔划辅助信息存储部;6为利用通过学习所得到的主笔划的辅助信息,对主元素所属的类中的构成元素自动附加辅助信息的自动辅助信息附加部。
笔划分类部1对具有类似轮廓的笔划进行分类,辅助信息辅助学习部4通过操作员操作对各类的代表构成元素(主笔划)的轮廓的一定位置附加辅助信息,根据对该辅助信息由存储部5进行存储而学习辅助信息,自动辅助信息附加部6利用所学习的主笔划的辅助信息对该主笔划所属的类中的构成元素自动附加辅助信息。
如上所述,由于对形状类似、附加同一辅助信息的文字构成元素自动进行分类,由操作员操作只对各类中的主元素附加辅助信息使系统学习辅助信息的附加法、然后系统就可以对其他构成元素自动附加辅助信息,所以可以做到高效率地对笔划或区段等文字构成元素半自动地附加加辅助信息。
(b)第2种解决问题的方法图2为本发明的第2种解决问题的方法的说明图,示出将文字的轮廓切分为以一笔为单位的笔划,将笔划切分为区段,将文字以区段集合表示的字型文件构成法。
图中标号50为文字代码、标号64为字符头标部,指示构成文字的各区段(第1区段~第n区段)的轮廓数据的位置,对每个区段描述①区段位置偏移值(PPO)64a、②将形状类似的区段分组并对各个区段的轮廓信息由各组存储的场合时区段所属的组的位置(区段组偏移值PGO)64b、以及③组内区段的轮廓数据的位置(区段轮廓索引POI)64C。标号65a,65b,…分别为各区段组,其中包括有①记录属于本组的各区段公共数据的头标部GHD及②描述属于本组的各区段的轮廓数据的区段轮廓数据块POBi(i=1,2,…)。标号62a为辅助信息表部,包括将每个组的区段的轮廓上所附加的辅助信息种别(标记辅助信息、鳞片构成辅助信息、曲线辅助信息等)顺序排列的辅助信息类型表。
形状类似的区段分为一组并利用①记录属于本组的各区段的公共数据的头标部GHD和②描述属于本组的各区段的轮廓的区段轮廓数据块POBi组成的区段组65a,65b,…另外,可通过指定构成文字代码50所代表的文字的区段所属的组的位置PGO和组内区段的轮廓数据块位置POI而构成字型文件。这样一来,由于将区段分组并且各组内可为区段共用的数据每一组中只准备一个即可,所以可以减小字型文件的大小并减小所使用的存储器容量。
另外,在对指定区段的轮廓的轮廓点之中连接相邻各点间的矢量的类型、该矢量是水平方向、垂直方向、还是倾斜方向,以及矢量长度进行考虑而实行分类的同时确定显示各个类型的矢量的必需数据长度。于是,在头标部GHD的公共数据部中描述构成区段的轮廓的各矢量的类型。这样一来,就可以用与矢量方向及矢量长度相适应的适当的数据长度,来显示矢量并从而减小字型文件的大小(轮廓数据压缩),而且在读入轮廓数据时可通过公共数据部中所记载的类型了解各矢量的数据长度而将轮廓信息正确读出。
此外,在辅助信息表示部62a中记载有各组的将区段的轮廓所附加的辅助信息的种别排序的辅助信息类型表,在头标部GHD的公共数据部记载有指示辅助信息表内的辅助信息类型表位置的辅助信息偏移值HOF。这样一来,可以根据辅助信息偏移值HOF读出辅助信息类型表并在区段的轮廓上附加辅助信息。另外,由于可以在每一组内只设置一个辅助信息表,字型文件的大小可以减小。
下面说明本发明的实施形式(A)本发明的整体结构(a)结构图3为字型制作工具的结构图。字型制作工具可以在将现有的字型分割为笔划的同时将笔划分割为区段、在区段的轮廓形状上附加辅助信息而将各文字转换为用区段集合表示的字型(区段结构字型)。
标号21是字型制作工具,包括有将现有的字型22分割为笔划的同时,将笔划分割为区段的自动分割部21a;将同一形状的区段公共化以削减区段数量的自动区段共享部21b;为各区段附加辅助信息的自动辅助信息附加部21c;制作通过区段集合表示各文字的区段结构字型23的字型制作部21d及文字数据库21e。在文字数据库21e中存储①读入的现有字型;②各文字的骨架信息;③由笔划化处理、区段化处理所得到的笔划信息、区段信息;④生成的字型文件等。
(b)处理概况字型制作工具21是通过对现有字型22的格式转换→自动分割处理→自动辅助信息附加处理→字型文件制作处理而将现有的字型转换为区段结构字型13而输出。
首先,将用户所保有的现有的轮廓字型22转换为字型制作工具的格式。经过转换的所有文字信息存放在文字数据率21e中。
接着将输入的文字分割为笔划,将笔划分割为区段。在自动分割时首先启动学习模式。用户利用操作画面对有代表性的文字进行笔划化及区段化,以使系统对笔划化和区段化的规则进行学行。之后,启动批处理,系统依照学习到的笔划化及区段化的规则对遗留的数千文字自动进行笔划化及区段化处理。即使碰到了比如无法应用学习结果的特殊形状,也可以采取追加学习信息和反复进行自动分割的对策而无需对遗留的文字及笔划全部采用手工操作进行分割。
然后,进行区段公共化处理(自动区段共享)。即使是形状复杂的汉字,利用笔划及区段分割的办法也可以变为简单的图形。但是,要把7000个文字笔划化,会产生91000个笔划,将全部笔划区段化,会得到210000个区段,而必须有大容量的存储器。因此,应力求把形状可视作“大体相同”的区段共用。
自动分割终了时进行辅助信息的附加。辅助信息附加处理,与自动分割处理同样,是由用户在学习模式中进行附加处理示范,然后利用其规则自动附加辅助信息。
(c)字型制作工具的硬件构成4为字型制作工具的硬件构成图,标号31为处理器(CPU),标号32为程序存储器,用于存储自动分割程序32a、自动区段共享程序32b、自动辅助信息附加程序32c及字型制作程序32d等,标号33为RAM,标号34为由硬盘等构成的文字数据库部(对应于图3的21e),标号35为硬盘驱动器,用于读入现有的文件22和输出制作的字型文件23,标号36为鼠标器,标号37为鼠标器接口部,标号38为键盘,标号39为键盘接口部,标号40为显示装置。
文字数据库部34中存放下面的信息。即①各文字的骨架信息(BSFBasic Stroke File);②读入的现有字型文件;③由笔划自动切分处理所得到的笔划信息;④由区段自动切分处理所得到的信息;⑤附加辅助信息时所生成的各种信息(分类笔划、主笔划的辅助信息、各笔划的辅助信息等);⑥制作的字型文件等。
(B)辅助信息附加处理(a)全部处理流程5为辅助信息附加处理的全部流程图。以下的说明虽然是针对对笔划附加辅助信息的场合,但是当然也适用于对区段附加辅助信息的场合。
前面,通过自动分割处理,各个文字已如图6(a)所示切分为笔划STi(i=1,2,…)并存入文字数据库34。如图6(b)所示,具有类似轮廓的笔划均按类分为各组Ci(i=1,2,…)(阶段100)。此处所说的类似轮廓指的是同样轮廓,但大小不一定相同。例如类C2的形状为四角全为直角的横线类(水平笔划),分类时不考虑其长度。这是因为在形状类似的笔划的同一轮廓点(辅助信息位置)可附加同样的辅助信息。
之后,在各类Ci的主笔划的轮廓的规定位置由操作员操作附加辅助信息,该辅助信息存放于文字数据库34(辅助信息附加学习、阶段200)。辅助信息附加学习是由显示器画面显示主笔划的轮廓,用鼠标光标选择准备附加辅助信息的轮廓点并输入辅助信息类型(绝对辅助信息、相对辅助信息、曲线辅助信息、标记信息、鳞片构成信息等)和根据该辅助信息的类型进行轮廓控制的方向。轮廓控制方向为X方向的辅助信息称为X辅助信息,为Y方向的辅助信息称为Y辅助信息。
通过以上学习,如图7所示,生成与主笔划的轮廓点P1~Pn相对应的辅助信息并存入数据库34。但是,图中as为绝对主干辅助信息、rs为相对主干辅助信息、c为曲线辅助信息、m为标志辅助信息。所谓标志辅助信息是一虚辅助信息。因为规定在轮廓的极值点(坐标值由减小方向变到增大方向或由增大方向变到减小方向的点)处要附加辅助信息,在不需辅助信息控制的点就附加这种标志辅助信息。
附加辅助信息的学习结束时,利用所学习的主笔划的辅助信息对该主笔划所属的类中的笔划自动附加辅助信息(自动附加辅助信息、阶段300)。
如上所述,将形状类似、在同一辅助信息位置附加同样类型的辅助信息的笔划自动分类,通过仅对各类中主笔划由操作员操作附加辅助信息的方式使系统进行学习,并在其后系统就可自动地对其他构成元素附加辅助信息,因此可以做到半自动地、高效地附加辅助信息。
(b)笔划分类处理(b-1)全部处理图8为笔划分类处理的流程图由文字数据库34读出对象笔划的轮廓数据(阶段101)。接着,由此轮廓信息生成笔划属性表(模式信息)(阶段102)。笔划属性表的生成将在下面叙述,大致经过以下步骤生成。即①划分0~360°为多个范围方向;②调查指定笔划轮廓的轮廓点中连接其相邻各点间的矢量长度是否超过设定长度,以及与前一个矢量的方向是否不同;③在矢量长度超过设定长度并且与前一个矢量方向不同时,在计数属性数目的同时将该矢量作为属性段而将其方向以及始点和终点存储;④在矢量长度短于设定长度时忽略该矢量不计;⑤在矢量长度超过设定长度而且与前一个矢量为同方向时,将前一个属性段终点用现矢量的终点更新,对所有的矢量进行上述处理而生成笔划属性表。
然后,对照笔划属性表检查对象笔划是否是不属于迄今已有的任何一类的新模式(阶段103)。关于这种检查法下面还要叙述,大致用下面的方式判断是否是新模式。当两个笔划的属性数相同,而且属性段的方向数据的排列相同时,此二笔划为类似。因此,要参考已经生成的类的基本笔划的笔划属性表,调查与对象笔划属性数相同而且方向数据排列也相同的基本笔划是否存在。如果不存在,对象笔划即为新模式,如存在,则对象笔划与该基本笔划类似,不是新模式。
如果是新模式,生成新笔划类(阶段104),并且将对象笔划作为该新类的基本笔划进行登录(阶段105)。其次,或者在阶段103时对象笔划并非新模式的场合,将对象笔划分到该笔划所属的类(阶段106)。
由上所述,对象笔划分类完毕。然后,判断是否全部笔划都已经过上述分类处理(阶段107),如果全部笔划分类未完结,则对下边一个对象笔划重复阶段101及其后的处理。
(b-2)笔划属性表生成处理图9为笔划属性表生成处理流程图,图10为笔划轮廓说明图,图11为矢量方向说明图,图12为笔划属性表示例。
根据对象笔划的轮廓数据,可生成连接按逆时针方向前进相邻两点的短矢量(阶段102a),求出该矢量的长度,检查其长度是否超过设定长度(阶段102b)。短于设定长度时,忽略该短矢量(阶段102c)。另一方面,超过设定长度时,求出短矢量的方向(阶段102d)。如图11所示,将0~360°分为8个方向,求出其所属方向。还有,方向共分为 10°~10°(水平正方向)、10°~80°(右上方向)、80°~100°(垂直正方向)、100°~170°(左上方向)、170°~190°(水平负方向)、190°~260°(左下方向)、260°~280°(垂直负方向)、280°~350°(右下方向)8个方向。
其后,检查与前一个短矢量(属性段)是否方向相同(阶段102e)。另外,所谓属性段,指的是在属性表上登录的线段(参照图12)。
如与前一个属性段方向不同,则①计数属性数(初始值为0)、②将方向作为属性方向存储、③将短矢量的始点和终点作为属性段的始点和终点存储(阶段102f)。然而,如果与前一个属性段方向相同,则以短矢量的终点更新前一个属性段的终点(阶段102g)。
经过阶段102c、102f及102g的处理后,检查构成笔划轮廓的全部短矢量是否已全部经过上述处理(阶段102h)。如处理未结束,生成下一个连接相邻两点的短矢量(阶段102i),然后重复阶段102b及其后的处理。据上所述可生成如图12所示的笔划属性表,其方向数据的排列如图13所示为7→6→7→0→1→2→3。
(b-3)相同模式判断处理图14为相同模式判断处理的流程图。
首先,参照已生成的类中的基本笔划的笔划属性表检查是否存在与对象笔划属性数相同者(阶段103a)。如不存在,对象笔划为新模式(阶段103b)。
而如果存在属性数相同的基本模式,则读入该基本模式的笔划属性表(阶段103b),检查属性类型与对象笔划的是否相同,换言之,即检查方向数据的排列是否相同(阶段103c)。
如方向数据排列相同,可断定对象笔划与基本笔划类似,不是新模式(阶段103d)。但是,如果方向数据排列不同,对对象笔划的方向数据排列的始点进行一次移位(阶段103e)。图15为相同模式判断说明图,示出对方向数据排列的始点进行移位的情况。最初的方向数据排列为“0246”,对始点进行顺次移位则得到“2460”→“4602”→“6024”→“0246”。
判断经过移位的方向数据排列的始点与最初的方向数据排列的始点是否一致(阶段103f),如不一致,进行阶段103c及其后的处理。也即检查移位后的方向数据的排列与基本笔划的方向数据排列是否一致。在对方向数据排列的始点移位时,如对象笔划和基本笔划的方向数据排列一致时,可以断定对象笔划不是新模式。图15中的(2)所表示的方向数据的排列模式与基本笔划的方向数据排列模式一致,因此判断对象笔划不是新模式。
但是,即使将始点移位而方向数据排列也不一致时,可以判断对象笔划与基本笔划并非类似,要检查是否另外有属性数相同的基本笔划存在(阶段103g)。
如不存在,可以断定对象笔划为新模式(阶段103h)。然而,如果另外有属性数相同的基本模式存在,则要返回到阶段103b重复上述处理。
(c)附加辅助信息学习处理(c-1)全部处理图16为对各类中的主笔划附加辅助信息的学习过程的处理流程图。
由文字数据库34读出对象笔划类中主笔划(对象主笔划)的轮廓数据(阶段201)。之后,使已经附加有辅助信息的主笔划(最初不是附加有辅助信息的主笔划)的大小与对象主笔划的大小相等(阶段202),即作均值处理。
均值处理系利用轮廓上的极值点(extremal point)进行,详细见后,大致通过以下步骤对尺寸大小进行均值。即①对所有附加辅助信息的主笔划及对象笔划求出X轴方向及Y轴方向的极值点。所谓极值点,是某一轴的坐标值由减小变为增大或由增大变为减小的点。
②其次,求出在附加有辅助信息的主笔划中间与对象主笔划具有相同的X轴方向及Y轴方向的极值点数目,并且极值点的排列也相同者。
③对所求出的附加有辅助信息的主笔划或对象笔划一方的X、Y轴方向的大小与另一方的X轴及Y轴方向的大小进行均值缩放。
按上述方式完成均值处理时,求出均值主笔划中与对象主笔划最类似的最优匹配主笔划(阶段203)。关于最优匹配主笔划的寻找处理下面将介绍,大致情况如下。即根据均值主笔划及对象笔划的重合面积求出两个主笔划的类似度,类似度最大的附加有辅助信息的主笔划就是最优匹配主笔划。
其后,检查是否已求出最优匹配主笔划(阶段204)。如果不存在对象主笔划的X轴方向与Y轴方向的极值点数目相等,而且最大、最小极值点的排列相同的附加有辅助信息的主笔划时,则不存在最优匹配主笔划。
如求得最优匹配主笔划,则将该最优匹配主笔划所附加的辅助信息(辅助信息类型、辅助信息位置)应用于对象主笔划(阶段205)。然后,或者在阶段204中未求得最优匹配主笔划时,在操作画面上对辅助信息进行编辑(生成、修改、删除)将辅助信息附加于主笔划(阶段206)。
按上面所述对对象主笔划附加辅助信息完结时,将辅助信息与主笔划或笔划类相对应地存入文字数据库34(阶段207)。
其后,检查是否所有类的主笔划的辅助信息附加处理已结束,如未结束,则对下一个主笔划重复阶段201及其后的处理。
图17为学习处理的说明图,图中示出三个主笔划MST1,MST2及MST3。开始时,在操作画面上对第1个主笔划MST1附加辅助信息。其后,在对第2个主笔划MST2附加辅助信息时,因为第1主笔划MST1为最优匹配主笔划,就将该第1主笔划MST1的辅助信息应用于第2主笔划MST2,并且如有要进行修改的辅助信息,就在操作画面上进行修改。然后,在对第3主笔划MST3附加辅助信息时,需要求出最优匹配主笔划。在这种情况下,因为第1主笔划MST1为最优匹配主笔划,就将该第1主笔划MST1的辅助信息应用于第3主笔划MST3,如有需要修改的辅助信息,就在操作画面上进行修改。
如上所述,由于在附加辅助信息的学习过程中可以利用最优匹配主笔划的辅助信息附加信息,学习处理效率良好。
(c-2)均值处理图18为均值处理流程图,图19与图20为均值处理说明图。
首先,求出附加有辅助信息的主笔划MSTa(参照图19(a))和对象主笔划MSTb两者在X轴方向的极值点(阶段202a)。之后再分别求出主笔划MSTa及对象主笔划MSTb在Y轴方向的极值点(阶段202b)。在这种情况下,如图19(b)所示,相对于前一极值点坐标变化量很小的极值点EP为一无意义的极值点,可以忽略不计。也即只寻求用效极值点(ignificant extremal point)。
接着检查主笔划MSTa,MSTb在X轴方向及Y轴方向的极值点数目是否相同,以及极值点的排列是否相同(阶段202c)。所谓极值点的排列指的是当以Xmax表示X轴方向的极值点中坐标值由增大变为减小的极值点,以Xmin表示坐标值由减小变为增大的极值点,并且以Ymax表示Y轴方向的极值点中坐标值由增大变为减小的极值点,以Ymin表示坐标值由减小变为增大的极值点时,沿笔划的轮廓所出现的Xmax、Xmin、Ymax及Ymin的排列情况。
当X轴方向及Y轴方向的极值点数目不同,或者极值点的排列不同时,主笔划MSTa不能充作最优匹配主笔划的待选对象,不能应用于缩放运算,于是处理结束。
另一方面,如果X轴方向及Y轴方向的极值点数目相同,而且极值点的排列也相同时,就可以进行尺寸大小的缩放运算,使两个笔划在各轴方向上尺寸一致(阶段202)。
缩放运算是在各对应的极值间进行。例如,如图19(b)所示,假设主笔划MSTa的X轴方向的极值点A, B的坐标值为EX12,EX11、主笔划MSTb的X轴方向的对应的极值点A’,B’的坐标为EX22,EX21,则主笔划MSTb的A’B’间的各轮廓点(x’,y’)的X坐标利用下式x=EX11+(x’-EX21)·(EX12-EX11)/(EX22-EX21)(1)进行缩放。同样地,例如,如图19(b)所示,假设主笔划MSTa在Y轴方向的极值点C,D的坐标值为EY12,EY11、主笔划MSTb在Y轴方向的对应的极值点C’,D’的坐标值为EY22,EY21,则主笔划MSTb的A’C’间的各轮廓点(x’,y’)的Y坐标利用下式y=EY11+(y’-EY21)·(EY12-EY11)/(EY22-EY21)(2)进行缩放。
图20是使圆形的对象主笔划MSTb的大小与四边形的主笔划MSTa均值的说明图。圆形的对象主笔划MSTb在X,Y轴方向的大小分别利用式(1)与(2)缩放而变成与主笔划MSTa在X,Y轴方向的大小相同。
(c-3)最优匹配主笔划的发现处理图21是最优匹配主笔划寻找处理流程图,图22是最优匹配主笔划寻找处理的说明图,图23是各主笔划的面积和重合面积说明图。
在寻找最优匹配主笔划之际,首先计算对象主笔划和待选主笔划的类似度(阶段203a)。类似度按下列步骤计算。
①首先,将大小经过均值处理的、附加有辅助信息的主笔划MSTa(参照图22)及对象主笔划MSTb的一对对应点PS及PS’,以及以两个对应点为端点的两线段SS及SS’叠合,对各笔划内部以规定间隔(在图22中Y轴方向上的间隔为1.0)的扫描线SL1,SL2,SL3…进行扫描。笔划的叠合实际上是通过使用一坐标系对应点、对应线段重合的定位方法进行。②之后,将各主笔划MSTa,MSTb内的各扫描线SL1,SL2,SL3…的长度相加算作各元素的面积,而使重合部分的各扫描线的长度和算作重合面积。③然后,将重合面积除以两主元素的面积之和,由此和的1/2所得到的归一化面积即为类似度。
图23中的表格示出①各主笔划MSTa,MSTb和各扫描线SL1,SL2,SL3,SL4,…的交叉始点及交叉终点、②重合部分的始点及终点、③各主笔划MSTa和MSTb内的扫描线的长度的总和、④重合部分内的扫描线的长度的总和及⑤类似度(归一化面积)。
图24为扫描线间隔较大且扫描线数目较少时类似度的说明图。主笔划MSTa、MSTb的重合部分上的三根扫描线SL1,SL2,SL3的长度(粗黑线的长度)分别为50,100和50,各主笔划MSTa,MSTb内的扫描线合计分别为200与273。从而类似度为200/(200+273)/2=0.85。如果增加扫描线可得到更为准确的类似度0.64,但扫描线间隔大扫描线数目少时可以缩短计算类似度的时间。
(d)自动辅助信息处理(d-1)全部处理图25为自动辅助信息处理全部处理的流程图。
学习终了时,利用附加于各类中主笔划的辅助信息,对所有的笔划自动附加辅助信息。
首先,读入对象笔划类的主笔划的轮廓数据和该主笔划的辅助信息数据(阶段301)。之后,读入属于对象笔划类的确定的笔划(对象笔划)的轮廓数据,将该对象笔划的大小与主笔划的大小均值(阶段302)。
然后,使对象笔划与主笔划的对应两点叠合,求出从主笔划的确定的辅助信息位置至最近对象笔划的轮廓线的轮廓点(阶段303)。如求出最近的轮廓点,则对该轮廓点附加主笔划的前述辅助信息位置处所附加的辅助信息类型(阶段304)。之后,判断是否已将主笔划的全部辅助信息已付与对象笔划(阶段305),如未付与,则对下一个辅助信息重复阶段303及其后的处理。
对象笔划自动附加辅助信息处理过程结束时,检查是否已对对象笔划类中的全部笔划已经完成辅助信息附加处理(阶段306),如未结束,对下一个笔划重复阶段302及其后的处理。对于对象笔划类结束上述处理时,检查是否对所有的笔划类的辅助信息附加处理都已结束(阶段307),如未结束,对下一个笔划类重复阶段301及其以后的处理。
(d-2)均值处理图26为阶段302的均值处理的流程图,图27和图28是均值处理说明图。
均值处理之际,首先参照主笔划和对象笔划的笔划属性表,将两种笔划的属性段的始点及终点一一对应(阶段302a)。图27示出对象笔划(Stroke 2)和主笔划(Stroke 1)的属性段的始点和终点的对应情况。
然后,使对象笔划的确定的属性段的始点和终点和主笔划的对应的属性段的始点和终点两两重合并求得与(1)和(2)式同样的运算公式,利用此运算公式可对对象笔划的属性段的始点和终点进行缩放(阶段302b)。此外,对在属性段的始点与终点中间存在的对象笔划的轮廓点可按上述运算公式缩放,进行内插(阶段302c)。
然后,检查是否已将全部对应的属性段处理完毕,如处理未结束,则对下一个属性段重复阶段302b及其后的处理。
图28是缩放说明图,点线表示笔划的轮廓。使对象笔划(Stroke2)的属性段A’B’与主笔划(Stroke 2)的对应段AB重合可求出缩放运算公式。此运算公式与(1)、(2)式形式相同。之后,利用所求得的运算公式可对对象笔划Stroke 2的始点A、终点B及其中间存在的轮廓点E’进行缩放。同样对其他的属性段进行缩放的话,对象笔划的轮廓将显示(b)中右侧所示的形状。(b)的左侧是主笔划的轮廓。
按上述方式完成大小的均值时,使对象笔划和主笔划的对应两点A,A’及C,C’重合,分别求出距主笔划的确定的辅助信息位置B,D最近的对象笔划的轮廓的轮廓点,于是可得出轮廓点B’、D’。因而可将主笔划的B点附加的辅助信息付与对象笔划的轮廓点B’,同样地可将主笔划的D点附加的辅助信息付与对象笔划的轮廓点D’。
如上所述,在将形状类似并附加有同样的辅助信息的文字构成元素(笔划或区段)自动分类,通过操作员的操作只对各类中的主元素附加辅助信息使系统学习附加辅助信息之后系统就可以自动地对其他构成元素(笔划、区段)附加辅助信息,因而可以对文字构成元素半自动地高效地附加辅助信息。
(c)字型文件构成法(a)字型文件的构成图29为利用字型生成程序生成的字形文件的构成图。另外,各文字的字型是将文字的轮廓切分为笔划、将笔划切分为区段并用这些区段来表示的。
在图29中,标号51是字型文件,包括①文件头标部61、②字型表部62、③文字代码化用目录63、④字符头标部64及⑤区段组部65。
(b)字型头标部字型头标部61为记载版权、字型型号、轮廓数据的析像度、可用文字数、各种字体表的偏移值等一般性信息的部分。此文件头标部的大小与字型文件其他部分相比非常小。
(c)字型表字型表部62为所有文字的公共部分,记载全体控制表、文字代码化表、主干宽度表、文字映象表、辅助信息表等等。与本发明有关的只有辅助信息表。在辅助信息表62a中,如图30所示,记载与后述的区段组1~n对应的辅助信息类型表HTL1~HTLn。
辅助信息类型表HTLi是将区段轮廓所附加的辅助信息的种别(曲线辅助信息、标志辅助信息、鳞片构成辅助信息等)按逆时针方向沿着轮廓顺序排列而成。在图30中示出沿着轮廓按逆时针方向将①标志辅助信息、②标志辅助信息、③曲线辅助信息、④曲线辅助信息依次排列时的辅助信息类型表。
(d)文字代码化用目录文字代码化用目录部63用于存储以指定的代码化方法为根据的各个文字代码的偏移值。也即文字代码化用目录部63是存储指示与各文字代码相应的字符头标的存储位置的偏移值的部分。
(e)字符头标部字符头标部64是存储指示各个文字的各个构成区段(第1区段~第n区段)的轮廓数据位置的字符头标的部分。各文字的字符头标部存储有各区段的①区段位置偏移值PPO、②区段所属的区段组位置(区段组偏移值PGO)和③区段组内区段的轮廓数据位置(区段轮廓索引POI)。
所谓区段位置偏移值PPO是用于使区段的原点定位位置偏移。标准的区段位置根据BSF文件(骨架信息文件)求得,但是采用依字体不同而将区段原点偏移的方法可以提高文字的品质。因此,要指定根据这一区段位置偏移值PPO给出的区段原点的偏移值的大小。
区段组偏移值PGO用于指示区段所属的区段组的位置。在本发明的字型文件中,将形状类似的区段分为一组,各个区段的轮廓信息在每个组里是总括存储。因此,根据这一区段组偏移值PGO,可指示区段组的位置,而根据下一个区段轮廓索引POI可以指示组内区段的轮廓数据的位置。
(f)区段组(f-1)构成区段组部65由将形状类似的区段分组而形成的各区段组65a,65b,65c,…构成。各区段组包括有①记录属于本组的各区段的公共数据的头标部GHD、②轮廓数据的压缩信息及区段的辅助信息的位置信息等控制数据部CDT及③存储各区段的压缩轮廓数据的轮廓数据部OLN。轮廓数据部OLN包括有记载属于本组的各区段的压缩轮廓数据的区段轮廓块POBi(i=1,2,…)。各区段轮廓段POBi按其出现率高低排列。因此可以进行快速访问。
(f-2)组头标部在组头标部GHD中记载①辅助信息表内指示区段组内辅助信息类型表HTLi位置的偏移值HOF(参照图30)、②控制数据部的块长及③区段轮廓块的块长BL。辅助信息类型表HTLi是区段组内各区段共同使用的表。所以,辅助信息不同的区段不会分到同一区段组。另外,区段轮廓块的块长BL也是各区段共用的。各区段的后述压缩轮廓数据长度不同的区段也不会分到同一区段组。利用区段组偏移值PGO指示区段组位置,再利用区段轮廓索引POI指示组内块号b就可以高速地读出所要求的区段的轮廓数据。
(f-3)控制数据在控制数据部CDT中记载①轮廓数据的压缩信息和②区段的辅助信息的位置信息。
·轮廓数据的压缩区段轮廓可利用一定数量的轮廓点画出。轮廓曲线的画法有二次、三次样条曲线及贝齐尔曲线发生法、相邻两点顺次连接法等。为了使轮廓格式简洁,这里将轮廓点的位置在(X、Y)整数坐标系中定义,用控制点间的短矢量表示相邻控制点的位置。
短矢量可利用各轴方向的增量(dx,dy)规定,但为了表示最大长度的矢量,dx与dy分别需用16位,总共4字节来表示。如果所有的矢量都用4个字节表示,使用的存储器容量就非常大。不过短的矢量的dx和dy分别使用4位总共1个字节也足够了。因此,如果了解轮廓矢量的类型,短矢量就可以用一个字节表示,中等长度的矢量可以用两个字节表示,长的矢量则用四个字节表示,可以实现轮廓数据的压缩。
图31是相邻轮廓点间连接矢量类型的说明图。类型有0~5共6种,确定类型的考虑为①矢量为水平方向、垂直方向还是倾斜方向及②矢量的长度。
(1)类型0是相邻两点重合的情况,是几乎不存在的矢量。
(2)类型1是dx与dy分别可用4位表示的长度的矢量。
(3)类型2是dx=0的垂直方向的矢量,是dy可用8位表示的长度的矢量。
(4)类型3是dy=0的水平方向的矢量,是dx可用8位表示的长度的矢量。
(5)类型是倾斜的,是dx与dy可分别用8位表示的长度的矢量。
(6)类型5为dx与dy可分别用16位表示的长度的矢量。
由上所述,利用控制数据部CDT中的压缩信息可以表示组成区段轮廓的各矢量的dx-/dy-类型。这样一来,由于可以根据矢量的方向及矢量的长度选择合适的数据长度来表示矢量,就可以减小字型文件的大小(压缩轮廓数据),不过在读入轮廓数据时要考虑各段的类型,从而可以认清其数据长度并正确地读出轮廓信息。还有,压缩信息为区段组内各区段共用的数据,区段组是由矢量类型排列相同的区段所构成。
图32是控制数据结构说明图,图33是区段(汉字的“三点水”一部分)的轮廓说明图。
控制数据对应于轮廓的轮廓点每点设置一个,全部则与轮廓点数目一致。控制数据以8位表示,其中①第0~2位表示dx-/dy-的类型、②第3位表示dy的符号、③第4位表示dx的符号、④第5位表示Y辅助信息的有无、⑤第6位表示X辅助信息的有无及⑥第7位表示是否是贝齐尔曲线的端点。
如图33所示,在区段的轮廓由轮廓点0~9构成的场合,如①点0与1之间由短矢量连接、②点1与点4之间由第1贝齐尔曲线连接、③点4与点7间由第2贝齐尔曲线连接、④点7与点0间由第3贝齐尔曲线连接时,各控制数据的第7位取如图32下部表中所示之值。在连续点间两点均为“1”时是短矢量,在“1”和“1”的点间有“0”的点存在时,该“1”的点分别作为始点和终点生成贝齐尔曲线而连接之。
·辅助信息如果在图33的轮廓点0处附加y标志辅助信息、在点1处附加x标志辅助信息、在点4处附加y曲线信息、在点7附加x曲线信息,则在控制数据的点0,4的第3位上分别记入表示有y辅助信息的“1”、在点1,7的第4位上分别记入表示有x辅助信息的“1”。各x辅助信息、y辅助信息的类型在辅助信息类型表中记载。因此,如读入辅助信息偏移值HOF所示之辅助信息类型表(参照图30),则根据该辅助信息类型表可以了解需要在点0附加y标志辅助信息,在点1附加x标志辅助信息,在点4附加y曲线辅助信息和在点7附加x曲线辅助信息。
(g)构成区段组的区段条件依上所述,字型文件中构成区段组的区段需具备如下条件(1)区段轮廓的轮廓点数相同;(2)短矢量的压缩类型相同;(3)辅助信息类型相同。即,区段被分到满足这些条件的区段组并构成区段组。
(h)根据文字代码控制区段轮廓的产生按上述方式构成字型文件时,如给定文字代码,则根据文字代码化用目录部63,可了解与该文字代码相对应的字符头标位置并读出该字符头标。字符头标部64包括有指示构成文字的各区段所属的组的位置的区段组偏移值PGO和指示组内区段的轮廓块位置的区段轮廓索引POI。因而,根据这些数据PGO,POI判断存储区段轮廓信息的位置并从该位置读出轮廓信息。在这种场合,参照控制数据可以正确读出轮廓信息,而且根据在控制数据中所包含的关于辅助信息的信息,可以将辅助信息附加到轮廓点上。于是,参照所读出的轮廓数据及控制数据的第7位(区别短矢量与贝齐尔曲线),在生成短矢量、贝齐尔曲线的同时控制辅助信息就可生成与该区段相应的轮廓。
以上对本发明应用于汉字辅助信息的附加和字型文件构生法进行了说明,但也适用于对朝文等其他文字附加辅助信息构成字型文件。
以上根据本发明的实施例进行了说明,本发明依照权利要求的范围所提出的本发明的主旨可以有种种变型,而这些变型是包括在本发明之内的。
下面说明本发明的效果(a)附加辅助信息的效果按照本发明的上述内容,在将形状类似并附加有同样的辅助信息的文字构成元素自动分类,通过操作员的操作只对各类中的主元素附加辅助信息使系统学习附加辅助信息后,系统就可以自动对其他构成元素附加辅助信息,所以可以对笔划或区段等文字构成元素半自动地高效地附加辅助信息。
另外,依照本发明,划分0~360°为多个范围方向,在指定构成元素轮廓的轮廓点中连接其相邻各点间的矢量长度超过设定长度并且与前一个矢量的方向不同的场合,在计数属性数目的同时将该矢量作为属性段而将其方向以及始点、终点存储,在矢量长度短于设定长度时忽略该矢量,在矢量长度超过设定值并且与前一个矢量为同一方向时,将前一个属性段的终点用现矢量的终点更新,对所有的矢量进行上述处理而生成属性表,在两个构成元素的属性数目相同,而且属性段的方向数据的排列相同时,将这两个元素分到同一类,因此可以自动地高效地进行分类。
另外,依照本发明,在学习阶段在对各类中的主元素附加辅助信息之际,在已附加辅助信息的主元素之中求出和对象主元素最类似的最优匹配主元素,利用该最优匹配主元素的辅助信息对对象主元素附加辅助信息,然后在显示器画面上对辅助信息进行编辑而对对象主元素附加辅助信息,因而可以进行高效的辅助信息附加过程的学习。
另外,依照本发明,在求出附加有辅助信息的主元素及对象主元素的轮廓在X轴方向及Y轴方向的坐标值由减小变为增大或由增大变为减小的点的极值点的同时,在将X轴方向的极值点中坐标值由增大变为减小的极值点记为Xmax,坐标值由减小变为增大的极值点记为Xmin,而Y轴方向的极值点中坐标值由增大变为减小的极值点记为Ymax,坐标值由减小变为增大的极值点记为Ymin时,求出沿笔划的轮廓出现有Xmax,Xmin,Ymax和Ymin的排列,求出和对象主元素各轴方向的极值点数目相同且极值点排列也相同的已经附加有辅助信息的主元素,将求出的附加有辅助信息的主元素或对象元素一方的X,Y轴方向的大小与他方的X轴方向及Y轴方向的大小进行缩放以使其一致,缩放之后,根据两主元素重合的面积求出两主元素的类似度,将类似度最大的、附有辅助信息的主元素称为最优匹配主元素,因而其后就可以自动求出最优匹配主笔划,可以高效地进行辅助信息附加处理的学习。
此外,依照本发明,是将附加有辅助信息的主元素及对象主元素的一个对应点及以该对应点为端点的线段叠合,在以具有一定间隔的扫描线扫描时,将各元素内的各扫描线的长度相加作为各元素的面积,又将重合部分内的各扫描线的长度相加作为重合面积,将重合面积除以两主元素的面积之和的一半所得之值作为类似度,因而可以比较简单而精度很好地求出类似度。
另外,在自动附加辅助信息阶段,为便对象构成元素及主元素的各属性段始点、终点重合,在将一方元素的各个属性段缩放的同时,将该属性段的始点和终点间存在的一方元素的轮廓点同样缩放,求出与主元素的辅助信息位置最近的对象构成元素上的轮廓点,对该轮廓点附加前述辅助信息位置上的辅助信息,因而学习后就可以对各文字构成元素自动附加辅助信息。
(b)字型文件构成法的效果依照本发明,将形状类似的区段合成一组,组内区段可共用的数据在组内只需准备一次而构成字型文件,因而可以减小字型文件的大小,也可以减小所用的存储器容量。
另外,依照本发明,在对于决定区段的轮廓的轮廓点中相邻点间的连接矢量的类型可根据该矢量的方向和长度进行分类的同时确定为表示各种类型矢量所需的数据长度,在组头标部中的公共数据部中记载构成区段的轮廓的各矢量的类型,因而可以与其方向及矢量长度相应地用适当的数据长度来表示各矢量,从而可以减小字型文件的大小(轮廓数据压缩)。但是,在读入轮廓数据时,要根据公共数据部中所记载的类型识别各矢量的长度,从而可以正确读出轮廓信息。
此外,依照本发明,对各组都设置有记载辅助信息类表的辅助信息表,在组头标部中的公共数据部中记载有指示辅助信息表内辅助信息类型表位置的辅助信息偏移值,因此根据辅助信息偏移值可读出辅助信息类型表,可对区段的轮廓附加辅助信息,而且由于每一组可以只设一个辅助信息表,可以减小字型文件的大小。
另外,依照本发明,由于决定辅助信息附加于其上的轮廓的轮廓点位置的辅助信息位置数据是记载于区段组的公共头标部中,对由该辅助信息位置数据指示的轮廓点附加由辅助信息类型表规定的辅助信息类型,就可以自动地附加辅助信息。
此外,依照本发明,由于在组头标部的共同数据部中记载有区段轮廓数据的块长,根据决定对象区段的区段组内的轮廓块的序号的区段轮廓索引和块长,就可以高速读出所要求区段的轮廓数据。
权利要求
1.一种辅助信息附加方法,用于在将文字轮廓切分成其每个构成元素,对构成元素附加控制其形状的辅助信息数据,而用该构成元素的集合表示文字的轮廓字型生成装置中,其特征在于将具有类似外形的构成元素进行分类,在对各类的代表性构成元素(主元素)的轮廓的确定位置由操作员操作附加辅助信息时通过将辅助信息存储而对附加辅助信息进行学习,利用学习的主元素的辅助信息对该主元素所属的类中的构成元素自动附加辅助信息。
2.如权利要求1中所述的辅助信息附加方法,其特征在于将0~360°分成为多个方向范围,在指定构成元素轮廓的轮廓点中连接其相邻各点间的矢量长度超过设定长度并且与前一个矢量的方向不同的场合,在计数属性数目的同时将该矢量作为属性段而将其方向以及始点、终点存储,在矢量长度短于设定长度时忽略该矢量,在矢量长度超过设定值并且与前一矢量为同一方向时,将前一个属性段的终点用现矢量的终点更新,对所有的矢量进行上述处理而生成属性表,在两个构成元素的属性数目相同,而且属性段的方向数据的排列相同时,将这两个元素分到同一类。
3.如权利要求1所述的辅助信息附加方法,其特征在于在前述学习阶段对各类中的主元素附加辅助信息之际,在已附加辅助信息的主元素之中求出和对象主元素最类似的最优匹配主元素,利用该最优匹配主元素的辅助信息对对象主元素附加辅助信息,然后在显示器的画面上对辅助信息进行编辑而对对象主元素附加辅助信息。
4.如权利要求3所述的辅助信息附加方法,其特征在于在分别对附加有辅助信息的主元素及对象主元素的轮廓求出X轴方向及Y轴方向中一方向的坐标值由减小变为增大或由增大变为减小的极值点,同时在将X轴方向的极值点中坐标值由增大变为减小的极值点记为Xmax,坐标值由减小变为增大的极值点记为Xmin,而Y轴方向的极值点中坐标值由增大变为减小的极值点记为Ymax,坐标值由减小变为增大的极值点记为Ymin时,求出沿轮廓出现有Xmax,Xmin,Ymax,和Ymin的排列,求出和对象主元素各轴方向的极值点数目相同且极值点排列也相同的已经附加有辅助信息的主元素,将求出的附加有辅助信息的主元素或对象元素一方的X,Y轴方向的大小与他方的X轴方向及Y轴方向的大小进行缩放以使其一致,缩放之后,根据两主元素重合的面积求出两主元素的类似度,将类似度最大的附有辅助信息的主元素作为最优匹配主元素。
5.如权利要求4所述的辅助信息附加方法,其特征在于将附加有辅助信息的主元素及对象主元素的一个对应点及以该对应点为端点的线段叠合,在以具有一定间隔的扫描线扫描时,将各元素内的各扫描线的长度相加作为各元素的面积,又将重合部分内的各扫描线的长度相加作为重合面积,将重合面积除以两主元素面积之和所得之值的二分之一作为类似度。
6.如权利要求2所述的辅助信息附加方法,其特征在于为使对象构成元素及主元素的各属性段始点、终点重合,在将一方元素的各属性段缩放的同时,将该属性段的始点和终点间存在的一方元素的轮廓点同样缩放,求出与主元素的辅助信息位置最近的对象构成元素上的轮廓点,对该轮廓点附加前述辅助信息位置上的辅助信息。
7.一种字型文件构成方法,其特征在于在将文字的轮廓切分为以一笔为单位的笔划、将笔划切分为区段,将文字以区段集合表示的轮廓字型生成装置中所使用的字型文件构成方法中,将形状类似的区段归为一组,区段组数据部由记录组内各区段的公共数据的头标部及记载属于该组的区段的轮廓的区段轮廓块构成,构成的字型文件可根据文字代码确定构成该文字代码所指示的文字的区段所属的组别和位置,以及组内区段的的轮廓块的位置。
8.如权利要求7所述的字型文件构成方法,其特征在于组内区段轮廓块依出现率的高低顺序排列。
9.如权利要求7所述的字型文件构成方法,其特征在于前述的公共数据中包含有区段轮廓数据的块长,前述的轮廓块位置数据是区段组中从头算起的块的序号,依据块长和块的序号可得到区段的轮廓块位置。
10.如权利要求7所述的字型文件构成方法,其特征在于在对决定区段轮廓的轮廓点中相邻点间的连接矢量的类型进行分类时要考虑该矢量为水平方向、垂直方向还是倾斜方向,以及矢量的长度,同时定出为表示各类矢量在各轴上的分量所需的数据长度,前述的公共数据中包含有记载构成区段的轮廓的各矢量的类型的控制数据。
11.如权利要求10所述的字型文件构成方法,其特征在于根据由前述控制数据所得到的各矢量的类型去识别构成轮廓的各矢量的数据的分段而读出轮廓信息。
12.如权利要求7所述的字型文件构成方法,其特征在于在字型文件中每个组都设置有记载辅助信息类型表的辅助信息表,辅助信息类型表依共同附加于组内各区段的轮廓的辅助信息的种别排列,前述的公共数据包括指示辅助信息表内辅助信息类型表位置的辅助信息偏移值数据。
13.如权利要求12所述的字型文件构成方法,其特征在于前述的共同数据包括决定辅助信息类型信息所附加的轮廓的轮廓点位置的辅助信息位置控制数据。
14.如权利要求13所述的字型文件构成方法,其特征在于根据前述辅助信息偏移值数据读出辅助信息类型表,将根据辅助信息类型表求出的辅助信息附加于前述控制辅助信息位置的数据所指示的区段的轮廓的轮廓点之上
全文摘要
本发明是用于对笔划或区段等文字构成元素高效率地附加辅助信息。其中的笔划分类部将具有类似轮廓的笔划分为一类,附加辅助信息学习部供操作员通过其操作将辅助信息附加于各类中的主笔划的轮廓确定位置上,该辅助信息由存储部存储而完成辅助信息附加过程的学习,从而使辅助信息自动附加部可以利用所学的主笔划的辅助信息对该主笔划所属的类中的构成元素自动附加辅助信息。
文档编号G06K15/00GK1153361SQ9611336
公开日1997年7月2日 申请日期1996年9月25日 优先权日1996年9月25日
发明者阿托尼斯·海尔曼 申请人:富士通株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1