系统外字的异地自动取存技术的制作方法

文档序号:6628298阅读:106来源:国知局
专利名称:系统外字的异地自动取存技术的制作方法
术语1、“系统外字”(简称为“外字”)指用户需要处理、但在计算机当前的操作系统中并不存在的汉字。
2、“应用系统”指运行在计算机操作系统上的各种应用软件系统。应用软件系统所使用的汉字由操作系统提供。
3、“汉字的外码”指计算机操作系统中,对应汉字内码的外部输入码(即各种中文输入法的编码)。
1.技术领域本专利用于计算机系统解决系统外字使用不方便的问题。目前,中文信息处理系统解决系统外字的方法,是要求用户在使用计算机处理内容供应商所提供的内容之前,就要了解所涉及到的系统外字,并要预先将系统外字字库包安装到自己的计算机操作系统中才能使用。本专利的特点是,用户在处理内容供应商所提供的内容时,若遇见系统外字,该外字可以立即实时自动地被加载到自己的计算机操作系统中,使用户不会察觉到在文件或介质中存在着系统外字。
1.1获取系统外字信息的方式本专利按照用户可能使用的环境,分别采用两种方式获取系统外字信息(1)第一种是非联网获取方式将系统外字信息加载在用户所要处理的文件或介质中,这些文件不是由用户编辑生成的,而是由内容供应商提供。应用系统在处理这些文件时,首先取出文件中的系统外字信息,然后通过“中标中易系统外字处理器”将外字信息还原成曲线汉字,并自动加载到用户的计算机操作系统中。
(2)第二种是联网获取方式通过“中标中易系统外字处理器”实时自动下载系统外字到用户端,然后自动加载到计算机操作系统中。
使用上述两种方式,都不会让用户感觉到是在用系统外字。
1.2应用领域本专利可应用于以下领域(1)通过Internet互联网浏览文件时,自动处理文件中的系统外字;(2)阅读光盘中的电子读物时,自动处理读物中的系统外字;(3)公安、海关、银行、旅店等读取IC卡中的人名、地名信息时,自动处理其中的系统外字;(4)处理用字范围大的报纸杂志采编排版系统中的文件和编辑排版系统中的文件所涉及的系统外字;(5)处理数字图书馆应用系统中涉及的系统外字;(6)处理政府办公自动化系统中涉及的系统外字;(7)处理科研、文献等系统中涉及的系统外字。
总之,各行各业都可以应用本专利技术及其设备来处理系统中涉及的系统外字,而且让用户在自己的计算机上处理这些中文信息时,无需考虑,也不会察觉是在使用系统外字。
2.背景技术随着计算机应用的普及和Internet互联网上数字化资源的丰富,各行各业不论是在科学技术层面还是在公安户籍管理、银行以及文献、古籍的应用层面,计算机操作系统以外生僻字出现的机率越来越高,应用系统的设计者在设计中文信息处理系统时,要考虑如何将用户在使用该系统时所要处理的系统外字加载在用户的计算机操作系统中。
2.1当前技术存在的问题系统外字进入用户系统,当前技术采用的方式是在用户的计算机上预先安装外字字库包。这种方式有以下欠缺(1)手动安装由用户自己安装,使用不太方便。
(2)多次安装在很多应用领域中,系统外字库在不断更新,这就需要用户多次获取并安装外字字库包。
(3)及时性差用户在每次处理新的文件时,为避免文件中出现新的系统外字无法处理,需要每次查询是否又有新的外字字库包可供更新。
(4)下载数据量大用户通过Internet互联网下载外字字库包时,需要下载所有外字字库包,而不是只下载更新的外字字库包,下载的数据量大。
(5)使用方便性差要求用户了解字库包的安装。对通过Internet互联网下载字库包的用户,还要求他们了解如何下载。
2.2本专利技术特点本专利处理系统外字的特点如下(1)实时在用户使用系统外字之前,本专利可实时地将用户所需要处理的系统外字加载到用户的计算机操作系统中;(2)自动可以自动地将用户所要处理的系统外字加载到用户的计算机操作系统中;(3)通用使用本专利加载到用户的计算机操作系统中的外字编码标准,字型描述符Truetype标准或其它标准字型(如矢量字型、二次Bezier曲线描述的字型或三次Bezier曲线描述的字型),因此使用具有通用性;(4)方便对用户而言使用方便,不需要用户了解系统外字,也不需要手工加载。
3.发明内容通过介质传输的系统外字的异地自动取存技术包括四个方面的内容一是“中标中易汉字造字系统”的技术和工具;二是能够方便实现系统外字异地取存的“中易系统外字格式”;三是系统外字异地存放方法;四是“中标中易系统外字处理器”将系统外字实时自动加载到用户计算机操作系统中的技术。
3.1中标中易汉字造字系统中标中易汉字造字系统可以生成两种外字描述中标中易轻量组合曲线汉字和中标中易高精度曲线汉字。
3.1.1中标中易轻量组合曲线汉字的生成中标中易轻量组合曲线汉字是由部件组合而成,它可以分成两部分一部分是汉字的部件信息库,这部分信息与汉字的具体字型无关,是不变的,它包含组成当前汉字的所有部件。
这些部件以贝塞尔(Bezier)曲线描述。另一部分是字的结构信息,例如各种形状和不同尺寸的部件编号,以及部件的位置等。当需要生成一个新的系统外字时,只需根据汉字的部件信息库,构造出该字的结构信息。也就是说,在这种外字描述方式下,系统外字字形描述信息为字的结构信息。
3.1.1.1汉字部件库的设计●采用合适的部件数量通过对GB13000标准及国际标准ISO106462003所包含的汉字进行研究,要使外字部件组合而成的汉字美观,并且保证组合而成的汉字的存储空间小(即为“轻量”),得出常用的部件是5000个左右,以此生成部件库。此部件库可满足构成GB13000标准所含的20902个汉字,也可构成国际标准ISO106462003所包含的70195个汉字。更重要的一点是能够使得组合成的汉字字型没有较大的变形,因此制作生成的字型很美观。
●给每个部件编制某一种输入法的外编码,例如《郑码》中文输入法的编码。
本组字技术是采用输入某一种输入法的编码来完成对部件的调用,为此这种方法需要给每个部件编制输入法的外编码,然后才能完成对部件的调用。
3.1.1.2组字模块本组字模块是基于上述汉字部件库实现的。本模块组成汉字的方法是将汉字看作是由一个或多个部件组成。先输入外码,根据外码到汉字部件库找到相应部件,外码相同的部件可能有多个,从中选取一个合适的来组构该汉字。然后把所选的每个部件移到该汉字字型合适的位置,再作适当的放大或缩小调整,达到美观、正确后,再通过程序技术调整字形的粗细,即可完成该汉字字型的生成。
本模块记录的是组成该汉字的所有部件的代号、位置及缩放信息。需要信息量小的系统外字可用这种方法。
3.1.2中标中易高精度曲线汉字的生成中标中易高精度曲线汉字造字系统具有拼字、修字和补字功能。使用该系统,在计算机屏幕上,可以用输入法的外码,例如《郑码》,迅速地从部件库中调出所需要的部件。然后根据组合该汉字所需部件在字中所处位置及大小加以选择,并将其调入拼字区拼合成整字。在这过程中,还可以方便地实现字形的修边、平移、缩放、翻转、复制及增删笔画等基本功能。该造字工具还能做到人机交互式调整控制点及笔画粗细等参数。这些功能不但可以提高制作字的效率,而且起到了保证字形优美的作用。
中标中易高精度曲线汉字以贝塞尔(Bezier)曲线描述汉字字形轮廓,记录所有曲线的各控制点作为汉字字形描述信息。根据用户的需求,系统外字也可以用这种方法。
3.2中易系统外字格式当用户所要使用的系统外字多于一个时,每个系统外字的汉字信息是连续存放的。
中易系统外字格式
系统外字信息格式
(1)汉字编码信息汉字在系统中的内码,对于双字节内码汉字,每个汉字编码占用2字节,对于四字节内码汉字,每个汉字编码占用4字节;(2)汉字外码索引编号汉字输入码编号,其中第一位为外码标志位。
当外码标志位为0时,汉字外码索引编号占10位,除外码标志位外的9位为拼音编号,将所有420个无声调汉语全拼音从0-419编号,拼音编号为汉字拼音所对应的编号。
当外码标志位为1时,汉字外码索引编号占26位,除外码标志位外的25位定义如下
输入法名称编号为0时,表示《郑码》,为1-7时,给使用的其他输入法保留。
外码键编号从0-26,0表示结束,1表示字母A,2表示字母B,3表示字母C,...26表示字母Z;(3)字体该汉字的字体,占5位,编号为0-31,表示32种字体之一;(4)字形格式该汉字的字形格式,占1位,0表示字形格式为中标中易轻量组合曲线汉字,1表示字形格式为中标中易高精度曲线汉字;(5)字形信息针对不同应用系统的需要,汉字的字形描述方式分为两种,一是中标中易轻量组合曲线汉字,另一个是中标中易高精度曲线汉字。中标中易轻量组合曲线汉字中只包括字的结构信息,它适用于加载在用户所要处理的文件或介质存储空间较小的情况下,如将系统外字加载在IC卡芯片中。中标中易高精度曲线汉字适用于加载在用户所要处理的文件或介质存储空间不受限制的情况下,如将系统外字加载在Internet互联网或局域网传输的所有用于浏览的文件;涉及大量用字的报纸杂志采编排版系统中的文件和编辑排版系统中的文件;IC卡芯片以及电子读物等。
3.2.1中标中易轻量组合曲线汉字的信息描述方式中标中易轻量组合曲线汉字是由部件组合而成,它可以分成两部分一部分是汉字的描述信息,例如组成汉字各部件的描述;另一部分是字的结构信息,它包括了字的结构信息,例如各种形状和不同尺寸的部件代码、部件的缩放信息、以及部件的位置等。
中标中易轻量组合曲线汉字描述符合标准的Truetype格式。
中标中易轻量组合曲线汉字格式字形信息数据占的空间平均每个汉字约为15字节。信息包含(1)部件个数该汉字是由几个部件构成;(2)部件信息,每个部件信息占用4或6个字节,当该部件与部件库中的部件大小一致时,部件信息占用4个字节,当该部件与部件库中的部件大小不一致时,部件信息占用6个字节,部件信息包括●每个部件的代号将所有部件从0开始顺序编号,部件的代号为该部件对应的顺序编号;●每个部件的位置所有构成该汉字的部件分别在字中的位置信息,只存放部件左上角在字中的位置;●每个部件的缩放信息相对于原部件的大小,每个部件在字中应缩放的比率。
3.2.2中标中易高精度曲线汉字的信息描述方式中标中易高精度曲线汉字为整字描述,符合标准的Truetype格式,字形信息数据占的空间平均每个汉字约为180字节。部件的描述信息包括(1)汉字的宽度;(2)汉字所含的轮廓数;(3)汉字中各轮廓所含的控制点数;(4)汉字的所有控制点的位置信息;(5)汉字的所有控制点的在线或离线标识。
3.3系统外字异地存放方法系统外字采用异地存放,只适用于中标中易轻量组合曲线汉字。因为这种汉字记录的是组构汉字的部件信息。它的信息描述可以分成两部分。一部分是汉字的部件信息库,其中包含组成当前汉字的所有部件;另一部分是汉字的结构信息,例如每一个部件的编号、位置和缩放信息等。也就是说,字形描述信息为字的结构信息。
异地存放方法是将系统外字结构信息存放在用户所要处理的文件或介质中(例如IC卡中),这样字形信息数据占的空间极小,平均每个汉字约为15字节。而将部件信息库存放在用户计算机的“中标中易系统外字处理器”中。
3.4中标中易系统外字处理器3.4.1组成主要有三个模块,一是获取系统外字信息模块,二是外字信息还原模块三是加载外字字型及外码模块。
3.4.1.1获取系统外字信息模块获取系统外字信息有以下两种方式●非联网获取方式从用户所要处理的文件或介质中取出系统外字,是由用户端相应的文件或介质的读取程序完成,并提交中标中易系统外字处理●联网获取方式,由中标中易系统外字处理器从指定的互联网服务器直接获得。
3.4.1.2外字信息还原模块“中标中易系统外字处理器”将系统外字的格式信息还原,还原包括字形还原;字体还原以及外码索引编码的还原。
字形还原可以是标准的Truetype格式或其它标准格式,如矢量汉字、二次Bezier曲线描述的汉字或三次Bezier曲线描述的汉字等。
3.4.1.3加载外字字型及外码模块本模块可把还原后的字型自动加载到系统中,完成对系统字的自动更新,并更新系统的输入法,同时产生所加字的外码表(包括外字及其外码)。使得用户使用外字就和使用系统字一样,使用者不需要作任何操作,就可显示、打印所添加的外字,也可通过字的外码来输入该字。,如果不知道添加有哪些外字或不知所添外字的外码,可查询所提供的内码列表或外码列表。
3.4.2提供方式(1)计算机内置的芯片板卡等及驱动程序。
(2)计算机外置的串口、并口和USB口等外部通讯接口的存储设备及驱动程序。
(3)计算机应用软件或功能模块。
4.


(1)附图1给出了汉字部件库的设计流程。部件库对于字型美观、字库数据量小和系统外字设计方便都起到非常重要的作用。
(2)附图2给出了技术实施总流程。从该流程可以看出,技术的实施有四种●轻量组合汉字通过介质传输,自动加载到用户计算机系统;●轻量组合汉字通过互联网自动下载,自动加载到用户计算机系统;●高精度汉字通过介质传输,自动加载到用户计算机系统;●高精度汉字通过互联网自动下载,自动加载到用户计算机系统;(3)附图3给出了一种具体实施方式
的应用模型,即IC卡应用模型。
5.具体实施方式
以IC卡制作部门在处理IC卡中人名、地名时涉及到系统外字,以及读卡用户的使用,作为本专利技术及其设备的一种具体实施方式
实例之一的应用模型。
5.1IC卡制作部门制作IC卡(1)提交系统外字制卡部门在当前计算机操作系统下运行的应用系统中,遇到无法输入的汉字时,可以将该字判别为系统外字,提交给外字处理中心。
(2)外字处理中心制作系统外字●认定系统外字再次判别该字是否属于系统外字。还是属于制卡部门因使用输入法不当而没能够输入的汉字,或是属于能够做认同处理的汉字等。
●制作系统外字若认定该字是系统外字,便使用“中标中易汉字造字系统”造字。此造字系统提供两种汉字描述方式给外字处理中心,由外字处理中心选择一种汉字描述方式,完成系统外字的造字工作。一般制作IC卡时,是采用中标中易轻量组合曲线汉字的描述方式制作该系统外字。
●给该字编制内码编码和汉字外码索引编号(可用拼音编号)。
●将该系统外字的结构信息数据打包,并发放到各制卡部门。
(3)完成含有系统外字的IC卡的制作制卡部门得到该系统外字的结构信息数据包后,放到IC卡的指定地址即可完成IC卡的制作。
5.2读卡用户读取IC卡读卡用户,例如机场安检、海关出入境管理、银行储户服务、酒店客户管理以及票务登记等部门,在用读卡器等设备读取IC卡中的人名、地名等信息时,若其中含有系统外字,读卡器自动将获取到的该系统外字的信息提交给“中标中易系统外字处理器”。此处理器可以设在读卡器中,也可安装在用户计算机的操作系统中,或本专利提到的计算机专用外接设备中。由于“中标中易系统外字处理器”中储存有能够组合所有汉字的部件库,它又从IC卡中取出了系统外字的结构信息,与部件库配合,便可将该系统外字还原成汉字,并将汉字的输入外码还原,然后实时自动地加载到用户计算机的操作系统中,使得用户在读取IC卡时,即使有系统外字也察觉不到。也就是说,不需要考虑系统外字是否能处理的问题。
权利要求
一种计算机操作系统的系统外字的异地自动取存技术,其特征在于
1.内容供应商在制作内容时,考虑到某些汉字在用户当前的操作系统中属于系统外字,内容供应商可以使用本专利“中标中易汉字造字系统”的技术和工具制作这些系统外字,生成“中易系统外字格式”的外字信息文件,然后根据用户使用环境的不同,将此系统外字以下述两种传输方式之一传递到用户的应用系统中。一是针对非联网获取系统外字的用户内容供应商将系统外字信息加载到用户的应用系统所要处理的文件或介质(例如IC卡)中,当用户使用应用系统读取该文件或介质时,本专利的“中标中易系统外字处理器”便将文件或介质内容中所包含的系统外字信息还原成曲线汉字,并立即实时进入用户的计算机操作系统中。二是针对联网获取系统外字的用户内容供应商将系统外字信息上传到指定互联网服务器,用户端的“中标中易系统外字处理器”会立即自动下载此系统外字信息,然后将此外字信息还原成曲线汉字,并立即实时自动进入用户的计算机操作系统中。上述两种传输方式,均使用户不会察觉到在文件或介质中存在着系统外字。
2.根据权利要求1所述,“中易系统外字格式”是通过“中标中易汉字造字系统”的技术和功能来生成的。
3.根据权利要求1,“中易系统外字格式”包括五部分信息(1)汉字编码信息;(2)汉字外码索引编号;(3)汉字字体信息;(4)字形描述方式的代号;(5)字形描述信息。
4.根据权利要求1和2和3,字形描述信息有两种描述方式(1)中标中易轻量组合曲线汉字是以贝塞尔(Bezier)曲线描述汉字部件和独体汉字的字形轮廓,然后以尽量少的部件和独体汉字的整字形成部件库,通过人工操作“中标中易造字系统”的移动、缩放功能来组构汉字。字形的粗细通过程序技术来调整。然后记录部件库中构成汉字的部件的编号、位置及缩放信息作为字形的结构信息加以存储。(2)高精度曲线汉字,其字形描述方式与轻量组合曲线汉字的不同点在于记录每个汉字字形轮廓的曲线控制点作为构字信息。
5.据权利要求1和4所述当系统外字使用中标中易轻量组合曲线汉字时,采用异地存放方法。就是将系统外字结构信息存放在用户所要处理的文件或介质中;将部件信息库存放在用户计算机的“中标中易系统外字处理器”中。由于将字形结构信息和字型部件信息库分别异地存储,在载体中只存储字形结构信息,因此数据量很小,平均每字为19个字节,但又保证了还原后字形的美观。当系统外字使用中标中易高精度曲线汉字时,存储的是整字信息,数据量平均每字为180个字节,还原后字形优美。根据不同需求,选用上述两种方式之一都能达到制作组构系统外字的目的。
6.根据权利要求1和5所述,“中标中易系统外字处理器”可以将所获取的系统外字的格式信息还原,并立即实时自动地加载到用户的计算机操作系统中,用户可以象使用系统字一样,在操作系统和应用系统中使用这些系统外字。
7.根据权利要求1和6所述的系统外字的格式信息还原,包括字形还原;字体还原以及外码索引编码的还原。字形还原可以是标准的Truetype格式或其它标准格式,如矢量汉字、二次Bezier曲线描述的汉字或三次Bezier曲线描述的汉字等。
8.根据权利要求1所述的系统外字提供给用户使用的方式包括输入、显示和打印输出。同时提供汉字的内码列表和外码列表以方便用户输入系统外字。外码列表例如拼音码输入法列表和“字根通用码——郑码”输入法列表等。
9.根据权利要求1所述的文件或介质,是指包括在Internet互联网上传输的所有用于浏览的文件;用字范围大的报纸杂志采编排版系统中的文件和编辑排版系统中的文件;IC卡芯片以及电子读物等。
10.根据权利要求1和6所述的“中标中易系统外字处理器”有几种提供方式(1)计算机内置的芯片板卡等及驱动程序。(2)计算机外置的串口、并口和USB口等外部通讯接口的存储设备及驱动程序。(3)计算机应用软件或功能模块。
全文摘要
随着计算机应用的普及,计算机操作系统外字(简称外字)出现几率越来越高。目前解决的方法是要求用户预先安装外字字库包。本发明特点内容供应商使用本发明技术及设备的“中标中易汉字造字系统”生成“中易系统外字格式”外字信息,以两种传输方式之一传递到用户计算机中。一是将外字加载到用户所要处理的文件或介质(如IC卡)中,传递到用户计算机。二是将外字上传到指定的联网服务器,再传递到用户计算机。在用户端,“中标中易系统外字处理器”自动还原外字信息,并加载到计算机系统中,用户不会察觉到在使用外字。此项发明技术有针对性地解决了在计算机等电子设备中外字使用不便的问题,具有符合标准、兼容性强、方便实用的特点。
文档编号G06F17/00GK1700202SQ20051008274
公开日2005年11月23日 申请日期2005年7月11日 优先权日2005年7月11日
发明者谢术清, 蒋贤春, 朱人杰, 郑珑, 蓝德康 申请人:北京中易中标电子信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1