九九分级制编码法(包括形序分级编码法与音序分级编码法)及10×10键盘创制方案的制作方法

文档序号:6602700阅读:291来源:国知局
专利名称:九九分级制编码法(包括形序分级编码法与音序分级编码法)及10×10键盘创制方案的制作方法

发明内容
简介(一)九九分级制编码法,是计算机输入信息的一种数码法,可应用于多文种多用途的编码,并在输入时,不要求必须记忆编码。
(二)九九分级制编码法将汉字汉词、按形体分为单元、部首、单字、词语等四级,叫形序分级编码法;按音节分为声母、韵母、单字、词语等四级,叫音序分级编码法。
(三)10×10键盘创制方案,是与九九分级制编码法相适应、针对字母数字键盘的局限性及其流弊而设计的创意性改革方案。
二、发明设计的背景与目的(一)国际标准化组织,为满足世界上多文种多用途的编码需要,于1992年制订了《肆八位二进制代码体系》提供了“双八位”与“四八位”两种代码形式。前者适用于16进制编码;后者适用于10进制编码,称为正则形式或模范形式。还编制了《通用多八位编码字符集》ISO10646VCS。汉字(中、日、韩通用的)作为它的子集,已由我国制订了GB13000VCS,其中10进制编码,已由四位数改为六位数。随着这种多文种编码标准的逐渐贯彻,必将有多文种计算机系统的兴起。这种系统的计算机,应该而且必须方便输入汉字,(因为汉字在世界上的两千多种文字中,使用人口最多而又最难输入,是多文种信息处理问题的难点和重点。)也只有这样,才会实现改订国际编码标准的最终目的,方便多文种的信息处理。
(二)“在不久的将来,汉字将会成为金世界的共同文字”,这是日本《从头重奏》月刊的预测,这个预测是根据“没有那一种文字能像汉字那样具系统性和逻辑性。汉字是一种只需用眼睛看就能思考,即使语言不同也能理解其意思的唯一一种文字。”外国人既然如此的推崇和向往汉字,我们便应该千方百计,避免那种所谓“肢解汉字”和“污染汉字编码”的作法——即贬低汉字评值、妨碍汉字推广的作法,使外国人也容易学用汉字编码,方便在计算机上输入汉字。
(三)汉字编码目前存在的缺点和问题(1)一般性的缺点。数码难记且慢;音码碍于字音的读准,且受地区的限制;形码“难学易忘”,且不符合国家文字规范,严重到“肢解汉字”的程度。
(2)主要的问题。汉字字形编码虽能提高输入效率,满足专业人员的需要,但未能与中小学语文教育相一致,未能从根本上解决汉字编码的普及问题,导致计算机的滞销,影响计算机的普及。(“在专业应用市场饱和后,造成计算机内部空间的浪费,同时影响计算机进一步向全民普及,广州日报曾为此提出;“‘为什么三分之二的计算机在睡大觉?’”见《汉字要走出编码时代》)。
(四)专家对汉字编码提出的高标准(1)郑易里(著名文字学家、字根通用码发明人)提出“一个最佳方案,除了理论严谨,能在计算机上快速输入输出之外,还要做到编码规律符合国家文字规范,与基础教育的背景即中小学的语文教育相一致;做到计算机汉字输入编码和字典检索编码完全一致。只有这样,小学生开始学汉字,同时也学会汉字编码,就可以和西方的小学生一样,不必经过专门学习,就能用这种编码在计算机上输入汉字。”(2)潘德孚(表形码的修正者)提出“汉字的编码是宏观的,要适用于所有使用汉字的领域;要适合所有使用汉字的人们,……还要能继承所有的汉字文化。”“汉字编码的学习对象,不只是专业输入人员,更多的是非专业人员,……不仅只是中国人,也应该包含日本、韩国、新加坡和其他国家使用汉字的人们。”(3)吴晓军(新概念码的编撰人)提出“第三个阶段的任务就是在一种真正易学易记的基础上,用一个原理将汉字编码的三大类型完美地统一起来,从而使汉字编码技术产生一个质的飞跃。”发明人是根据上述专家提出的要求、针对汉字编码存在的缺点和问题,结合国际编码标准的动态及汉字在国际推广的前途而设计的,其目的是(1)通过汉字编码与识字教育和词书检索的一致,及相应键盘的配合,从根本上解决汉字编码的普及问题,从而促进计算机向全民普及。
(2)通过使用者的实施发明,对于推广汉字、发扬汉字文化、及方便多文种输入计算机发生积极作用。
三、九九分级制编码法九九分级制编码法的特征是(一)利用分级方式,将长码分化为短码,从而分化数码的记忆强度;每级的短码在“99”以内,能将字码逐级显示在屏幕上,因而输入时不要求记得字码;且其代码为国际通用的阿拉伯数字,故适合所有使用汉字(或其他文字)的人们。
(二)码元为00、01-99,与10×10键盘的键符代码一致,能“一代一”地进行输入,因而能够克服“一代多”或“多代一”所造成的缺点、问题和严重的不良现象。所谓“一代一””是指一个(键符代码)代表一个(字元或码元)。现行日文输入是“多代一”,即两个字母(键盘代码)代表一个片假名或平假名,其缺点是效率低。现行汉字形码是“一代多”,即一个字母要代几个到二十几个字根—部件(字元),造成重码率有高达9%的,要死记几百个部件及其代码,要死记取码规则并须临时拆字取码,一直未能避免“肢解汉字”形体,脱离识字教育,违反国家文字规范等现象。九九分级制编码法的码元,除“00”为编制等长码备用之外,可通过“分级方式”而99倍地变相增多,不要求字元要少,无论字元有多少,均能“一代一”地输入;无论汉字有多少,均无重码;不要求字元要少,便不致于迫使不按造字规律和结构规律去分解汉字形体。
(三)级数和每级的序数(即序号,只是限制在99以内),都是不固定的,可以随需增减,故能广泛应用于所有需要编码的领域。即凡能分出形素或音素,或有一定规律可循的文字;凡能分种分类、分纲分目、分条分款的事物,都可应用它来进行编码。它为计算机输入编码提供了两种输入代码形式
(1)多文种输入模式。音素或形素在99个以内的,只分为一级。例如俄文的大小字母,以01-66作代码;日文的片假名以01-86作代码,平假名以01-83作代码。音素或形素超过99个的,可分为两级或两级以上。例如维吾尔文阿拉伯字母128个,第一级词尾、词中、词首、单写,用01-04作代码,第二级按其分属该四类的字母数,恰好各为32个,分别用01-32作代码。
(2)多用途输入模式。可按其实际的需要来分级和给予序号。例如将一旅6500名士兵进行编码,则团、营、连、排、班等五级均以01-03作代码,士兵一级均以01-09作代码。其效果是比从“0001”编到“6500”好查好记得多。图书管理、情报检索等均可类此随需增减级数。
四、形序分级编码法形序分级编码法,是九九分级制编码法在汉字字形编码的具体应用,是体现九九分级制编码法特征的一个重要编码方法。
(一)编码技术要点。为简化描述和方便理解,抄录发明人编制的《形序码大汉字库码本》(即GB13000VCS,中、日、韩通用的两万余字的形序码)中一个小单元作抽样说明如下

注1.在字行中的符号

,依次表示以上的字是常用字、次常用字、通用字,“字库”内的字。以便制作“翻页”参考。
2.“36”是单元码。竖排的是部首和部首码。横排的是部属单字和字码。
3.单字的取码是单元码+部首码+字码。(词语再加词语码)。
解通过软件的制作,当行使命令进入编辑状态时,屏幕便显示各单元的单元码和单元代表部首(如76旦),引起联想(某部属于某单元)。当按单元码键时,屏幕便显示该单元所属的各部首及部首码。当击部首码键时,屏幕便显示该部所属的各单字及字码,击字码键时,屏幕便显示词语及词语码,此时,如击空格键,单字便调了出来;如调词语便击词语码键后再击空格键。
补(1)单元安排。当“部首”集中形近字群,部首再按“形近相邻”的原则排定后,划分为94个单元,95单元为难检字,96、97用户自编词语,98语种字母,99图形符号。(2)繁体字处理。形符经简化后的繁体字(如前


)个别或少数声符经简化后的繁体字(如前“

”、“擔、膽”),置于词语一级的首位,其编码均为“01”,词语编码,自“02”开始。声符经简化后而有形近字群的紧体字,(即同声旁的繁体字都被简化了),选出“部首”成为一部,附于简体部首之后。
(二)所能产生的效果。形序分级编码法用于汉字编码将取得如下效果(1)易学易用、适合所有使用汉字的人们。
因为(甲)数码是三种编码类型中最好学的一种编码。数字难记的缺点,通过屏幕显码予以克服而变为输入时勿须记忆编码,也就好用了。(乙)所采用的代符,是国际通用的阿拉伯数字,为中外人们所熟悉,避免了要求读准字音、或拆分字形等所带来的种种繁难,这就方便外国人、适合所有使用汉字的人们了。
(2)与字典检索和中小学语文教育相一致,能从根本上解决汉字编码的普及问题。因为(甲)形序分级编码法是建立在汉字的结构分析,分析的方法和识字教学法是一致的,都采用了形声分析法。学生在识字学习中便掌握了形序分级编码的基本原理。(乙)《形序码通用字码本》中的汉字排序,已应用来编写了字典和字帖。这种排序,从前述“76单元”的排序中可以证实是集中形近字群归“部”,再集中形近部首群归单元,是一种方便比较字形和集中快速识字的排序,有助于识字教育。而学生在使用这种排序的字典和字帖中,便熟悉了形序码,不须经过专门学习编码方法,便能够在计算机上输入汉字。并从而排除或克服形码“肢解汉字”形体、违反国家文字规范、脱离识字教育、“难学易忘”等严重的现象与问题。
(3)能继承所有的汉字文化。经先后编制“通用字码本”和“大汉字库码本”(即由七千字增加到两万余字)的结果表明;单元所属的最多部数,由31增到40;部属的最多字数,由21增到47。它们的增加率小于总字量的增加率。而且单元属部是可以调整的;部属的字量;常因总字量增加,须由一部分为两部反而减少。因此,在形序分级编码法“94(单元)×99(部)×99(字)=921299字”的编码空间里,在无重码和屏幕显码的要求条件下,是完全能够将“继承所有的汉字文化”所需要的汉字全部编入码本。
(4)能将三种编码类型初步地统一起来。
形序分级编码法是形码兼数码,它和音序分级编码法是统一于九九分级制编码法的,这可以算是初步地统一起来了。(至于现行各种形码所认定的字根或部件,也可由原来26个字母加几个数字作输入代码,改由“01-99”作输入代码进行输入,或许还稍方便,但大可不必了)。
(5)具有提高输入效率的方便条件。通过10×10键盘和软件制作,可有95个一键字,1365个两键字(大汉字库为2002个),其余都是三键字。但要再提高效率还很方便(甲)当击字码键时,屏幕便显示词语和词语码,方便采用词语输入方式来提高输入效率。(乙)特别留有两个单元给用户自编专业词语和常用词语。
五、音序分级编码法音序分级编码法,是九九分级制编码法在汉字字音编码的具体应用,它的特征是(一)以数字作代码,能“一代一”地输入。它将汉字汉词分为声母、韵母、单字、词语等四级;21个声母由01-21作代码;35个韵母由01-35作代码;同音节超99字者,增加四声一级,阴、阳、上、去由01-04作代码,都能“一代一”地进行输入。和它近似的双拼法则有一个字母代两个韵母的,不能全部“一代一”地输入。
(二)词语有屏幕显码,输入词语略较方便。当击单字码键后,屏幕便显示“简代”词语与词码,如不调单字,再击词语键码后,才击空格键,便可调出词语。双拼法输入词语要临时取码,元屏幕显码。其码本与形序分级编码法共用。
六、10×10键盘创制方案(一)10×10键盘的特征。10×10键盘是与九九分级制编码法相适应的特制键盘,它的特征是(1)输入键为10×10=100个,键符是“00.01-99”的等长代码。使用它的键符代码,能一键输入两位数,解决数码效率低的难题。它的键符代码为人人所熟悉,并与形序分级编码法所使用的字符代码相一致,省去转换环节,支持该编码法实现前述的五项效果“见四(二)”,从而解决数码难记;形码“肢解汉字”、违反国家文字规范、脱离识字教育、难学难普及等重大老难问题,对向全民普及计算机产生直接的促进性作用。
(2)输入键的键数适中,使键符能任意指代,具灵活性及广泛的适用性。故能排除国际标准键盘的局限性给多文种(包括汉字)所带来的种种繁难,使一般编码都能“一代一”地进行输入,支持九九分级制编码的两种输入模式的广泛应用,对于汉字的国际推广使用,民族文字的普及输入、国际信息的往来交流,都能产生持续的推动性作用。
(二)10×10键盘的制作要点。10×10键盘和北大的256键键盘、香港乐秀章236键键盘一样,是具有实现性的。它只是对现行的字母数字键盘加以改革,其改制要点如下(1)以“00.01-99”等100个编码数字键,取代原来主键盘的26个字母键和副键盘的10个数字键。实现一键输入两位数的方式是在控制键盘的单片机上,根据各个键的位置,规定每个键的序号(与键符一致),作为该键所对应的扫描码。(当击键时,单片机扫描到该键位送出它的扫描码到可编程110口,同时向主机发出键盘中断请求;主机响应该中断请求后,转9H中断处理程序;接收扫描码信息,并转为相应的ASCII码,再把输入字符的扫描码和ASCII码都存入键盘数据缓冲区;再转代码转换程序查找输入对照表获得内码,最后送入主机系统完成输入程序。)(2)大小锁定键的转换功能,由原来转换大小字母改为转换运算数字与编码数字;即“0.1-99”←→“00.01-99”。其运算数字与英文大小字母,可同(1)一样,规定在单片机上,由锁定键来转换它们。
(3)其余的键可照旧设置,但具同一作用有两个键的,可以考虑只设一个,以减少总键数和键盘面积。
(4)输入键的键面应有标志和触觉感,以便练习盲打。例如前九排略具凸形,每三排依次做成—=≡、|‖

、·∴等是。
(5)输入键的标志和布局如下图。


<p>三式

七、“发明”的可行生和实现方式九九分级制编码法与10×10键盘,在相互配合下的适用范围较为广泛,和北大的236键键盘及其输入方案、肖永水的3×10键盘及其输入方案,完全不同,不致有同样的结果。而且,正如《汉字信息处理》(电子科大本科生研究生教材)中所说“如何建立中西文兼容的信息处理系统呢?……共有三种类型第一种是在现有的西文计算机系统上增加中文信息处理功能,构成一个中西文兼容的信息处理系统。尽管这种系统还缺乏完备性,但它具备了建立系统的必要性、可能性和现实性,故被目前大多数汉字系统所采纳。
第二种是设计一种中文计算机系统并在其上增加西文处理能力以构成中西文兼容处理的系统。……第三种类型是重新设计一种计算机系统,使其软件系统和硬件系统都能满足世界各种语言文字处理的要求,这样的系统使各种文字字符集兼容处理,故更具必要性、完备性和可能性。1992年通过的ISO10646国际标准已为建立这类系统规定了编码标准,所以现实性上已进了一步。……第三类系统将随着ISO10646的贯彻而逐渐兴起,当全面采用这类系统时,可以不再提中西文兼容系统这一名词,因为那时的计算机系统本身就是多文种计算机。”
上文具体指明第一种系统具有“必要性、可能性和现实性”,为“目前大多数系统所采纳。”我们可在这类系统上,装配10×10键盘,利用软件的手段,实现九九分级制的普及型输入法,以满足目前普及应用市场的需求。
第三种系统“更具有必要性、完备性和可能性。”我们在这种系统逐渐形成的过程中,及时利用国际的技术资源和设备资源,让10×10键盘计算机逐渐升级。同时,凭借10×10键盘方便输入多文种的功能,准备并适时开发国内国际民族文字软件,争取较先或较好地完成多文种计算机的软件系统和硬件系统。
权利要求
1.九九分级制编码法,是可兼用于多文种多用途输入编码的数码法。其特征是(1)利用分级方式将长码分化为短码,从而分化数码的记忆强度。每级的短码限制在“99”以内,可以将编码逐级显示在屏幕上,因而输入时不要求记得编码。(2)级数和每级的序数可以随需增减,故能广泛应用于所有需要编码的领域。即凡能分出形素或音素,或有一定规律可循的文字;凡能分种分类、分纲分目、分条分款的事物,都可应用它来进行编码。(3)码元为00.01-99,与10×10键盘的键符代码一致,故键符代码对于码元(或字元),能“一代一”地进行输入,克服“一代多”或“多代一”所造成的缺点或问题。
2.形序分级编码法,是九九分级制编码法在汉字字形编码中的具体应用。它将汉字汉词分为单元、部首、单字、词语四级来进行编码。其特征是(1)它的汉字排序是按“形近相邻”的原则先集中形近字归部,再集中形近部首归单元。(2)它在数码中,能作为输入码并屏幕显码的编码空间较大,单字的理论编码空间是94×99×99=921799字。
3.音序分级编码法,是九九分级制编码法在汉字拼音输入中的具体应用,它将汉字汉词分为声母、韵母、单字、词语四级来进行编码,其特征是(1)以序号作声母和韵母的代码。(2)词语有屏幕显码,不需临时取码。
4.10×10键盘是一个数字键盘。其特征是(1)键符为00.01-99;百个键符代码,方便任意指代。(2)一键能输入两位数,具有提高数码输入效率的功能。
全文摘要
(一)九九分级制编码法,是计算机输入信息的一种数码法,可应用于多文种多用途的编码,并在输入时,不要求必须记忆编码。(二)九九分级制编码法将汉字汉词、按形体分为单元、部首、单字、词语等四级,叫形序分级编码法;按音节分为声母、韵母、单字、词语等四级,叫音序分级编码法。(三)10×10键盘创制方案,是与九九分级制编码法相适应、针对字母数字键盘的局限性及其流弊而设计的创意性改革方案。
文档编号G06F3/023GK1153943SQ9611755
公开日1997年7月9日 申请日期1996年5月15日 优先权日1996年5月15日
发明者田维和 申请人:田维和
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1