新汉字码及其汉字输入键盘的制作方法

文档序号:6603749阅读:449来源:国知局
专利名称:新汉字码及其汉字输入键盘的制作方法
技术领域
本发明属计算机技术领域,特别是一种新汉字码及其汉字输入键盘。
计算机在我国的生产生活中,已经得到广泛应用。汉字的计算机输入问题,得到各方面的关注,并取得很大进展。其中尤以王永民的“优化五笔字型编码法”和拼音输入法应用普遍。但是它们在实践过程中存在很大缺点。以五笔字型为例。首先它的编码方案只是一种汉字编码,不能被看成是另一种文字形式;其次,学习难度大,因为它是对字形的拆分后,重新定议再组合,很大程度是人为规定,不符合中国的汉语文化的普遍心理,在操作熟练后,经常出现只记得汉字的五种笔划或字根拼形,忘记了原字的形式和意义。特别是小学教育过程中,它破坏了对字词的整体联想和对传统文化习惯的培养。再次,它的编码只有在直接转换为汉字后才容易被人识别,不能实现识别与修改编码,同时因为它存在前一字的未字根和后一字的前字根可能是另一个字的完整字根,计算机本身无法识别其线,因此不能实现全篇的编码与汉字转换。又次,五笔字型的字母,码形不同于英文的写法,现行的各种英文电子显示,处理储存等装置包括其各项功能很难直接应用五笔字型。
适应于计算机普及的编码方法,必须符合普遍性、文字性,在维持汉字自然状况的基础上,尽量少人为规则,并能与现行各种英文电子显示,处理,储存等装置及其功能相适合应用。
新汉字码及其汉字输入键盘正是基于以上目的,对《新华字典》(1993年第8版)上的汉字的8292个进行了统计和归纳,设计了这一种新汉字码。
该种新汉字码及其汉字输入键盘,是将不少于26个键位的键盘分成两个区可称为左区和右区,每个区包括十二个形声字母和一个介音字母;将23个汉字发音的首字母与键盘上其中的23个字母键位形成对应;十二本韵母归入对应的十二个形声字母中,同时优选的十二个汉字意类型即形旁归入对应的十二个形声字母中,左右区字母在代表韵母的形旁时,每半内各不相同,但左右对称的字母含意相同;形成拼形声组字的汉字偏码法及其输入键盘。
与现行汉字编码法及其输入键盘相比,本发明具有符合普遍性、字字性、在维特汉字自然状况的基础上,尽量少人为规则,并能与现行各种英文电子显示,处理储存等装置及功能相适用等显著优点。
新汉字码包含二个要素它是以汉字的字意、字音为编码依据。一个完整的新汉字码包含代表字意类型的表意成份和代表字音的表音成份两个部分,某些字码可省去一个成份、一个成份内部有多个组成部分时亦可省去中间的某些。因为汉字的大多数为“形声字”,也包含了表意成份和表音成份两个部分,并分别称为“形旁”和“声旁”。所以按此联系,新汉字码的表意成份我亦称为“形旁”,表音成份我亦称为“声旁”。
新汉字码的声旁应以声母和韵母相拼来构成为最好,形旁的划分应建立在现代科学的基础上。
基本字母就选取拉丁字母的26个,包括大小写,此外为将新汉字码写成方形码还增加了苦干新字母。下面说明中“字母”皆是指基本字母。由新汉字码的结构确定,26个字母数非常恰当,为拉丁字母便与国际最通用的文字符号相通。当然,新汉字码可有自己的专用字母。键盘和字母的内容新汉字码完全可以使用现有的计算机英文通用键盘,但这种键盘上的字母排布——字母盘面(通用键盘的就简称为“通用盘面”)是不利于新汉字码的,为此设计了一个不同的专用于新汉字码的字母盘面——“专用盘面”。新汉字码也可以不使用通用键盘而另行设计,但如果用,则专用盘面可以和通用盘面一起标于通用键盘的按键上,通过“功能转换”可以从通用盘面转换至专用盘面,反之亦然。两种盘面都能既用于新汉字码又用于新汉字码又用于英文及其他拉丁字母的使用(某种盘面中,某个字母,例如“L”不论在新汉字码中还是在英文及其他拉丁字母的使用中都同为该字母、),但对以汉语为主要工作语言而以新汉字码输入汉字、或直接应用新汉字码为汉语文字的人来说应使用专用盘。该键盘应不少于26个键位当然,其在使用专用盘面后,其在应用英文及其他拉丁字母的使用时也一率使用该盘面,一起标示于通用键盘上的两种盘面如下
其中按键左上角的字母或其他符号为通用盘面的,右下角的为专用盘面的,为清楚起见,特抽出专用盘面的字母并改写为小写字母如下q g b lw n z ai t d j yv o x e uk p f hm r c s字母i、u称为“介音字母”,仅用做声旁中的介音,不做任何其他用法。i、u、iu分别是汉语拼音中的介音i、u、 ü。
其他字母称为“形声字母”,分左、右两半,每半十二个,视其位置和形状,左半字母称为“左字母”或“阳形字母”;右半字母称为“右字母”或“阴形字母”。左右两半字母做声母时各不相同,做韵母、形旁时,每半内各不相同,
其中按键左上角的字母或其他符号为通用盘面的,右下角的为专用盘面的,为清楚起见,特抽出专用盘面的字母并改写为小写字母如下q g b lw n z ai t d j yv o x e uk p f hm r c s字母i、u称为“介音字母”,仅用做声旁中的介音,不做任何其他用法。i、u、iu分别是汉语拼音中的介音i、u、 ü。
其他字母称为“形声字母”,分左、右两半,每半十二个,视其位置和形状,左半字母称为“左字母”或“阳形字母”;右半字母称为“右字母”或“阴形字母”。左右两半字母做声母时各不相同,做韵母、形旁时,每半内各不相同,表中合韵项中加括号者为拼法形式有差别的韵母,括号内为汉语拼音的原型,另“ueng”汉语拼音中也有此型。“其他”项中,“—”后为新汉字码的拼音写法(声旁)。在新汉字码中,为求字码简单,j、q、x、y等声母与韵母相拼时皆省掉介音“i”,如jia—ja,jiu—ju(为新汉字码写法)。因省掉了介音“i”,所以表中三个韵母“üan,üen,üeng”在字码中形式上并不存在,它们都简化成“uan,uen,ueng”的形式了。(注在汉语拼音中“零声母”无形式,而在新汉字码中有形式,有专门的字母来代表)左字母代表的本韵母以对应的汉语拼音形式说明按字母键盘位置写出如下,右字母与此完全对称对应aengenangean i uai ou eiao一个复合韵母是由两个或三个基本字母组成,不利于字码写成方形,为此在拉丁字母的基础上设计了一些新字母——“合韵字母”,一个合韵字母就代表一个合韵,合韵字母如下
IUT
IUE
举例“IX”的合韵字母为“X”。四个字码LIX、BLIX、BLLIX、BLFLIX,写成的含合韵字母的方形码分别为
。合韵字母也可用于其他以大写字母写成的码形。
左字母代表的形旁按字母键盘位置写出如下,右字母与此完全对称对应生理行为意象运动形描质描性质概念生物社物事人自然字码结构线形字码的结构可用下式表示形旁 声旁 →形旁 声母 韵母 →形旁 中介1 中介2 声母 i u 本韵方形字码的结构可根据文中有关具体字码例子简单看出,此不再述。
中介字母在不考虑汉字的繁体字、异体字时最多需要两个,考虑时则三个(对应八千简化汉字),说明中按两个,中介字母合并于形旁,需特加区别时,原形旁称为“基本形旁”。中介字母1在部分形旁中能与基本形旁相结合,将形旁内容分得更具体,这样的形旁称为“特征形旁”,相应的中介字母1称为“特征字母”。特征形旁举例“K、P”为基本形旁,“q”做中介字母,则特征形旁“kp”代表“生物中的虫类”,“pq”代表“社物中的器具”。
一个新汉字码最多可有七个字母(从结构上看,实际为六个),其中声母和本韵是必须有的,其他可没有。
新汉字码按形旁字母数目分,形旁有几个字母就称“几级字码”,可有“零级字码”(无形旁)、“一级字码”、“二级字码”、“三级字码”等,比较而言,“数”大的称为“高级字码”,“数”小的称为“低级字码”。含形旁字码,即一、二、三级字码又称为“形旁字码”。
在组成字码时,如果声母为左字母,则形旁包括其中介字母也一率用左字母,而本韵则用右字母,这种字码称为“阳形字码”或“左体字码”如果声母为右字母,则形旁包括其中介字母也一率用右字母,而本韵则用左字母,这种字码称为“阴形字码”或“右体字码”。从这种结构可看出,新汉字码的字母组合方式非常有特点,我称之为“前异组合”,以区别于一般无字母选择性的“任意组合”。
前异组合型的新汉字码与任意组合型的新汉字码(这里指非等长码)在计算机输入中的区别在于,前者能在输入一个字码前不加选择键,或在输入一个字码后不加间隔键而仅根据字码的前后字母类型差异直接判断出该字码所属的全部字母,或输入特定码形的字码(如方形码、异写码等、对大、小写码无需分离出单个字码来,对任意组合型的也可不加选择键、或间隔键。但对任意组合型的若不加这两种键之一分离出单个字码来,则在做全篇转换时,因大、小写码中很多字码是连成词的,因此计算机不能直接从多字码词中分离了单个字码来,而不能有效地完成全篇转换,若有效转换,得要在输入时加这两种键之一、或转换前专门人工区分,或借助软件分离出单个字码来,不过借助软件可能不能完全准确分离、而还需转换后进一步人工区分)、或转换成汉字,而后者则需要加选择键、或间隔键(不是全部,对选定特定码长的字码例外;对大、小写码的输入可不加)。同理,在新汉字码到汉字的全篇转换中、和写成文的新汉字码的各种码形的相互转换中,若原码形为大、小写码,则前异组合型的因能根据字码的前后字母类型差异从多字码词中分离出单个字码来而有效地、准确地完成转换,而任意组合型的要准确转换成线形码时都无法断定词间空格除非输入时输入不于码形中显示、而于计算机内部记下的空格,或转换前专门分出空格。
字母的键盘位置和内容的确定原则各个字母在计算机键盘上的位置和所代表的形旁、声旁方面的内容的确定原则,从新汉字码的计算机快速输入方面考虑为频度原则,即要使使用频度高的字母安排在键盘上易于被手指敲击的键位上,从新汉字码的文字规则和文字使用方面考虑为形位原则,即要考虑字母的形状,位置和内容之间在人的感觉里的联系。
新汉字码制定举例假定为下面字音的同音字仅有九个主 株 竹 蛛蛀 猪 贮 助 祝其字码制定过程如下1、确定声旁、声旁为“VY”、“V”为声母,“Y”为韵母,因为声母为右字母,所以韵母为左字母,形旁包括其中介字母也都将为右字母。
2、确定零级字码,零级字码选“主”、为“VY”。该字码最常用且字意也合适。
3、确定形旁字码的形旁,“主”除外,各字码分属两个形旁。
①自然形旁字码株、竹、蛛、蛀、猪,自然形旁为名词类形旁,下分各特征组。
基本形旁字码选“猪”、其形旁为“S”虽然统计上“株”最常用,但认为选“猪”更好,因为“猪”在人的感觉里更常用,且这样做各字码的码形总的说来让人觉得更合适。
“蛛、蛀”为“虫类”,虫组的特征形旁为“sa”,两个字码中只能有一个取基本的特征形旁“sa”,另外一个则只能取含中介字母的特征形旁例如“sae,saz...等”。取“sa”为“蛛”形旁,“sae”为“蛀”形旁。
“株、竹”同属“木组”,本组的特征形旁有两个sv、so。取“sv”“竹”形旁,“so”为“株”形旁。
②意象形旁字码贮、助、祝。基本形旁为“n”,含中介字母的形旁有“no、nr、nw、nv...等”。取“n”为“助”形旁,“no”为“贮”形旁,“nr”为“祝”形旁。
4、各字字码写出如下1.主 vy 4.蛀 saevy7.助 nvy2.猪 svy5.竹 svvy 8.贮 novy
3.蛛 savy6.株 sovy9.祝 nrvy2.形旁形旁分三大类,每大类四个、共十二个形旁,在其中“名词”类,中介字母可与基本形旁根结合将形旁细分,其各形旁下又各分若干组,即各类特征形旁。
(一)名词类1、生物包括动物、植物、微生物等一切实际存在的及传说、虚构的生物的一切物质方面的内容,即生物的物种、种类、组织器官、代谢排泄产物、疾病等。下分鸟、兽、鱼、虫、草本、木本、疾病、器官等八组。关于疾病组,有少数疾病用字,如“腐、哑”等字列在了生理形旁。(各形旁各组具体内容不再述,基本与其组各相应,多少或有差异,例如,鸟组就只包括鸟类,鱼组除包括鱼类外,还包括两栖类、爬行类动物)具体字例鸟鸡、鸽、雀、凤兽狗、虎、兽、骏鱼鲤、蛙、蛇、鱼虫蝗、蚓、虾、蛊草麦、莲、菇、叶木木、桃、李、枝疾疾、伤、疤、癌器肝、脸、翅、汗2、自然包括自然界的各种自然物质和自然现象,人工的基本物质和材料,有机、无机的化学物质,化学元素等,下分自然物质、有机、无机、元素等四组。
具体字例。
质星、海、陆、岛;昼、夜、春、雪;火、声、光、影;石、玉、泥、液;瓷、玻、漆、剂有苯、烃、醛无氨、矾元碘、铁、氕3、社物指社会物质,是由人生产、加工、制造的用于人的日常生活和社会生活的各种人工物质,如工具、用具、房屋、道路、衣物、食品等等。下分器具、住筑、衣、食等四组。
具体字例具碗、桌、灯、琴、剑、车筑房、道、堤、田、门、砖衣衣、裤、褥、布食粮、菜、酱、糕4、事人指社会事物和社会人类,社会事物指存在于社会中,包含一定社会含义、一般有突物可指的社会存在,语言文学方面的内容也包括在社会事物中,社会人类指由社会关系,血缘关系所确定的人的社会属性,宗教,神话中的“人”和人称代词也包括在社会人类中,姓氏、民族名、地名等也包括在事人形旁中,下分事物、人类、姓氏、地名等四组、关于地名组,有些单独无释意(于一般字词典查取时)而仅包含于地名词组中的字,根据词组中其他字的字意可不归属事人形旁或地名组,例如“岢岚”取“岚”(字意雾气)的自然形旁;“木山”中“ ”“取生物形旁中的木本组”;“黄埔”中“埔”取自然形旁,具体字例事城、校、县、军、税、钱、语、词人父、母、师、徒、敌、友、官、奴鬼、神、她、男姓刘、赵、韩、羌、地汉、淮、浙、闽名词类形旁各特征组的特征字母其左字母以按字母键盘位置写出组名代表字说明如下,右字母与此完全对称对应虫兽鱼 鸟质 质 质 质草草木 木有 有 有 无生物 疾器 器元 元 元 自然具具具 具姓 地 事 人筑筑筑 筑姓 地 事 人具社物 衣 食姓 地 事人人(二)形容词类分两类,I,物质描述,II,概念性质I.物质描述是对客观物质、物体的描述、说明。分“形描”和“质描”两个形旁。
“形描”描述的是物体的“形”,包括物体的形体、大小、方向、位置、距离等方面,数词、表现物体形体的量词、与“形”相关的计量单位如长度、面积、体积等也在其中。
“质描”描述的是物质的“质”,包括物质的质地、颜色、光声、味、速度、时间、次序等方面,与“质”相关的计量单位如重量也在其中,干支为次序,所以干支也在“质描”中。
具体字例厚、薄、粗、细、巨、微、远、近、广、狭顶、底、陡、斜、崇、低、左、右、东、西线、圆、格、尖、粉、块、段、页、件、串壳、弧、痕、隅、楼、隙、纹、直、曲、整零、九、半、孤、幅、步、尺、寸6.质描具体字例轻、重、虚、实、稀、浓、清、浊、韧、坚利、钝、鲜、幼、丰、罕、香、臭、甜、咸迅、慢、暂、久、寂、烈、茂、荣、寒、炽明、暗、辉、华、绿、紫、轰、哇甲、酉、昨、今、寿、龄、吨、斤II.概念性质指抽象概念和描象性质,是对抽象事物,事情的概括、说明分“概念”和“性质”两个形旁。
概念形旁说明的是事物的名称概念,指的是某一事物。一般为名词词性,非人称代词也包括在概念形旁中。
性质形旁说明的是事物的性质,是说明事物的,很多为形容词词性,助词、介词、连词、副词、叹词等虚词也包括在性质形旁中。
7.概念具体字例科、徽、理、法、题、义、景、期、功、信部、俗、材、序、型、职、志、政、事、物何、它、另、此、谁8.性质具体字例善、恶、美、丑、诚、伪、福、凶、责、贱第、纯、共、简、错、逆、勤、敢、预、终以、由、与、倘、甚、再、啦、吧、唉、啊(三)动词类9.生理说明的是生命物质的生理活动、躯体活动,包括坐、行、吃、睡、生、老、觉、言语等等各方面,但一般手的动作不在其中,它归于“行为”中。
具体字例活、死、肓、觉、睡、梦、痛、康、倦、熟吃、笑、坐、跑、吼、唱、饥、馋、醉、晕观、望、说、叙、嘱、问、瘸、肿、哑、痊10.运动说明的是物质、物体的运动和联系具体字例
转、飘、摇、矗、倒、震、裂、进、涌、止响、照、烧、沸、溶、聚、酵、腐、罕、涝隔、合、缠、蔽、傍、距、续、绝、通、达11.行为包括人的动作为(可以以手来完成的动作一般皆在内)、生活行为、社会行为、行为形旁的特征是其“行为”为一可描述或可想象的具体过程、或具体事情。
具体字例刻、佩、放、投、堵、引、击、按、搬、拿垦、留、送、煮、医、抢、逐、哺、写、制居、婚、赠、拜、遇、偷、逃、卜、买、玩12.意象指抽象动词和意识动词,抽象动词是指内容抽象、不表现为具体过程的动词。意识动词是人的思维意识,感情情绪、及带有意识倾向(对抗或互助等)等方面的动词。
具体字例得、使、治、劳、缺、加、储、耗、换、似助、阻、争、卫、逼、诱、讽、躲、慎、敬需、择、思、识、喜、哀、恋、恨、急、惊3.字码制定规则字码制定规则包括新汉字码在具体制定时所遵循的三个原则、三个规则、中介字母、特征字母的选取基本次序,繁体字、异体字、按与异体字等同看待的同音、同意或同字意类型的很不常用字等汉字对应的新汉字码的制定规则。除此之外,这第内容中还包括新汉字码的排序规则,下面仅介绍其中的三个原则,三个规则,其他因不根本、不紧要,此处略。
三个原则是1、常用字码优先、指常用字码优先选用字母数较少的字母组合组成字码。
2、以形达意、指考虑字码的“形”(码形)和“意”(字意)在人的感觉里的联系。
3、以良性字码为低级字码,指以意义比较良好的字码做低级字码。例如,以“怀、额”做零级字码,而不以“坏、恶”做零级字码。这一原则主要体现在零级字码的制定中。
三个规则是
1、形旁特征化。指在名词类形旁中,对非常用字码选取特征形旁组成字码,而不管一级字码是否空缺,另还有一些带中介字母的形旁也具有特征化的特点,但不严格,例如“hb”常表“自然物质”中的玉、石等;“天干”如果是二级字码,则一率用“dp、xc”组成字码,等等。
2、双音单纯词形旁对等。指由两个字码组成的单纯词,其名字码的形旁相同或对称,即对等,例如“葡萄”的新汉字码为“kypvkytc”,“珊瑚”的新汉字码为“mnodhbhv”。
3、回避规则,有几条,其中最基本的一条是陈字码为零、一级的汉字的“繁异体字”的字码外,其他各字码中形旁各字母相互回避,意思是,形旁中基本形旁,各个中介字母的字母互不重复,一个字母在形旁中只能被用一次。基本形旁和中介字母,中介字母和中介字母相互回避,意思是,中介字母不用基本形旁的字母,第二个中介字母不用第一个中介字母的字母。
权利要求
1.一种新汉字码及其汉字输入键盘,其特征是将不少于26个键位的键盘分成两个区可称为左区和右区,每个区包括十二个形声字母和一个介音字母;将23个汉字发音的首字母与键盘上其中的23个字母键位形成对应;十二本韵母归入对应的十二个形声字母中,同时优选的十二个汉字意类型即形旁归入对应的十二个形声字母中,左右区字母在代表韵母形旁时,每半内各不相同,但左右对称的字母含意相同;形成拼形声组字的汉字偏码法及其输入键盘。
2.如权利要求1所述的新汉字码及其汉字输入键盘,其特征是左区q g b l t d j y k p f h和介音i;右区是w n z a x e u m r c s和介音u。
3.如权利要求1所述的新汉字码及其汉字输入键盘,其特征是拼形声组字的线形码结构为形旁声旁—>形旁声母韵母—>形旁中介1中介2声母介音本韵。
4.如权利要求1、2、3所述一种新汉字码及其汉字输入键盘,其特征是12个本韵母a eng en ang e an i u aiou ei ao与左右区的形声字母形成对应,对应顺序是左区q g b l t d j y k p f h右区w n z a v o x e u m r cs;本韵加音后形成合韵,合韵的音意如下表本韵a e ai ei ao ou an en ang eng i u介音i ia ie iao iou ian ien iang ieng iu(ü)u ua ue ua ue uan uen uang uengü üeüan uen ueng其他ei,er—>af;yo,yue—>yue;o,wo—>wt;e,hm,hag,m,n,ng等另与其他韵母合并。
5.如权利要求1、2、3所述一种新汉字码及其汉字输入键盘,其特征在于形旁包含了生理、行为、意象、运动、形描、质描、性质、概念、生物、社物、事人、自然;复合形旁的取码规则是形旁的进一步特征化,分成一“二、三”级字码。
6.如权利要求1、2、3所述一种新汉字码及其汉字输入键盘,其特征是汉字在取码如果声母为左区字母,则形旁包括中介字母如章用左区字母,而本韵则用右区字母;反之则本韵用左区字母。
7.如权利要求1、2、3和4、5、6所述的一种新汉字码及其输入键盘,其特征是重码时加入声校,最常用的汉字显示在提示行的最前边。
全文摘要
本发明为计算机应用技术领域提供了一种新汉字码及其汉字输入键盘,它的主要特点是将不少于26个键位的键盘分成分别由12个形声字母中,形成拼形声组字的汉字编码法及其输入键盘。与现行汉字编码法及其输入键盘相比,本发明具有符合普遍性、字字性、在维特汉字自然状况的基础上,尽量少人为规则,并能与现行各种英文电子显示,处理储存等装置及其功能相适用等显著优点。
文档编号G06F3/023GK1194393SQ9710119
公开日1998年9月30日 申请日期1997年3月20日 优先权日1997年3月20日
发明者杨亚飞 申请人:杨亚飞
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1