汉字部件数码的制作方法

文档序号:6559887阅读:485来源:国知局
专利名称:汉字部件数码的制作方法
技术领域
本发明属于汉字电脑键盘输入法,是申请号为94111115.6中国发明专利《汉字自然部件编码》技术方案的一个具体实施例案,是一个能用于排字、检字、打字、识字、代字,一形一码,没有重码的多功能汉字代码系统。
近两个世纪,西方拼音文化和科学技术东传,给汉字造成巨大冲击;电脑问世和应用范围扩展,对汉字提出了真正挑战。汉字编码键盘输入的解决,还只是技术上的一种应对,它要成为一种汉字文化,尚需从理论和技术两个方面升级!在理论上,客观地说,语言是人类个体间(社会)的一种行为,话音和文字是语言行为两种常用的传意获知工具。讲话,听话,思维与音节联系,写字,看书,思维与字形联系,对于使用汉字的人是一种无需争议的事实。不同声音是物质(如空气振动)的频态,话音是频态特征十分有限的频态符号,符号的自然单位是音节,不同色迹是物质(如墨汁分布)的形态,文字是形态特征十分丰富的形态符号,符号的自然单位是字(词)。这是话音和文字两者的本质属性。文字的单字(词)有笔画、部件、成字(词)三个层次。拼音文字的部件(字母)以话音和语法为依据,字母是音据部件和语据部件。人类话音只有几十个音素,几百个音节。例如英文只用二十六个字母表示音素。在编码研究者看来,如果把“用形态自身特征(静态可留存)直接表达和传递语义的形态符号定义为文字”,把“用频态自身特征(动态不留存)直接表达和传递语义的频态符号定义为话音”,并承认“词义”有看得见的“词形(态)”和听得觉的“词频(态)”两种形式(“物质外壳”);那么英文具有与原生频态符号音节一一对应的冗长结构(单词“造频”直接与思维联系,单词“造形”不直接与思维联系,“词形”使用时实际与思维直接联系),是一种次生符号,是看不见的“词频(态)”的一个代码系统(绝非有意贬低),英文是一种通代意义的文字,是一种间接功能的文字(这是西方学者把语言说成只有“语音外壳”的真正原因);英文单词词形中只有字母,它像用二十六种砖头砌成的一片铺地毯式平房建筑。汉字的部件也有两种一种部件造形由思维直接产生,叫意据部件,它们是象形指事会意字,是基本字或基本字的变形;一种是音据部件,它们是形声字中的象形指事会意字。两者都包括省略了部分笔画的字构件。基本汉字完全是“用形态自身特征直接表达、留存和传递语义的”,是一种原生符号;所以汉字是一种本原意义的文字,是一种真正的文字(绝非自夸自卖),是一种直接功能的文字。汉字字中有字又有字,它像以数百个基本字为基础的一座倒宝塔式楼房建筑。汉字相对于拼音文字,原生符号相对于次生符号,直接功能相对于间接功能,倒宝塔式楼房相对于铺地毯式平房,在节省符号材料,精简思维过程,理解速度极限等方面,无疑都具有优势;但要占据压倒优势,必须是你有的,我都有,你没有的,我独有,而且很中用。汉字在世界文字之林中独有一个本原意义的字形系统,但缺少一个通代意义的代码系统。汉字部件数码就是建立一套[与拼音代码(字母)——音节想象——表达意义相似的]拼形代码(附标数字)——字形想象——表达意义的代码系统。从后面的说明可以看到汉字部件数码排列的主码,相当于英文单词中的音据部件,补充的辅码相当于英文单词中的语据部件,同时它也是一种部件线性排列形式,从而实现了“你有的,我都有”的汉字理想。
在技术上,现在占据电脑键盘输入的汉字编码,都不能用四、五码无重码地编码数万汉字,即使是形码也不能在字形全部信息条件下直捷地表象数万汉字字形,汉字拆分与小学语文字形教学脱节,部件编码规则不够简单明了,单字编码按码元顺序排列,汉字不能按字形规律排列,严重地制约了汉字编码的使用朝年幼、普及和多用途方向的发展,创新的道路还只走出了第一步。
本发明的目的是具体实施申请人在此前提出的申请号为94111115.6发明专利《汉字自然部件编码》技术方案,使汉字部件数码成为汉字(形式)内容(字桥和字义)中与音桥(汉语拼音)相并列的形桥(汉字拼形),早日实现汉字的“一文两代”。
一 高起点筛选一套能直观地拼出《汉语大字典》中单字字形的部件《汉语大字典》有五万多单字,包括新字形、旧字形、繁体字、简化字、常用字、僻用字等。如果在一套部件中用四五个部件能拼出五万多汉字,这套部件就具有拼出汉字的代表性和实用性;如果部件中大多数是说文解字(下称《说文》)和近代字典部首,象形指事会意方法造出的基本字,以及基本常用字省略的字构件,这套部件就符合汉字的造字规律,具有合理性。部件数码按照这样两个标准拆分和筛选部件。
汉字拼形必须直观可逆。如果把“拼”看作是一个平面上的操作,“装”看作是一个空间中的操作,机器是一个空间体可以装,文字是一个平面体宜拼不宜装。“東”原是“日在木中”,如果把它拆分成“日、木”两个部件,返回去,不知是拼成“杲”,还是拼成“東”?“果”原是“果形在木之上”,如果把它也拆分成“日、木”,返回去,不知是拼成“杲”,还是装成“果”或“東”?为了保证拼形直观可逆,部件数码按下面的方法拆分部件1、部件相离,有据拆分。有据就是把字拆分为《说文》或字典部首,象形指事会意方法造出的基本字,以及基本常用字省略后的字构件。例如嚼[口、爫、罒、 、寸],部件全是字典部首;河[氵、可],部件是一个字典部首和一个《说文》部首;宙[宀,由],部件是一个字典部首和一个基本字;囊[ ],部件是“橐”省和“襄”省的字构件等。
2、部件相接,可以拆分(1)部件挨接(前部件末笔与后部件内笔十分接近或接触),笔画可以分开。例如孛[十、冖、子]中的 拆分为“十、冖”两个字典部首,卓[、曰、十]拆分成三个字典部首。
(2)部件连接(前部件末笔与后部件首笔连成一笔),笔画可以切断。丈[十、入]根据《说文》解释的“从又持十”拆分为两个字典部首。
(3)部件榫接(前部件末笔与后部件内笔连成一笔),笔画可以切断。果[田、木]根据《说文》解释的“果形在木之上”拆分为两个字典部首,董[艹、千、里]拆分为两个字典部首和一个基本字。
3、部件相叠,笔画相交,不予拆分。東[日、木]部件相叠,作为《说文》部首不拆,书的笔画相交,作为“基本字”(常用字)不拆。
二把部件处理为首画、首画特征、整体部件三个层次汉字自然部件编码在理论上和实际设计中,已把汉字处理为笔画、部件、成字三个层次,汉字部件数码进而把部件处理为首画、首画特征、整体部件三个层次。
部件首画根据运笔方向分为单向笔画和多向(折)笔画。单向笔画的排列以数学中的平面坐标为依据X轴的正向为横,Y轴的负向为竖;第一象限内的射线为提,第三象限内的射线为撇,包括撇点,第四象限内的射线为捺,包括(捺)点。因此,汉字部件首画的顺序为横竖撇点折。汉字中部件的首画没有提和捺。其中折又分为横折、竖折和撇折。
首画特征以部件书写第一笔与继续书写各笔之间的相对关系为依据,分为离接交三种形式。例如示、彳的首画特征是离,工、牛的首画特征是接,木、犭的首画特征是交。大多数部件的首画特征是不很单纯的。例如雨、片的首画特征是顺序性相离的,即部件书写的第一笔与继续书写的第一笔相离,而雨继续书写的第三笔,片继续书写的第二笔并不相离。因为部件按首画特征在《汉字部件代码表》(

图1)中分成主码组,还要考虑部件数量的多少;所以部件按首画特征分类是相对的,有特例的,是为记忆提供方便的。汉字部件按首画特征具体的分组请参看图1。
三 把部件代码设计成数字、附标数字、复合数字三个层次汉字自然部件编码设计的部件代码已经有了数字、附标数字、复合数字三个层次。汉字部件数码只是在《汉字部件代码表》中对部件的分布,亦是部件与代码的对应中,特别应用了数字这一层次,详见图1《汉字部件代码表》中部件的分布规律,以及从图1中简化出来的图2《部件首画特征表》的分项说明。
四 把部件与代码按三个层次对应起来汉字自然部件编码方案中的《族部表》,对整体部件与复合数字代码的对应,在单字编码中作了充分的应用。汉字部件数码的《汉字部件代码表》,通过部件的筛选和改变分布,在首画对数字,首画特征对附标数字符号(主码)两个层次上,作了最有利于记忆的应用。
首画对数字首画为横的部件用一、二代表,例如“示”(首画横,续笔离)用“一”代表,“木”(首画横,续笔交)用“二”代表,一、二分别叫示与木的首画数字。首画为竖的部件用三、四代表,首画为撇的部件用五、六代表,首画为点的部件用七代表,首画为折的部件用八、九代表,其中横折用八代表。其他不一一说明,请参看图2《部件首画特征表》。
首画特征对附标数字符号首画为横,续笔相离,例如“示、酉”等用“1”代表;首画为横,续笔为竖笔相接,例如“正、比”等用 代表;首画为横,续笔为撇笔相接,例如“厂、牙”等用 代表;首画为横,续笔与首画只有一画相交称作“横单交”,例如“木、戈、龙”等,分别用“2、 ”代表;首画为横,续笔与首画有二画以上相交称作横多交,例如“艹、世”等用 代表。其他不一一说明,请先看图2《部件首画特征表》,再看图1《汉字部件代码表》。首画特征属于“横交”的部件很多,横折以外的部件很少,因此部件首画数字为二的部件安排了四个主码,而部件首画数字为九的非横折首画部件只安排了二个主码。
从图1和图2中可知,部件代码对应部件首画的是数字,对应部件首画特征的是附标数字,对应整体部件的是复合附标数字。附标数字可拆分为数字和附标,复合附标数字可拆分为主码和辅码,部件首画数字歌“横起一二竖三四,撇始五六点在七,八九折画都易记,别忘续笔接交离。”可以对前两个层次的对应助记和提示。
五 用最简单的规则按部件书写顺序编码汉字汉字部件数码和汉字自然部件编码一样,单字编码的规则是排列主码,补充辅码。排列主码是绝对的,补充辅码是灵活的;排列主码,编码绝对地按数字大小和附标先后排序,汉字字形便和字典正文中的字头一样,自然地按首画与首画特征排列,编码成为字序;编码相对地按数字大小和附标先后排序,汉字可与字典中的《检字表》一样,先按首部件,再按首画顺序与首画特征排列。汉字部件主码序列相当于英文的音素字母序列(音据部件);补充辅码,编码偶尔出现重码时,可以选择另外的辅码消除重码。补充的辅码相当于英文的语据部件。排列主码,补充辅码的具体方法如图3《单字编码规则表》所示Y代表部件主码,Y1代表第一个部件主码,X代表部件辅码,X1代表第一个部件辅码。补充辅码,对于简化字,取第一个简化部件,用X简表示,它不一定是字的第一个部件。补充第一个部件的辅码有重码时,补充第二或第三个部件的辅码,用X′表示。补充第二或第三个部件的辅码是极少的,如图6中检字表(码本)所示。部件超过五个的字,取前面五个部件的主码按序排列,并在编码右上角记上小圈表示是超部件字。因为单字编码已有五码,这种超部件字不会有重码。这种超部件字数量很少,如图6中的检字表(码本)所示。
对于部件重复字,如“从重中 ”的“串”,“从并木[22]”的林,在部件主代码上加“·”,串记作 ,林记作 。一个点表示部件重复一次,两个点表示部件重复两次,如森记作 。某些部件相并也是字,相重也是字,如棘、棗;并是横排,添加“横”的首画数字“2”,重是竖排,添加“竖”的首画数字“3”,棘记作 ,棗记作 但“叭”与“只”的两个八字部件本身有辅码的区别,不属于此种情况。
汉字部件数码对汉字形系统有四种分法①按字的形体结构分为独体字和合体字。例如日、木是独体字,棟是合体字。
②按字的造形层次分为基本字和次生字。例如日、木是基本字,東是一次次生字,棟是二次次生字。
③按字的代码形式分为主码字、部件字、编码字。例如中 是主码字(表眉字),日[46]是部件字(表内字),部 是编码字(表外字)。主码字也可以当作部件,但在《汉字部件代码表》(表眉)中用括号括起来了,表示二三五六七八九都不能充当率字部件(字的第一个部件),但可以充当续笔部件进行编码,例如旭[64962],率字部件是九[6,9],不是九[9,0];语 续笔部件五[5,0]。
④按字的代码码元数量分为一码字、二码字、四五码字。其中三码字只有数对,其他三码都用于词组缩码。例如本 是一码字,丰 是二码字,棘 是三码字,件 是四码字,输 是五码字。
六 用两种电脑键盘输入汉字部件数码现在电脑键盘有双手操作的桌面式(打字)键盘和单手操作的手持式(数字)键盘。用双手操作的键盘,键位手指分工同常,附标数字当作一个整体,在打字键区取二十六个字母键和两个符号键,按数字序和附标序进行排列,如图4所示。用单手操作的键盘,附标数字依然当作一个整体,也要操练指法,拇指管附标键,称作附标指,食指和中指管与附标键靠近的数字键,无名指与小指管离附标键较远的数字键,与拇指相对的四指合称为数字指。附标指与数字指两指结合并击,进行附标数字整体输入。键位布置(右手型)如图5所示。
七 本发明的优越性能1、汉字部件数码是一种准数字汉字编码,作为电脑键盘输入技术,它既可用字母键盘输入,又可用数字键盘输入;它的单字码不超过五码,能编码数万汉字,绝对没有重码,编码成为字序(字的有理编号),从而为编制大型字库字典提供了一种准确快捷检索的工具。
2、代码使用附标数字(四声数字符号),符合汉语话音习惯,字序是与二进制数并行的一种二序制数,它将为十多位数字的各种编码(如电话号码)开创一个“长途知返”的先例。
3、汉字部件数码的编码规则简单明了,部件拆分与代码符合汉字造字规律和小学语文字形教学,容易掌握,易于推广和普及。汉字部件数码和通代意义文字相当,作为汉字的形桥,可广泛应用于通讯、信息、管理、网络、教学等各个领域。
八、附图清单①汉字部件代码表;②部件首画特征表③单字编码规则表;④桌面式(打字)键盘附标数字键位图;⑤手持式(数字)键盘附标数字键位图;⑥部件数码字典图首部表和检字表(码本)。
权利要求
1.一种汉字部件数码电脑键盘输入法,是申请号为94111115.6中国发明专利汉字自然部件编码的实施例案;它与汉字自然部件编码一样,先把汉字拆分成包括部首、基本字、字省略构件等能拼出字形全部信息的自然部件,并用1-9加上三种区别标志形成的附标数字符号与自然部件在一个具有直角坐标性质的二维表格中对应,自然部件具有由主码和辅码构成的唯一的复代码,部件与代码两者之间有一种可逆的对应关系;再依据字的部件书写顺序排列主码补充辅码的规则,形成没有重码的汉字编码,用于电脑键盘输入;本发明的特征是,先按首画横一二,竖三四,撇五六,点七,折八九代表自然部件,每个自然部件有一个首画数字,再把首画相同的自然部件按续笔离接交区别的首画特征分组,用相应的首画数字产生的附标数字符号在《汉字部件代码表》中代表这些部件组,形成自然部件主码;部件的首画、首画特征、整体部件与代码的数字、附标数字、复合数字分层次对应;汉字按部件编码后没有重码;码本中的编码绝对地按数字大小和附标先后排序,汉字便和字典正文的字头一样自然地按部件首画顺序与首画特征排列,编码成为字序;码本中的编码相对地按数字大小和附标先后排序,汉字可与字典中的《检字表》一样,先按首部件,再按首画顺序与首画特征排列;附标数字符号可以在双手操作的桌面式(打字)键盘上输入,又可在单手操作的手持式(数字)键盘上输入。
2.根据权利要求1所述的汉字部件数码电脑键盘输入法,其特征是,汉字部件的拆分方法部件相离,有据拆分,部件挨接,笔画可以分开,部件连接或榫接,笔画可切断,部件相叠或笔画相交,不予拆分,拆分后的部件是部首,基本字和字省略构件。
3.根据权利要求1所述的汉字部件数码电脑键盘输入法,其特征是,部件被处理为首画、首画特征、整体部件三个层次,代码被设计成数字、附标数字、复合数字三个层次。部件与代码分别按各自的三个层次对应;部件代码对应部件首画的是数字,对应部件首画特征的是附标数字,对应整体部件的是复合附标数字;附标数字可拆分为数字和附标,复合附标数字可拆分为主码和辅码。
4.根据权利要求1所述的汉字部件数码电脑键盘输入法,其特征是汉字按部件编码的规则是排列主码,补充辅码。排列主码,编码按数字大小和附标先后排序,字形按首画和首画特征排序;补充辅码,编码偶尔出现重码,选择其他辅码消除重码。
全文摘要
一种汉字部件数码电脑键盘输入法,是申请号为94111115.6中国发明专利汉字自然部件编码的实施例案。所述汉字部件数码,把汉字处理为笔画、部件、成字三个层次,把部件处理为首画、首画特征、整体部件三个层次,把代码设计成数字、附标数字、复合数字三个层次,部件与代码在直角坐标式表格中对应形成部件代码,按部件书写顺序排列主码补充辅码规则进行汉字编码,形成一套可用字母和数字两种键盘输入的,能用于排字、检字、打字、识字、代字没有重码的汉字部件数码。
文档编号G06F3/023GK1337613SQ0112225
公开日2002年2月27日 申请日期2001年6月25日 优先权日2001年6月25日
发明者曹述交 申请人:曹述交
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1