一种新型字典及与之匹配的查字打字同码方案的制作方法

文档序号:2612132阅读:430来源:国知局
专利名称:一种新型字典及与之匹配的查字打字同码方案的制作方法
技术领域
本发明涉及一种新型字典(包括纸质字典和电子字典)及与之匹配的查 字打字同码方案,属字典编撰技术。二、 背景技术目前字典编撰方面存在如下缺陷1、字典内容上单一,基本上全是字词 的释义,虽有附录,也不过是诸如"元素周期表"、"汉语拼音方案"、"中国 历代纪元表"、"常用标点符号用法简表"、"计量单位表" 一类的内容,字典 的内容不能反映汉字系统的概貌,大量的关于语言文字的基础知识在字典中 査不到,需要在其他工具书中查找,也不便于利用字典自学汉字。2、査字速 度慢。笔者在査字时深感目前通用的各种查字法既有优点又有缺点。如,音 序查字法的优点是查认识的字可直接翻页,查字速度比部首查字法快;缺点 是不知声调的字难査,不认识的字没法查,把多音字分列两处不方便查阅。 部首査字法的优点是能査不认识的字,缺点是速度慢且有时数不准笔画。3、 纸质字典成稿付印或电子字典完稿后,内容就无法更改,不能满足使用者的 特殊需求。另外,从目前对电脑及手机输入汉汉字录入研究的角度看,使用电脑及 手机过程中,输入汉字和电子字典査字未融合在一起,笔者认为,纸质字典、 电子字典、电脑及手机打字三者本来相通,完全可以用同一种编码方案,让 打字程序既具有输入汉字功能又具有查字学字功能,浏览网页和打字时遇到 生字新词,用打字程序就可查字,不必再另启用查字程序。三、 发明内容基于上述认识,以及为了改进已有技术存在的缺陷,本发明提供了一种 新型字典(包括纸质字典和电子字典)及与之匹配的査字打字同码方案,设 计一种部首音形结合码査字打字法,其基本思路是(1) 将汉字査字法与电脑及手机汉字输入用同一种编码方案,会査字就 会打字,会打字就会査字,消除目前各种纯音码汉字输入方案不适合不懂普 通话的人使用和不能录入不认识字的缺点;(2) 将汉字输入法由单一的打字功能变为既能打字又可学字的双重功 能,打字的同时可以学字。(3) 字典内容可根据使用者的特殊需求进行增删。(4) 用纸质字典查字,认识的字和不认识的字都可直接翻页查字,提高 査字速度。具体技术方案表述如下 1、 一种新型字典,特点是(1) 增收GB2312-80字符集中前15区的部分常用符号(包括标点符号);(2) 按照査字打字同码方案中的编码规则对字、符号进行编码;(3) 字典所收字在检字表和正文的排序以上述(2)编码规则中的部首 读音首字母的音序为序;对字数不超过10个的二级重码字组中的重码字按使用频率排序,高频字(4) 对字数超过10个的二级重码字组中的重码字先按其所属的三级重 码字组顺序排序,对三级重码字组再按按使用频率排序,高频字在前;(5) 纸质字典的翻口处设计一级重码字组标记及页眉处设标记;(6) 纸质字典设篇章页,把检字表按各一级重码字组分列在各个篇章页 上,检字表中一个字典正文页码对应该正文页码所包括的所有汉字;(7) 纸质字典各相邻一级重码字组页幅宽度不同;(8) 设置各种分类字表;(9) 设置一个作为整个汉字系统的独立的子系统多字词语库,其中收录 三字以上的词语、成语,歇后语、格言、名言警句,同时字典正文不再收入 三字以上词语条目。(10) 字典内容可根据使用者的特殊需求进行增删。2、 为了增加重码字组的数量、减少各重码字组的字数,纸质字典设有区 别码(1)在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔及次笔编区别码,其编码及排序规则是(1.1) 把部首的第一、二笔笔画划分为"一、I 、 j 、、、""五种笔 画,且分别以1、 2、 3、 4、 5为代码编码,只有一笔的第二码为"0"。再按 其编码数字大小排序,数字小的在前;(1.2) 第一二笔均相同的加一个第三码,或根据部首字笔画数排序,笔 画数小的在前,或根据第三笔笔画"一、I 、 j 、、、""排序,第三码按 部首排序依次编码为6、 7、 8、 9、 0;在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序 按部首区别码数字大小排序。(2 )在同部首且第二码相同的重码字中设第二码字形区别码第二码是部首字的一类不加区别码;第二码是笔画码的一类,加区别码 为"/";在检字表和正文中第二码不加第二码区别码的字在前,第二码加区别码 的字在后。3、 在上述的一种新型字典中,还可设立个性化的分类字表,纸质字典的 附录部分采用活页式装订。4、 在上述的一种新型字典中,还可附设同音字(不计声调)检字法,于 按使用频率排序(高频字在前)的同音字检字表中,在每一个同音字的后面 加上该字在字典正文的页码。5、 一种与上述新型字典匹配的査字打字同码方案,特点是编码规则如下(1)按成字部首读音首字母及非成字部首首笔画编码(1.1)部首设置(合计207个)及部首代码第1组计21个(部首代码a):山乡一仅用于第一码(计2个);(部首代 码b):髟比卜贝白鼻八匕广(计9个);(部首代码c):寸厂虫辰车臣赤齿长 4 (计10个)(另有"廿"-仅限于第二码用)。第2组(计25个),(部首代码d)成字部首豆大歹斗刀(计5个),不成字部首、7 "曾"的上面两点"、、一iL才、卑(计8个)另有"工;a"仅限于第二码;(部首代码e)竹(包括竹字头)一仅用于第一码(限于 笔顺在前)(计1个);(部首代码f)成字部首非缶父风方(计5个), 不成字部首"3|S卩i_〈〈〈(计6个)。其中"点"包含"捺","折"包含除"竖钩"以外的单笔划"折"笔;第3组(计26个),(部首代码g):干工甘革鬲鼓戈骨鬼瓜谷高广弓艮(计 15个);(部首代码h)成字部首黄黑禾火户(计5个),不成字部首 一升匚(计3个);(部首代码i) ^言(i ) 一仅用于第一码(计3个)。苴中"横"包含"提".;4组(计10个),(部首代码j):巾见臼斤金(,)几包括风字框角己(计8个);(部首代码k): 口 (计l个)(部首代码O):十一仅用于第一 码(计l个)。第5组(计28个),(部首代码l)成字部首耒老龙卤里立鹿隶力(计9个);不成字部首I产lj门口 "肖"字上一半(计6个);(部首代码M):11麦13面256目257皿31毛41麻42门43米54矛556马557母558糸(计 12个)(另有"木"-仅用于第二码);(部首代码u)木一仅用于第一码(计 l个)。其中"竖"包含"竖钩";第6组(计18个)(部首代码n):鸟牛女(计3个)(部首代码p):成 字部首爿皮片支疋(计5个),不成字部首j夂多"番"的上一半,勺"危" 的上一半,3夂1:、(计9个);(部首代码)V人(4 ) 一仅用于第一码(计 l个)。第7组(计12个)(部首代码q):青其犬气欠(计5个)另外一些常用 符号(包括标点符号)的首码代码亦为"q";;(部首代码r): 二耳而儿日["曰" 并入"日"]肉(计6个)[另有"人G )"-仅用于第二码](部首代码",") (计l个)。第8组(计23个)(部首代码)S:示十士石豕四手生矢舌身鼠食殳氏色 首尸巳厶(计20个),(另有"纟矛?水山"-仅用于第二码);(部首代码)t: 土田(计2个);(部首代码"。")净(计l个)一仅用于第一码。第9组(计16个)(部首代码)W: 6王无韦尤瓦文毋(计7个);(部首 代码X):西小香血夕辛穴心(计8个),(另有"十"-仅用于第二码));(部 首代码"/"): *_仅用于第一码((计l个)。第0组(计28个)(部首代码)y:雨尤页犬牙业用衣音羊(包括"差" 的上半,"羔"的上半)聿又羽幺(计14个),[另有"月鱼言(i ")-仅用 于第二码);(部首代码)z:支走至止足(包括足字旁)自隹爪(包括w)舟 豸子(计11个),(另有"竹字头"-限于第二码);(部首代码";)"酉月 鱼一仅用于第一码(计3个)。(其中",""。""/"";" 4个标点符号和a、 e 、 u、 i、 o、 v 6个字母一 键位两用, 一是作10个特殊部首字首码,二是作高频字的尾码。 (1.2) l个常用符号(包括标点符号)首码"q";(2) 每字最多三码,第一、二码,成字部首取读音首字母码,不成字构 件取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显 性码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于査字 和电脑的汉字录入;(3) 编码时首先把汉字分为独体字和合体字两类,再按下列规则编码(3.1) 独体字取码规则(3.1.1) 成字部首独体字 第一码为成字部首读音首字母,第二码仍为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画"一""I"" j ""、" 分别对应编码为"1""2""3""4"" 5")。(3.1.2) 非成字部首独体字第一码首笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其 首笔画"一""I" "j" "、" 分别对应编码为"6" "7" "8""9"" 0"。(3.2) 合体字编码规则(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的 一第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首 笔画;一第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首首 笔画;第三码根据第二码取码。第二码是成字部首的,取成字部首首笔笔画, 按其成字部首的首笔笔画"一""I ""〗""、""""分别对应编 码为"1""2""3""4"" 5";第二码是两笔以上非成字部首首笔画 的,笔画取该半次笔笔画,按其笔画"一""I ""〗""、"分 别对应编码为"6""7""8""9"或"0"。(3. 2. 2)两半中有一个成字部首或两笔以上非成字部首独占一半的第一码为独占一半的前半(或后半)成字部首读音首字母(或两笔以上 非成字部首首笔画),第二码(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字 部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则 则取该半首笔码(注意成字部首构件位于该半中间的,亦取该半首笔码)。第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的首笔笔画,按其成字部首的首笔笔画"一""I" " j ""、"分别对应编码为"6" "7" "8" "9" " 0"。第二码是取笔画码的,取 余下部分首笔笔画,按其笔画"一""I " " j " " 、 " 分别对应 编码为"6""7" "8""9"" 0"。(3.2.3) 两半都不是成字部首或两笔以上非成字部首的各自独占一半 的,按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画, 第三码取后半的次笔笔画(后半只有一笔的,第三码与第二码同),按其笔画"一""i " " j ""、"分别对应编码为"6" "7" "8" "9""0"。(3.2.4) 特殊部首字所属字的编码规则特殊部首字所属字的定义按编码规则其首码其为特殊部首的, 特殊部首字所属字的编码规则首码为特殊部首码;第二码据去掉部首 后余下字形依一般字编码规则取码;第三码取码规则l.第二码是成字部首的,取其第二码成字部首的首笔 笔画。按其成字部首的首笔笔画"一""I "" J ""、""""分别 对应编码为"1""2" "3""4""5"。
2.第二码是取笔画码的,取 余下部分首笔笔画。按其笔画"一""I ""j ""、"编码为 "1" "2""3" "4" " 5"; 3.后半只有一笔的,按其第二码笔画"一" "I" ")" "、" 分别对应编码为"r, "2""3" "4" "5"。(3. 3)高频字编码(包括",。/;"四个标点符号)规则 分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、 e、 u、 i、 o、 v, 。 /;为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重码字组中使用频率最高的最高的3个字分别对应空格、a和";"键,其他字按第一码的首笔画"一 I j 、""的顺序排列,第一码首笔画相同的按使用频率高低的顺序排列。特别规定"乡山竹言(包括"i ")工^十木人(包括'M ")水(包括 ")矛^月鱼酉"15个部首各自所属的8个高频字按去掉部首后剩余部分的首笔画"一 I j 、""的顺序排列,其中属成字部首的高频字,即去掉部首无剩余笔画的,排在有剩余笔画高频字的前面;",。A " 4个最常用标点的编码分别为",,"、"。。""〃"";;";(3.4)多字词语编码规则三字以上常用词语按一字一码编码,只取词语每个字的首码。6、 上述的査字打字同码方案中,在(3.1.2)非成字部首独体字编码规 则中,非成字部首编码规则为非成字部首的第一、二、三码同为首笔画, 第三码按其首笔画编码为"一""I"" j ""、"分别对应 编码为"1""2" "3""4"" 5")。7、 上述的查字打字同码方案中,在(3.2)合体字编码规则中,特殊编码规则规定如下(1) 上中下结构的字按不同分法可分为两个不同成字部首的,成字部首 就大不就小;(2) 上下或上中下结构的字仅从字形上看,既有相接处又有相离处的, 一般从相离处划分为两部分,若无相离处,则可从相接处分为两部分;(3) 上中下结构的字其首码只能从上下取码,不能从中间取首码,取第 一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下 部取码;若其首码取的是上部(或下部)的一个独占一半的成字部首或两笔以上 不成字部首,第二码仍同其他合体字一样按笔顺优先余下部分的上部或下部 取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码;若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、 二、三码则分别取第一、二、三笔画;(4) 两半都无成字部首、也无明显界限的上下结构的字,按独体字编码;(5) 左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔 以上非成字部首的按笔顺从左部取首码码,尾码根据余下部分仍按一般规则 取码;(6) 难以确定编码的字可有两种编码的容错码。 8.査字方法本发明所创设的"部首音形结合码査字打字同码方案"要査一个不认识 字的理论上的步骤有如下3个1.为要查的字a确定两个部首并根据这两个 部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码; 2.根据这个编码在检字表中査到字a在字典正文的页码;3.从字a在字典正 文的页码找到字a并阅读其释义。实际查字过程中, 一般情况下应该省略其中的第二个步骤。按字a的编 码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a 所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知 道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近 再翻页找到字a并阅读其释义。且一般来说比现在要查认识的字a还要快捷。 因为用现在的字典要査认识的字,对大多数人来说,是把"知道读音"定义 为"知道声母和韵母",并不包括声调。而且对全部所谓"知道读音的字" 中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不 知道字的声调,对同音字多的音节,往往要翻多页才能找到要查的字,有时 甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案查不认 识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。本发明的査字打字同码方案的编码规则简单易学,把34个不成字部首归 并为5种基本笔画,把173个成字部首按读音首字母归并为20种读音首字母, 部首本身的归类及与字的读音音序的对应关系都极有规律,在很短时间内就 可记牢,遇到不认识的字也会编码。另外,在字典的翻口处设计一级重码字 组标记、页眉处设标记、设立篇章页、各相邻一级重码字组页幅宽度加以区别等,通过以上几项改进措施减少了査字步骤,借以实现査阅字典所收字无 论认识与否都可直接翻页快速查字,且极便于己会用传统的部首查字法査字 的人改用笔者的査字法。而且利用本方案可以把查字与打字用同一种编码方 式,由于要学打字的人在学打字以前就已熟练掌握编码,可以使其在初学打 字时,比新学任何一种编码都能节省很多的熟练掌握编码的时间。四具体实施方式
下面结合实施例对本发明做具体的解释说明。(一) 一种新型字典,在内容及编撰上进行如下创新 内容上加以增扩-1、增收gb2312-80字符集中前15区的一些常用符号(包括标点符号);2 、以附录的形式增加汉字学习方法和各种具体识字方法介绍 总原则是"全方位多形式识字",具体识字形式很多,如集中识字、分 散识字、拆字识字……;3、可增加如下各种分类字词表(1) 会意字集录;(会意字的认定:从流俗字源学的角度认定,只要能 自圆其说,利于汉字识记即可,不必非要从科学字源学的角度去认定。如"孙" 字,从字形上可以分析为"比儿子小一辈的是孙子",既可认定为会意字,而 不必考虑当初是否是按"比儿子小一辈的是孙子"的字理造该字。(2) 形声字集录(形声字形旁表意的标准是形旁与字的主要义和常用义 相关, 一般不考虑与主要义和常用义己不搭边的造字之初的本义;形声字声 旁表音的标准是声母韵母均相同、不考虑声调。把一些形旁表意、声旁表音 又表意的形声字另划归为形声兼会意字);(3) 可读半边字集录;(4) 记号字集录;(5) 半记号字集录(即传统上划归为"形声字"但实际上只有形旁表意、 声旁己不表音的一部分字);(6) 易误读字集录;(7) 易写错笔顺字集录;(8) 易写错字形字集录;(9) 形声兼会意字集录(把一些形旁表意、声旁表音又表意的形声字划 归于此);(10) 形近字集录;(11) 多音字集录;(12) 常用同义词、反义词集录;(13) 自用生僻字,录;(14) XX年度流行词语;(以上各种分类字表不求全,但除了 "自用生僻字集录"和"XX年度 流行词语"夕卜,不可空项,可随时增加);以上14类字词表的内部排序原则上以部首音序为序。4、 可以设置部分非成字部首的释义,这样有助于从造字法的角度识记其他汉字;5、 增设一个作为整个汉字系统的独立的子系统多字词语库,其中收录三 字以上的词语、成语,歇后语、格言、名言警句(多字词语库亦不求全)。同 时字典正文不再收入三字以上词语条目。多字词语库所收三字以上词语的排序一律以部首音序为序。 利用以上增扩的内容,不但可以进一步增强字典的识字和巩固识字功能,让使用者系统了解整个汉字系统,更重要的是有助于弘扬中华传统文化的精华。6、 使用者可根据自己的的特殊需求对字典内容尤其是及时对其中的各种 分类字表和多字词语库进行增删。(二)査阅方法上和外观设计上作如下改进1、 字典所收字在检字表和正文的排序与匹配的查字打字同码方案中的部 首读音首字母的音序相同,(1) 对字数不超过10个的二级重码字组中的重码字按使用频率排序(高 频字在前)(2) 对字数超过10个的二级重码字组中的重码字先按其所属的三级重 码字组顺序排序,对三级重码字组再按按使用频率排序(高频字在前)。2、 在纸质字典的翻口处设计一级重码字组标记及每页的页眉处设二级重 码字组标记;3、 设篇章页(即中扉页)且把检字表按各一级重码字组分列在篇章页, 检字表中不是一个汉字对应一个字典正文页码,而是一个字典正文页码对应 该正文页码所包括的一个或多个汉字;4、 各相邻一级重码字组页幅宽度稍有区别(相差1.5-2.5毫米即可)。 通过以上几项改进措施减少查字步骤,借以实现查阅纸质字典所收字无论认识与否都可直接翻页快速查字;且极便于已会用传统的部首查字法査字 的人改用笔者的査字法。5、 纸质字典持有者还可建立个性化的分类字表,能及时在附录的分类字 表中增加内容,纸质字典附录部分可采用活页式装订。6、 考虑到现实中,小学中高年级学生因言语学习与文字学习不同步,有 一部分词语会说不会写,往往需要在同音字中选择所要用的字。针对这一需 要,在字典中可附设一个按使用频率排序的同音字(不计声调)表,并在每 一个同音字的后面加上该字在字典正文的页码。同音字表的作用有二 一是 反映汉字体系的同音字状况,二是作为一种辅助的同音字查字法的检字表。在笔者看来,同音字查字法利用同音字检字表査字的速度对于不能准确 掌握大部分汉字声调的人来说,据经验估计比目前在同音字按声调排序的字 典直接翻页査字应该基本相同。(三)本发明设有与之匹配的査字打字同码方案,其具体编码规则如下:编码范围-以GB2312-80字符集的6763字为准(或字典以6763字为准,单字词库 以一级常用字3755字为准)。另外把标点符号亦纳入汉字系统,将其作为高频 字来编码。把区位码01-15区(即《GB2312字符集》中01-15区) 一些较常 使用的其他符号如"(-)(1) ^tld^du logs『『『』』』"也纳入汉字系统,将其 作为一般字来编码。编码规则l.部首设置以原中国文字改革委员会和国家出版局1983年颁布的的《汉字统一部首 表(草案)》所推荐使用的201部首为基础,适当删去几个按汉字书写笔顺在 后且所数字很少的几个不成字部首(部首成字与否以属于一般中小型字典所 收有读音的字在为准,下同),如,取消或归并了"仓"字下半、中""U""出" 字上半,另外又把几个部首的变形也算作独立部首,如,把小和"肖"字上 一半分为两个部首。共设部首207个(从长远考虑还可增加"古甫出交娄莫 单同尚千肖屯占章者五旦丁佥全去宛壬乍各夫",当然这需要经过论证)。其 中部首设置(合计207个)及部首代码第1组21个(部首代码a):山纟一仅用于第一码(计2个);(部首代码 b):髟比卜贝白鼻八匕广(计9个);(部首代码c):寸厂虫辰车臣赤齿长^ (计IO个)(另有"廿"-仅限于第二码用)。第2组(计25个),(部首代码d)成字部首豆大歹斗刀(计5个),不成字部首W "曾"的上面两点"、、^ (计8个)另有"二;仅限于第二码;(部首代码e)竹(包括竹字头)一仅用于第一码(限于 笔顺在前)(计1个);(部首代码f)成字部首非缶父风方(计5个), 不成字部首"3P P i_〈〈〈(计6个)。其中"点"包含"捺","折"包含除"竖钩"以外的单笔划"折"笔; 第3组(计26个),(部首代码g):干工甘革鬲鼓戈骨鬼瓜谷高广弓艮(计15个);(部首代码h)成字部首黄黑禾火户(计5个), 不成字部首 一升匚(计3个);(部首代码i) "言(i )—仅用于第一码(计3个)。其中"横"包含"提";第4组(计10个),(部首代码j):巾见臼斤金(,)几包括风字框角己(计8个);(部首代码k): 口 (计l个)(部首代码O): t —仅用于第一 码(计l个)。第5组(计28个),(部首代码l)成字部首耒老龙卤里立鹿隶力(计 9个);不成字部首I产lj门口 "肖"字上一半(计6个);(部首代码M):11麦13面256目257皿31毛41麻42门43米54矛556马557母558糸(计 12个)(另有"木"-仅用于第二码);(部首代码u)木一仅用于第一码(计 l个)。其中"竖"包含"竖钩";第6组(计18个)(部首代码n):鸟牛女(计3个)(部首代码p):成字部首爿皮片支疋(计5个),不成字部首j夂乡"番"的上一半,勺"危" 的上一半,3夂t、(计9个);(部首代码)V人(4 ) 一仅用于第一码(计 l个)。第7组(计12个)(部首代码q):青其犬气欠(计5个)另外一些常用 符号(包括标点符号)的首码代码亦为"q";;(部首代码r): 二耳而儿日["曰" 并入"日"]肉(计6个)[另有"人G )"-仅用于第二码](部首代码",")- (计l个)。第8组(计23个)(部首代码)S:示十士石豕四手生矢舌身鼠食殳氏色 首尸巳厶(计20个),(另有"纟净?水山"-仅用于第二码);(部首代码)t: 土田(计2个);(部首代码"。")t (计l个) 一仅用于第一码。第9组(计16个)(部首代码)w: 6王无韦尤瓦文毋(计7个);(部首 代码X):西小香血夕辛穴心(计8个),(另有"十"-仅用于第二码));(部 首代码"/"):廿一仅用于第一码((计l个)。第0组(计28个)(部首代码)y:雨尤页弋牙业用衣音羊(包括"差" 的上半,"羔"的上半)聿又羽幺(计14个),[另有"月鱼言(i ")-仅用于第二码);(部首代码)Z:支走至止足(包括足字旁)自隹爪(包括w)舟 豸子(计11个),(另有"竹字头"-限于第二码);(部首代码";)"酉月 鱼一仅用于第一码(计3个)。其中",""。""/"";" 4个标点符号和a、 e 、 u、 i、 o、 v 6个字母一 码两用, 一是作10个特殊部首所属字首码,二是作高频字的尾码;另外设一个",。/;"以外的标点和区位码中一些较常使用的其他符号首 码键位q。把数学、物理、化学等学科的常用符号的第一、二码分别编为"qs"、 "qw"、……"qh"。2、编码规则(1) 按成字部首读音首字母及非成字部首首笔画编码(非成字部首亦规 定一个读音,重码字按其使用频率排序,高频字在前)。(2) 每字最多三码,第一二码,成字部首取读音首字母码,不成字构件 取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性 码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于査字和 电脑的汉字录入;(3) 编码时首先把汉字分为独体字和合体字两类,再按各自规则编码。 先简述一下独体字和合体字的认定独体字认定标准现代汉语词典所用的成字部首都认定为独体字,不论 其能否再拆分出其它独体字与否。对那些凡分不清上下、左右、内外、包围 半包围结构的称为独体字,如"事串专"等一类有一笔与其他笔画相交的字 均算独体字,再如"朱失"等一类单笔划与独体字所构成的字仍为独体字。另 规定1、"乘爽" 一类的字亦算独体字;2、首笔是单笔画且与其余部分相离 的上下或上中下结构的如"丽画"等字亦算是独体字。合体字认定标准凡汉字内部有明显界线可以分为二或三个构字偏旁(前 半不能是单笔划)并根据各部分间相互位置可称之为左右结构、上下结构、外内结构、包围及半包围结构、上中下结构的谓之合体字。(3.1)单字编码规则(3.1.1) 独体字取码规则(3. 1. 1. 1)成字部首字(所属字多的特殊部首"4 *净纟,十i "竹字头"r w"亦算成字部首)。第一码成字部首读音首字母;第二码仍为成字部首读音首字母;第三码 成字部首首笔笔画。第三码按其首笔笔画"一""I" " j ""、"""" 分别对应编码为"l" "2"或"3" "4" " 5")。如,"车"的编码为"ccl", "马"的编码为"mm5"。(3. 1. 1. 2)非成字部首独体字取码规则 第一码首笔笔画;第二码次笔笔画;第三码为第三笔笔画(只有一笔的 字,第二、三码与第一码相同。只有两笔的字第三码与第二码相同)。第三码 按其首笔画"一""1 " " j ""、""""分别对应编码为"6" "7" "8" "9" " 0")。如,"于"的编码为"hh7","由"的编码为"lf6"。 个别属单笔画与成字部首构成的上下结构的独体字(包括单笔画与成字 部首相接,如,"丘百"属相接;不包括单笔画与成字部首相交,如,"本" 属相交),不按独体字编码规则取码,按合体字规则编码。不考虑其笔顺,成 字部首为第一码,单笔画为第二码。如"百千丘甚"第一码分别为"白十斤 其",第二码分别为"一 j 一,",其他类推。"本"属相交,仍按独体字规则 取码(这样规定,主要是为了第三码与第二码同,编码可更快捷)。(3.1.1.3)非成字部首编码规则("gb2312字符集"中有非成字部首) 非成字部首的第一、二、三码同为首笔画,第三码按其首笔画编码为"一" (或"I"或"j "或"、"或""")编码为"1"(或"2"或"3" 或"4"或"5")。这样编码与录入会更快捷。例如,"匚"的编码为"hhl" "U"的编码为"LL2"、"3 "的编码为"pp3"、 "^"的编码为"dd4"、 "3" 的编码为"ff5" "[S "的编码为"ff5"(3.1.2) 合体字编码规则(3. 1. 2. 1)两半中均为成字部首或两笔以上非成字部首各自独占一半的一第一码独占一半的前半成字部首读音首字母或两笔以上非成字部首首 笔画;一第二码独占一半的后半成字部首读音首字母或两笔以上非成字部首首 笔画;^三码根据第二码取码。第二码是成字部首的,取成字部首首笔笔画, 按其成字部首的首笔笔画"一""I ""〗""、""""分别对应编 码为"1" "2" "3" "4" " 5")。第二码是两笔以上非成字部首首笔 画的,取该半次笔笔画,按其笔画"一""I " " j ""、""""分 别对应编码为"6" "7" "8" "9" " 0"。如,"码"的编码为"sm5"; "独"的编码为"pc2";"邓"的编码为"yf7";"祁"的编码为"df7"。 (3. 1. 2. 2)两半中有一个成字部首或两笔以上非成字部首独占一半的(包括个别成字部首或两笔以上非成字部首与单笔画构成的字,如"轧札扎 礼"等字)第一码独占一半的前半(或后半)成字部首读音首字母(或两笔以上 非成字部首首笔画);第二码(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字 部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则 则取该半首笔码(注意成字部首构件位于该半中间的,亦取该半首笔码)。第三码根据第二码取码(1)第二码是成字部首的,取其第二码成字部 首的首笔笔画。按其成字部首的首笔笔画"一""I "" j ""、""""分别对应编码为"6""7" "8""9"" 0"。 (2)第二码是取笔画码的,取余下部分首笔笔画。按其笔画"一""I" " j""、""""分别对应编码为"6" "7" "8" "9" " 0"。如,"部"的编码为"fl9";"规"的编码为"jh6";"轧"的编码为"cf0";(这样确定上述两类合体字的第一、二码主要是为了与目前通用的査字 法中字的部首归类基本一致,也为了使各一级重码字组的字数尽量不相差悬 殊)这样确定上述两类合体字第三码的优越之处在于 一是第二码是成字部 首的字在确定第二码的同时就确定了第三码(这类字占绝大多数,据粗略统计这类字约有4500字,约占6763字的66%。),几乎不用再费心去确定第三码。二是使第三码虽只有一种编码手段,但同一种编码符号用两种标记,5种编码符号共有10种标记。这样有一些二级重码字组可以分成10个三级重码字组,可以减少三级重码字组的平均字数,从而在查字打字时可以提高首码准确率,用纸质字典査字则可更快捷。(3.1.2.3)两半都不是成字部首或两笔以上非成字部首的各自独占一半的,按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画,第三码取后半的次笔笔画(后半只有一笔的,第三码与第二码同),按其笔 画"一""i " " j ""、"分别对应编码为"6" "7" "8""9"" 0")。(这类字这样编码而不考虑各半中有无成字部首,编码可更 快捷。这类字不多,基本不影响二级重码字组字的分布)如,"能"的编码 为"fp0";"成"的编码为"hf0,,; 左中右、上中下结构的字另有规定; (3.1.2.4)特殊部首所属字编码规则 为了使各重码字组的字数尽可能少,并使各一级重码字组的字数尽可能 平均;选定一些所属字较多的部首作为特殊部首,把其从同音部首中分离出 来。特殊部首字所属字的定义按编码规则其首码其为特殊部首的, 特殊部首字所属字的确定按编码规则其首码为特殊部首的才算,第二码为特殊部首的不算。如设"人"为特殊部首。"合"为特殊部首"人"所属字,"队"不为特殊部首"人"所属字。特殊部首字所属字的编码规则首码为特殊部首码;第二码据去掉部首 后余下字形依一般字编码规则取码;第三码取码规则l.第二码是成字部首 的,取其第二码成字部首的首笔笔画;按其成字部首的首笔笔画"一""I ""J""、"","分别对应编码为"1""2" "3""4" "5"; 2.第二码是取笔画码的,取余下部分首笔笔画;按其笔画"一""I ""J ""、""i"分别对应编码为"2" "3""4"" 5"; 3.后半只有一笔的,按其第二码笔画"一""I"" j ""、"分别对应 编码为"1""2" "3""4"" 5"; (3.1.2.5)特殊规定(3.1.2.5.1) 部首字的变形一般不将其视为成字部首,如,"忝"的部首为单笔画横,不为"心",但如下成字部首的变形亦算成字足(如"路"的右半)、w (如"采"的上半)、羊[如"盖"的上半"差"的上半](3.1.2.5.2) 成字部首字一律不再拆分,如,"麻鼻示" 一类字不再拆分。(3.1.2.5.3) 上下、上中下结构的字编码规则特殊规定-上下、上中下结构的字编码规则在编码的过程中,体会到按本法规则 査字的难点在于,部分上中下结构字第一二码有时难以确定,个别上下结构 字的第二码有时也难以确定。现根据试编码实践,对上下、上中下结构的字编码在遵循一般合体字编码规则的前提下,再作如下特殊规定 ,(a) 上中下结构不同分法可分为两个不同成字部首的就大不就小,如, "章"取"音"不取"立";"三)取"二"不取"一";(b) "衷亵" 一类字的部首为"丄"不为"衣";(c) 上下或上中下结构的字仅从字形上看,既有相接处又有相离处,一 般从相离处划分为两部分如"共"前半不取按后半取"八"编码。"盍" 按后半取"皿"编码。若无相离处,则可从相接处分为两部分。如"去"分 为"土"和"厶"两部分,"云亏"第一码均取"二",第二码分别取"厶"和i下面的特殊情况下可从相接处分为两半即在从相离处分为两半,两半均没有成字部首或两笔以上非成字部首, 而从相接处分为两半,下部有成字部首的特殊情况下,可从下部有成字部首 的相接处分为两半。如"党堂常" 一类仅从字形上看可分成四部分的字按规 则应从相离处分为两半,但分成两半后,两半都不是独占一半的成字部首或 两笔以上非成字部首,但其最下部为成字部首,故变通处理,第一码从下部 取成字部首码,第二码按规则从余下部分的上部或下部优先取成字部首码, 若上部与下部均无成字部首,则取余下部分的首笔笔画。"党堂常"的首码 分别取"儿土巾",其第二码均取"口";(d) 上中下结构的字其首码只能从上下取码,不能从中间取首码。取第 一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下 部取码。如,"拿"第一码取"人"后,余下部分从形体上看仍为上中下结构,按规则第二码只能从余下部分的上部或下部取码,不能从中部取码,故只能 取"手"不能取"口"。若其首码取的是上部(或下部)的一个独占一半的成字部首或两笔以上 不成字部首,第二码仍同其他合体字一样按笔顺优先从余下部分的上部或下 部取成字部首码,余下部分无成字部首的取余下部分的首笔笔画码。若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、 二、三码则分别取第一、二、三笔画(如,"复囊亘" 一类字第一、二、三码 分别取第一、二、三笔笔画。(这样编码不用考虑从何处把要编码的字分为两半(左中右结构的字如 何分成两半一目了然),编码可更快捷)(e)部分两半都无成字部首、也无明显界限(即上下相接)上下结构的 字,按独体字编码。如,"予表亡丧"第一、二、三码分别取其第一二三笔笔 画。(这样编码不用考虑从何处把要编码的字分为两半(左右结构的字自然分 成两半))(3.1.2.5.4)左中右结构的字其首码只能从左右取码,左右均为成字部 首或两笔以上非成字部首的按笔顺从左部取首码码。如"做树嬲" 一类字其 首码分别取'M木I ","嬲"的首码不取"女"。尾码根据余下部分仍按一般 规则取码。(3. 1. 2. 5. 5)个别难以确定编码的字可有两种编码这类似于"五笔输入 法"的容错码。难以确定编码的字有如下两种情况(a) 易混笔顺字,如"万"等字也可按两种笔顺编码。(b) 个别分成两半时可以有不同分法的的字(以上中下结构的字为多) 可按两种分法编码。如"丞"可编码为"fh"也可编码为"fl"。如"棼"可编码为"hp"也 可编码为"db"。如"毅"的第二码可取部首"立"也可取部首"豕";"彦" 的第一码取"i", " 、 j "(中间的一 、一"。(3.1.2.5.6)成字部首"二儿耳"以"r"为代码,"日"、"曰"因其在 合体字中难以区分其编码均为"r"。上述取码例字"词垢司后" 一类字第二码取"口",理由是无论怎么分,除了 "口"之 外,再没有两笔以上部首。"铜洞"等字的第二码取"门"不取"口",因"门" 是两笔以上部首。"燮"第二码取"火";"叟"第二码取"j ";"爵奚叠"第二码分别取 "四幺"";"式区"第一码分别取"匚戈";"毅"的第二码可取部首"立"也可取部首"豕";"死"第一码取"歹";"哀衷褒" 一类字第一码取"、"不取"衣";"坐" 一类字第一码取"人",第二码取"土"。"成咸戌" 一类字算合体字,"戊"部分为前半,余下部分为后半,第一 码均取"一"(即"戊"的首笔),第二码分别取""口一";"裁截" 一类字亦算合体字,"衣隹"为前半,余下部分为后半,第一码分别取"衣隹",第 二码均取"一";(3. 2)高频字编码(包括",。/;"四个标点符号)规则 分别将30个一级重码字组中使用频率最高的前11个高频字的尾码分别编为空格键、a、 e、 u、 i、 o、 v, 。 /;为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重 码字组中使用频率最高的最高的3个字分别对应空格、a和";"键,其他字 按第一码的首笔画"一 I j 、""的顺序排列,第一码首笔画相同的按使用 频率高低的顺序排列。特别规定"乡山竹言(包括"i ") 1—十木人(包括'M ")水(包括 " ")矛"^月鱼酉"15个部首各自所属的8个高频字按去掉部首后剩余部分 的首笔画"一 I〗、i"的顺序排列,其中属成字部首的高频字,即去掉部 首无剩余笔画的,排在有剩余笔画高频字的前面;",。A " 4个最常用标点的编码分别为",,"、"。。""〃"";;";(3.3)多字词语编码规则三字以上常用词语按一字一码编码,只取词语每个字的首码。(4)为了增加重码字组的数量、减少各重码字组的字数,纸质字典设有区别码(4.1) 在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔及次笔编区别码,其编码及排序规则是(4. 1. 1)把部首的第一、二笔笔画划分为"一、I 、〗、、、""五种笔画,且分别以1、 2、 3、 4、 5为代码编码,只有一笔的第二码为"0"。再 按其编码数字大小排序,数字小的在前;(4.1.2)第一二笔均相同的加一个第三码,或根据部首字笔画数排序, 笔画数小的在前,或根据第三笔笔画"一、I 、 j 、、、,"排序,第三码 按部首排序依次编码为6、 7、 8、 9、 0;如,把首码为b的各同读音首字母分别编码排序如下髟12;比15;卜24;贝25 ;白326;鼻327;八34;广 41;在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序 按部首区别码数字大小排序。(4.2) 在二级重码字组设第二码字形区别码在电子字典第二码以"h、 1、 p、 d、 f"为代码的二级重码字组中,第二码是成字部首字的字与第二码是笔画的字按使用频率混排在一起,为了把这 两类字分别归类排序,纸质字典在第二码"h、 1、 p、 d、 f"为代码的二级重 码字组中设第二码字形区别码。第二码是部首字的一类不加区别码;第二码是笔画码的一类(成字部首字除外),加区别码为"〃,。如,把第一二码是"bh" 二级重码字组的字,分为两类, 一类是第二码是部首字的,其代码仍为"bh"; —类是第二码是笔画码的,其代码为"bh/"。同一个二级重码字组的字在检字表和正文中第二码不加第二码区别码的 字在前,第二码加区别码的字在后。在字典中设区别码,其实质是把一个重码字组分成了几个重码字组,可 以起到减少重码字组字数的作用,又从而可使査阅字典更方便快捷。 (四)査字方法本发明所创设的"部首音形结合码查字打字同码方案"要查一个不认识字的理论上的步骤有如下3个1.为要査的字a确定两个部首并根据这两个 部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码; 2.根据这个编码在检字表中査到字a在字典正文的页码;3.从字a在字典正 文的页码找到字a并阅读其释义。实际査字过程中, 一般情况下应该省略其中的第二个步骤。按字a的编 码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a 所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知 道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近 再翻页找到字a并阅读其释义。且一般来说比现在要査认识的字a还要快捷。 因为用现在的字典要查认识的字,对大多数人来说,是把"知道读音"定义 为"知道声母和韵母",并不包括声调。而且对全部所谓"知道读音的字" 中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不 知道字的声调,对同音字多的音节,往往要翻多页才能找到要査的字,有时 甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案査不认 识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。可以省略其中的第二个步骤的理由在于,即使按第二个步骤在检字表查 到字a在字典正文的页码c, 一下直接翻到字a的页码c的几率也很少,多数 情况下是第一次只能翻到c页的附近,要经过至少两次的翻页才能翻到c页。 也就是说用与不用第二个步骤,第三个步骤所用时间基本相等,即使稍慢一 点,也不会比加上第二个步骤^f用的时间还长。既然所用时间总和不长,就 完全应该省略第二个步骤。现在通用的运用部首査字法的字典,其检字表中都有"难检字表",而其 中的难检字几乎全属于独体字和无成字部首或两笔以上非成字部首独占一半 的合体字。若按本方案査字,则难检字极少,加之本方案对难以确定编码的 字可用两种编码査字,因而取消了 "难检字表"。本发明与已有技术相比具有如下突出特点和显著进步 1、在字典中用附录的形式,从不同角度编撰各种分类字表,增加汉字学 习方法和各种具体识字方法介绍,还增设一个作为整个汉字系统的独立的子 系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警 句。利用以上增扩的内容,不但可以进一步增强字典的识字和巩固识字功能, 让使用者系统了解整个汉字系统,更重要的是有助于弘扬中华传统文化的精 华。2、 查字打字同码,会查字就会打字,因凡识字之人都要会查字典,可以省去人们学习并熟练掌握某种汉字输入法编码的过程(对能熟练运用汉语拼 音拼写汉字的人来说,全拼法也可省略这一过程,不过,全拼法是一种好学 不好用的输入法)。3、 把输入法和电子词典合二为一,使输入法由单一的打字功能变为既能 打字又可学字的双重功能,更适合人们随时随地查字学字。本项改进用于手 机,由于手机具有便携性,等于手机持有者随身携带了一本字典。比用于电 脑更佳。4、 字典内容尤其是其中的各种分类字表和多字词语库可进行增删,能满 足使用者的特殊需求5、 査字法方面的创新继承了传统的部首査字和音序查字的优点,克服 了其各自的缺点,把通用的部首査字法进行如下改进(1) 所收部首与一般字典的部首基本相同,本发明方案把34个非成字 部首归并为5种基本笔画;把173个成字部首按读音首字母归并为20种读音 首字母,部首本身的归类及与键盘键位的对应关系都极有规律,把部首目录 的排序由以笔画为序改为以部首读音首字母为序,使记忆全部部首及部首代 码及其容易。在很短时间内就可记牢。本查字法简便易学,不但初学査字典的人可以很快学会,而且因其所选 取的部首与目前通用的查字法相同,已会用部首查字法查字者学习本查字法 会更快。(2) 在字典正文中把所收单字的排序由以整字读音为序改为以部首读音 首字母为序。(3) 查字步骤比通用的部首查字法减省。 通用的部首査字法在纸质字典中要査一个不认识字的一般步骤有如下5个l.为要査的字(假定为a)确定一个部首(假定为b); 2.在部首目录中查 到部首b所属字在检字表的起始页码;3.根据该部首所属字在检字表的起始 页码找到部首b所属字;4.在检字表中根据字a除去部首的笔画数和起笔笔 画査到字a在字典正文的页码;5.从字a在字典正文的页码找到字a并阅读 其释义。本发明所创设的"部首音形结合码査字打字同码方案"要查一个不认识 字的理论上的步骤有如下3个1.为要査的字a确定两个部首并根据这两个 部首的读音首字母为字a确定一个由汉语拼音字母或标点组成的两码编码; 2.根据这个编码在检字表中查到字a在字典正文的页码;3.从字a在字典正 文的页码找到字a并阅读其释义。实际査字过程中, 一般情况下应该省略其中的第二个步骤。按字a的编 码根据字典翻口处及字典正文页眉处的标记直接翻到字a所在的页码或字a 所在页码附近再翻页找到字a并阅读其释义。这就如同用现在的字典要查知 道读音的字a,按字a的读音可直接翻到字a所在的页码或字a所在页码附近 再翻页找到字a并阅读其释义。且一般来说比现在要査认识的字a还要快捷。 因为用现在的字典要査认识的字,对大多数人来说,是把"知道读音"定为"知道声母和韵母",并不包括声调。而且对全部所谓"知道读音的字" 中的大部分字的声调他们也不能确定,只能确定一小部分字的声调。由于不 知道字的声调,对同音字多的音节,往往要翻多页才能找到要查的字,有时 甚至可能要把该音节的同音字从头找到尾才能找到。而用本发明方案査不认 识的字,虽然也有同码字,但同码字数量少,且按使字频排序,很容易找到。 可以省略其中的第二个步骤的理由在于,即使按第二个步骤在检字表查到字a在字典正文的页码c, 一下直接翻到字a的页码c的几率也很少,多数 情况下是第一次只能翻到c页的附近,要经过至少两次的翻页才能翻到c页。 也就是说用与不用第二个步骤,第三个步骤所用时间基本相等,即使稍慢一 点,也不会比加上第二个步骤所用的时间还长。既然所用时间总和不长,就 完全应该省略第二个步骤。现在通用的运用部首査字法的字典,其检字表中都有"难检字表",而其 中的难检字几乎全属于独体字和无成字部首或两笔以上非成字部首独占一半 的合体字。若按本方案查字,则难检字极少,加之本方案对难以确定编码的 字可用两种编码查字,因而取消了 "难检字表"。依据本査字法查字,无论要的字认识与否都可直接翻页査字,査生字要 比用了 1000多年直至现在还通用的"部首查字法"和"笔画査字法"快许多。6.编码规则符合人们识记称说汉字字形的习惯 人们在识记称说汉字字形时,通常采取如下模式独体字(包括非成字部首)l无字根的直接分成几个笔画;2有字根的,先分解成字根与笔画,再把构件分别分解成几个笔画。合体字1先把汉字合体字分为两半,把部首分作一半,把其余笔形分作另一半(如人们称谓姓氏常说"古月胡、弓长张、言午许、双人徐"。2再把各半分别分为一个或几个成字部首字(或构件)-这里的构件特指非成字部首 独体字和两笔以上非部首笔形,如"申夫"非成字部首独体字、"釜"字的 后半的笔形、"敖"字左半的笔形、"复"字第一二笔的笔形等都称之为构件。该概念的外延大于通常所说的字根。下同-取该半的次笔笔画)3最后把构件分解为笔画。上述模式与本方案的编码顺序和编码特点相比,我们有充分的理由说本 方案的编码规则与人们识记称说汉字的习惯正相吻合。
权利要求
1. 一种新型字典,为电子字典或纸质字典,其特征是(1)增收GB2312-80字符集中前15区的部分常用符号,包括标点符号;(2)按照查字打字同码方案中的编码规则对字、符号进行编码;(3)字典所收字在检字表和正文的排序以上述(2)编码规则中的部首读音首字母的音序为序;对字数不超过10个的二级重码字组中的重码字按使用频率排序,高频字在前;(4)对字数超过10个的二级重码字组中的重码字先按其所属的三级重码字组顺序排序,对三级重码字组再按其使用频率排序,高频字在前;(5)纸质字典的翻口处设计一级重码字组标记及字典正文每一页的页眉处标明该页所收字的编码;(6)纸质字典设篇章页,把检字表按各一级重码字组分列在各个篇章页上,检字表中一个字典正文页码对应该正文页码所包括的所有汉字;(7)纸质字典各相邻一级重码字组页幅宽度不同;(8)设置各种分类字表;(9)介绍汉字学习方法和具体的识字方法;(9)设置一个作为整个汉字系统的独立的子系统多字词语库,其中收录三字以上的词语、成语,歇后语、格言、名言警句,同时字典正文不再收入三字以上词语条目;(10)字典内容尤其是附录中的内容可根据使用者的特殊需求进行增删。
2、 根据权利要求1所述的一种新型字典,其特征是纸质字典设有区别码(1)在第一码相同的几个部首中按部首笔画设部首字形区别码,按首笔 及次笔编区别码,其编码及排序规则是(1. 1)把部首的第一、二笔笔画划分为"一、I 、 j 、、、""五种笔 画,且分别以1、 2、 3、 4、 5为代码编码,只有一笔的第二码为"0"。再按 其编码数字大小排序,数字小的在前;(1.2)第一二笔均相同的加一个第三码,或根据部首字笔画数排序,笔画数小的在前,或根据第三笔笔画"一、I 、〗、、、""排序,第三码按 部首排序依次编码为6、 7、 8、 9、 0;在检字表和正文中,把第一码相同的字按部首分组,各组字的排列顺序 按部首区别码数字大小排序;(2 )在同部首且第二码相同的重码字中设第二码字形区别码第二码是部首字的一类不加区别码;第二码是笔画码的一类,加区别码<formula>formula see original document page 3</formula>在检字表和正文中,第二码不加第二码区别码的字在前,第二码加区别 码的字在后。
3、 根据权利要求l所述的一种新型字典,其特征是设立个性化的分类 字表,纸质字典附录部分可采用活页式装订。
4、 根据权利要求1所述的一种新型字典,其特征是附设同音字检字法, 于同音字检字表中,在每一个同音字的后面加上该字在字典正文的页码,同 音字的排序按使用频率排序,高频字在前;同音字定义为声母韵母相同,不计声调。
5、 权利要求1-4中任一权利要求所述一种新型字典的査字打字同码方案, 其特征是编码规则如下(1)按成字部首读音首字母及非成字部首首笔画编码 部首设置及部首代码 第1组计21个部首代码.a:山乡一仅用于第一码,计2个;部首代码b:髟比卜贝白鼻 八匕广,计9个;部首代码c:寸厂虫辰车臣赤齿长《,计10个,另有""^" -仅限于第二码用;第2组计25个部首代码d:成字部首豆大歹斗刀,计5个,不成字部首、7 "曾" 的上面两点"、、^ 1_才、丰,计8个,另有"工;a"仅限于第二码;部 首代码e:竹,包括竹字头,一仅用于第一码,限于笔顺在前,计l个;部首 代码f:成字部首非缶父风方,计5个,不成字部首,曰P卩乙〈〈〈, 计6个;其中"点""包含"捺","折"包含除"竖钩"以外的单笔划"折" 笔;第3组计26个.部首代码g:干工甘革鬲鼓戈骨鬼瓜谷高广弓艮,计15个;部首代码h: 成字部首黄黑禾火户,计5个,不成字部首 一升匚,计3个;部首代码i:二; ^言i —仅用于第一码,计3个; 其中"横"包含"提"; 第4组计10个部首代码j:巾见臼斤金,几,包括风字框,角己,计8个;部首代码k: 口,计l个;部首代码O:十一仅用于第一码,计l个;第5组计28个部首代码l成字部首耒老龙卤里立鹿隶力,计9个;不成字部首I 产!j门口"肖"字上一半,计6个,;部首代码M:麦面目皿毛麻门米矛马母糸, 计12个,另有"木"-仅用于第二码;部首代码U木一仅用于第一码,计1个;其中"竖"包含"竖钩";第6组,计18个,部首代码n:鸟牛女,计3个,部首代码p:成字部首爿皮片支疋,计5个,不成字部首j夂乡"番"的上一半,勺"危" 的上一半,3夂t、,计9个;部首代码V人^f 一仅用于第一码,计l个;第7组,计12个,部首代码q:青其犬气欠,计5个,另外一些常用符 号,包括标点符号的首码代码亦为"q";部首代码r: 二耳而儿日,"曰"并 入"日",肉,计6个,另有"人4 "-仅用于第二码,部首代码","?, 计l个;第8组,计23个,部首代码S:示十士石豕四手生矢舌身鼠食殳氏色首 尸巳厶,计20个,另有"纟净?水山"-仅用于第二码;部首代码t: 土田, 计2个;部首代码"。"净,计1个一仅用于第一码;第9组,计16个,部首代码W: 6王无韦尤瓦文毋,计7个;部首代码 X:西小香血夕辛穴心,计8个,另有"十"-仅用于第二码;部首代码"〃,: ^一仅用于第一码,计l个;第0组,计28个,部首代码y:雨尤页弋牙业用衣音羊,包括"差"的 上半,"羔"的上半聿又羽幺,计14个,另有"月鱼言,"l "-仅用于第二码; 部首代码Z:支走至止足,包括足字旁,自隹爪,包括^,舟秀子,计11 个,另有"竹字头"-限于第二码;部首代码";"酉月鱼一仅用于第一码, 计3个;其中",""。""/"";" 4个标点符号和a、 e 、 u、 i、 o、 v 6个字母一 码两用, 一是作10个特殊部首所属字首码,二是作高频字的尾码; 另设1个常用符号(包括标点符号)首码"q";(2) 每字最多三码,第一二码,成字部首取读音首字母码,不成字构件 取首笔笔画码,第三码均取笔画码;第三码或为显性码或为隐性码,为显性 码时,主要用于手机及其他数字键盘的汉字录入;为隐性码时,用于査字和 电脑的汉字录入;(3) 编码时首先把汉字分为独体字和合体字两类,再按下列规则编码 (3.1)独体字编码规则(3.1.1) 成字部首独体字 第一码为成字部首读音首字母,第二码仍为成字部首读音首字母;第三码成字部首首笔笔画,第三码按其首笔画"一""I""j ""、" 分别对应编码为"1""2" "3""4"" 5";(3.1.2) 非成字部首独体字第一码首笔笔画,第二码次笔笔画,第三码为第三笔笔画,第三码按其 笔画"一""I " " J ""、""""分别对应编码为"6""7" "8"(3.2)合体字编码规则(3.2.1)两半中均为成字部首或两笔以上非成字部首各自独占一半的-第一码为独占一半的前半成字部首读音首字母或两笔以上非成字部首首笔画;第二码为独占一半的后半成字部首读音首字母或两笔以上非成字部首 首笔画;第三码根据第二码取码,第二码是成字部首的,取成字部首首笔笔 画,按其成字部首的首笔笔画"一""I " " j ""、"分别对应 编码为"1" "2" "3" "4" " 5";第二码是两笔以上非成字部首首 笔画的,笔画取该半次笔笔画,按其笔画"一""I " " j ""、" 分别对应编码为"6""7" "8""9"" 0";(3. 2. 2)两半中有一个成字部首或两笔以上非成字部首独占一半的 第一码为独占一半的前半或后半成字部首读音首字母,或两笔以上非成 字部首首笔画;第二码(a)另一半只有一笔的,取该笔笔画码,(b)另一半中有成字 部首构件位于该半前一部分或后一部分的,取成字部首读音首字母码,否则 则取该半首笔码注意成字部首构件位于该半中间的,亦取该半首笔码;第三码根据第二码取码,第二码是成字部首的,取其第二码成字部首的 首笔笔画,按其成字部首的首笔笔画"一""I " "J ""、"分 别对应编码为"6" "7" "8" "9" " 0";第二码是取笔画码的,取 余下部分首笔笔画,按其笔画"一""I"" j ""、"编码为"6" y " W g ,, W g ,, "G ,,.(3.2.3) 两半都不是成字部首或两笔以上非成字部首各自独占一半的, 按笔顺取第一二码;第一码取前半的首笔画,第二码取后半的首笔画,第三 码取后半的次笔笔画,后半只有一笔的,第三码与第二码同,按其笔画"一""I""""、" 一"分别对应编码为"6" "7""8" "9" " 0";(3.2.4) 特殊部首字所属字的编码规则-特殊部首字所属字的定义按编码规则其首码其为特殊部首的,特殊部首字所属字的编码规则首码为特殊部首码;第二码据去掉部首后余下字形依一般字编码规则取码;第三码取码规则l.第二码是成字部首的,取其第二码成字部首的首笔笔画;按其成字部首的首笔笔画"一""I ""〗""、""""分别对应编码为"1""2" "3""4""5"; 2.第二码是取笔画码的,取余下部分首笔笔画;按其笔画"一""1""〗""、""""分别对应编码为"1" "2" "3" "4" " 5"; 3.后半只有一笔的,按其第二码笔 画"一""i "")""、""""分别对应编码为"r,"2" "3"(3. 3)高频字包括",。/;"四个标点,编码规则第一码相同字的集合组成一个一级重码字组,分别将30个一级重码字组 中使用频率最高的前ll个高频字的尾码分别编为空格键、a、 e、 u、 i、 o、 v、",, ",, 《《,,, ",,, 为了有规律的记忆或寻找各个高频字所对应的键位,特规定每个一级重 码字组中使用频率最高的3个字分别对应空格、"a"和";"键,其他字按第 一码的首笔画"一 I〗、""的顺序排列,第一码首笔画相同的按使用频率 高低的顺序排列;特别规定"乡山竹言(包括"i ")工"个木人(包括'M ")水(包括 "")t ^月鱼酉"15个部首各自所属的8个高频字按去掉部首后剩余部分 的首笔画"一 I j 、""的顺序排列,其中属成字部首的高频字,即去掉部 首无剩余笔画的,排在有剩余笔画高频字的前面;",。A " 4个最常用标点的编码分别为",,"、"。。""〃"";;"; (3.4)多字词语编码 三字以上常用词语按一字一码编码,只取词语每个字的首码。
6、 根据权利要求5所述的查字打字同码方案,其特征是,在上述(3. 1. 2) 非成字部首独体字编码规则中,非成字部首编码规则为非成字部首的第一、 二、三码同为首笔画,第三码按其首笔画编码为"一""I"" j ""、"分别对应编码为"1""2" "3""4"" 5"。
7、 根据权利要求5所述的查字打字同码方案,其特征是,在上述(3.2) 合体字编码规则中,特殊编码规则规定如下(1) 上中下结构的字按不同分法可分为两个不同成字部首的,成字部首 就大不就小;(2) 上下或上中下结构的字仅从字形上看,既有相接处又有相离处的, 一般从相离处划分为两部分,若无相离处,则可从相接处分为两部分;(3) 上中下结构的字其首码只能从上下取码,不能从中间取首码,取第 一码后,余下部分从形体上看仍为上中下结构的,第二码亦只能从上部或下 部取码;若其首码取的是上部或下部的一个独占一半的成字部首或两笔以上不成 字部首,第二码仍同其他合体字一样按笔顺优先从余下部分的上部或下部取 成字部首码,余下部分无成字部首的取余下部分的首笔笔画码;若其上部和下部均无独占一半的成字部首或两笔以上不成字部首,第一、 二、三码则分别取第一、二、三笔画;(4) 两半都无成字部首、也无明显界限的上下结构的字,按独体字编码;(5) 左中右结构的字其首码只能从左右取码,左右均为成字部首或两笔 以上非成字部首的按笔顺从左部取首码码,尾码根据余下部分仍按一般规则 取码;(6)难以确定编码的字可有两种编码的容错码。
8、 根据权利要求5所述的查字打字同码方案,其特征是,查一个字的步骤如下(1) 为要查的字a确定两个部首并根据这两个部首的读音首字母为字a 确定一个由汉语拼音字母或标点组成的两码编码;(2) 根据这个编码在检字表中査到字a在字典正文的页码;(3) 从字a在字典正文的页码找到字a并阅读其释义。
9、 根据权利要求8所述的查字打字同码方案,其特征是,査一个字的步 骤如下省略其中的第二个步骤,直接按字a的编码根据字典翻口处及字典 正文页眉处的标记直接翻到字a所在的页码或字a所在页码附近再翻页找到 字a并阅读其释义。
全文摘要
本发明涉及一种新型纸质字典及电子字典,及与之匹配的查字打字同码方案,属字典编撰技术。本发明依据字典查字通用部首,把34个不成字部首归并为5种基本笔画,把173个成字部首按读音首字母归并为20种读音首字母。设置个性化字词库,采取纸质字典设置翻口处标记等有助于快速查字的措施。本发明优点(1)将汉字查字法与电脑及手机汉字输入用同一种编码方案,消除各种汉字录入纯音码方案不适合不懂普通话的人使用和不能录入不认识字的缺点;(2)将汉字输入法由单一的打字功能变为既能打字又可查字、学字的双重功能,打字的同时可以学字;(3)字典内容可根据使用者的特殊需求进行增删;(4)用纸质字典查字,认识的字和不认识的字都可直接翻页查字,提高查字速度。
文档编号B42D1/00GK101224680SQ20081001376
公开日2008年7月23日 申请日期2008年1月11日 优先权日2008年1月11日
发明者徐洪常 申请人:徐洪常
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1