三声码汉字编码方法及键盘的制作方法

文档序号:6601558阅读:409来源:国知局
专利名称:三声码汉字编码方法及键盘的制作方法
技术领域
本发明涉及一种利用计算机进行汉字输入的汉字编码方法及键盘。
目前用于计算机汉字输入的汉字编码方法很多,但实用的不多。从目前较通用的输入方法来看,易学的是拼音输入法,但重码率高,击次数多,输入速度慢;影响较大的是五笔字形拼形汉字输入方法,但由于它需要记忆一百多个基本字根及其键名,对于非专业打字人员一般因其难学而不学。
本发明的目的在于提供一种符合汉字规律的、简单易学不易忘记的且重码率低、输入速度快的汉字编码方法及键盘。
本发明的技术方案如下本发明根据汉字规律,即大部分汉字由两部分组成且组成部分一般为偏旁或字的特点,将汉字按基本笔划、基本偏旁和字根进行拆分,并根据人们对基本笔划、基本偏旁和字根的读音进行编码,从而使本发明既具有拼形码的重码少、输入快等优点,又具有拼音码简单易学不易忘记的优点。本发明的具体内容如下1、汉字的拆分首先利用特征字,即基本笔划。基本偏旁和字根,把汉字拆分成最小数目的特征字,并按特征字的多少,把汉字分为两类类型一特征字1+特征字2即只含两个特征字的字,如“李”=“木”+“子”,“好”=“女”+“子”。
类型二特征字1+X+特征字2即含两个以上特征字的字。X代表剩余部分的特征字,由于它们在编码时没有作用,所以我们通常不必关心它们,从而用“X”表示即可,如“朝”=“十”+“早”+“月”;“璞”=“王”+“业”+“兰”+“人”。
特征字1是包括字起笔的特征字,特征字2是指包括除特征字1笔划外末笔的特征字。另外,当字只有一笔时,则特征字1和特征字2视为相同。
在本发明中,基本笔划是指汉字中最基本的单笔,即点、横、竖、撇、捺、提、折、钩8种笔划,基本偏旁是指不是字但经常用来作为字的组成部分且人们较熟悉的连续笔划组合,如“氵、刂、阝、亻、讠、忄、犭、钅、、 彡、灬、扌、饣、辶”等;字根是指国标一二级汉字库中的汉字及其近似体,关于是否是字根,应根据以下原则确定(a)属于某字的放大体、缩小体、扁形体或长形体,但和原字相比,不得有明显的局部缩小或错位。例如“验”字中的字根“马”是“马”的长形体,但“娟”字中的“口”字相对“女”字有明显的缩小或错位,所以不能看成字根“如”。
(b)作为特征字1的字根可以是某字的平行分开体以在中间加入其他特征字。例如“衷”=“衣”+“中”,“街”=“行”+“圭”,“豆”=“二”+“口”+“丷”。
(c)在被拆分字中,除作为特征字1的字根其笔划可分前后两次书写外,其他的特征字均应是一次连续书写完。例如“重”不能拆成“千”+“日”+“二”,而只能拆成 +“一”+“申”+“二”。
(d)在被拆分字中字根的书写顺序应和单独书写该字的书写顺序一样。例如“里”字只能拆成“甲”+“二”,而不能拆成“日”+“土”。
(e)允许和标准字相比有一笔作相似的变化,例如“理”字中的字根“王”与标准字“王”相比,最后一横变成一提。
(f)在被拆分字中要能直观地看出该字根的存在。如“年”字从直观性考虑只可拆成 “ノ”+“X”+“十”,而不能拆成“午”+“X”+“一”。
(g)以下几个字根虽然不符合以上规则,但根据人们习惯认为是某字的字根, —雨, 罒—四, —西, —亦, —采, —木 —可 —水, —小在本发明中,对汉字的拆分还应遵循以下原则(a)最小原则尽量直观地用最少个数的特征字将汉字进行拆分。例如“意”字按最小原则应拆分为“音”+“心”,而不是“立”+“日”+“心”,同样,“璞”应拆分为“王”+“业”+“兰”+“人”,而不是“王”+“业”+“丷”+“二”+“大”,或“王”+“业”+“丷”+“一”+“夫”。
(b)最大原则在必须拆成两个以上的特征字时,则在兼顾直观性的情况下,优先选特征字1和特征字2包含笔划多的拆法。如“璞”字,按原则应拆成“王”+“业”+“兰”+“人”,而不是“王”+“业”+ +“”。
(c)连续原则在同样满足以上原则的情况下,优先取特征字笔划连续的一种拆法,当特征字1既可是笔划连续的字根或基本偏旁,又可是分前后两次写成的字根或基本偏旁,除了全包围结构字的特征字1均选“口”字外,其他均应优先选特征字1笔划连续的拆法。例如“土”字既可看成“十”+“一”,又可看成“二”+“丨”,按连续性原则,只能拆成“十”+“一”。
(d)小元优先原则将汉字拆成两个特征字时,在满足连续原则的情况下仍存在多种拆法时,则应在兼顾直观性和人们的习惯拆法的前提下,优先选特征字1包含笔划少的一种拆法。例如“元”字既可拆成“二”+“儿”,又可拆成“一”+“兀”按本原则则选后一种拆法。但对于“中”、“串”、“丰”等字,从直观性考虑,则应分别拆为“口”+“丨”, “吕”+“丨”,“三”+“丨”。
2、汉字的编码每个汉字(包括基本笔划和基本偏旁)的编码格式为字代码+特征字1编码的第m码+特征字2编码的第n码(m、n通常为1,某些情况可为2或3)。
在本发明中,编码分以下两种情况处理情况1字代码+特征字1编码的第一码+特征字2编码的第一码(即取m=1,n=1)由于特征字编码的第一码即为特征字的字代码,所以此时的编码也即为字代码+特征字1的字代码+特征字2的字代码。如“好”的编码为“HNZ”( H—“好”的声母,N—“女”的声母,Z—“子”的声母)情况2但当特征字2为字根且其代码与字代码相同时,编码为字代码+特征字1编码的第一码+特征字2编码的第二码。(即m=1,n=2)。
由于编码的第二码总为其特征字1的编码,所以此时的编码也即为字代码+特征字1的字代码+特征字2的特征字1”之字代码。如“理”的编码为“LWJ”(L—“理”的声母,W—“王”的声母,J—“里”的特征字1“甲”的声母)在本发明中,字代码(包括基本偏旁和基本笔划的代码)的选取方法如下a、汉字的字代码通常取该汉字的声母,无声母时取拼音的第一字母,如“发”的字代码“F”,“安”的字代码为“A”;但当为转舌的声母“zh”、“ch”、“sh”,字代码相应为“I”、“U”、“V”;当拼音首字母为“yu”时,字代码为“O”。对于多音字,可根据每个拼音来取代码,从而多音字可能有多个代码。
b、基本笔划的代码,取其笔划名称的拼音首字母,如下表笔划名称 代码 笔形笔形说明点 O 丶 包括斜点、竖点、长点横 H 一 包括长横、短横、斜横竖 S 丨 包括长竖、短竖、斜竖撇 P 丿 包括平撇、斜撇、竖撇捺 N  包括平捺、斜捺提 T 折 Z ∠ 包括横折、竖折、撇折、横 折折、竖折折、横折折折等钩 G 亅, 乚包括竖钩、卧钩、弯钩、斜钩 乙竖折钩、横折钩、横折折钩等C、基本偏旁的代码,分以下几种情况选取①当基本偏旁是由某字演变而来的,则取该字拼音的首字母,如下表偏旁代码例字说明亠E言(YEK) 由“二”(Er)演变B占(IBK) 由“卜”(Bu)演变亻R他(TRY) 由“人”(Ren)演变讠Y语(OYN) 由“言”(yan)演变クD久(JDN) 由“刀”(Dao)演变辶Z这(IWZ) 由“之”(zhi)演变礻S社(VST) 由“示”(shi)演变攵夂 W效(KJW),冬(OWL)由“文”(wen)演变忄 N怀(HXB)、恭(GGX)由“心”(xin)演变 K党(0XN),步(BIX) 由“小”(xiao)演变爫 Z受(VZY),豸(ZZL) 由“爪”(zhuo)演变衤Y初(UYO), 由“衣”(yi)演变 N告(GNK) 由“牛”(niu)演变钅J铁(TJK) 由“金”(jin)演变Z笔(BZN) 由“竹”(zhu)演变Z跑(PZH) 由“足”(zu)演变 U即(JGE)由 (Gen)演变 F疏(VPE)由“疋” (pi)演变  Y差(UVG),羔(GYS)由“羊”(Yang)演变 O然(WOS) 由“月”(YUe)演变
②当基本偏旁是某个常用字的偏旁,取该常用字拼音的首字母。如下表偏旁代码 例字 说明ㄨ Y (yyy),希(XYB) “义”(yi)字底 E 卷(JJE)“厄”(Er)字底扌 F 扑(PFB)“扶”(Fu)手旁匚 O 医(YQV)“区”(QU)字边 J 尸(VIP)“己(ji)字头 凵N 山(VSX)“凶”(xing)字底冂  J 冈(GIY) “同”(Tong)字头周(ETK),贝(BTR)廴 J延(YPJ) “建”(Jian)字底勹 B旬(NBR) “包”(Bao)字头宀 B定(DBP) “宝”(Bao)盖头艹 C节(JCE) “草”(Cao)字头纟(糸) S红(HSG) “丝”(Si)字旁系(KPS) B (OHB) “鼻”(Hi)字底饣 F 饿(EFW) “饭”食旁 Q 表(BQN),半(BLQ) “青”(Qing)字头彐( ,)K灵(LKH) 录(LXS)“雪”(Xue)字底尹(VRP) D秦(QCH) “春”(Chun)字头 J拳(QJV) “卷”“Juan”字头癶 D癸(GDT) “登”(Deng)字头 D裁(ZDN) “戴”(Dai)字头 O肃(SOS) “聿”(Yu)字头髟 B髦(WNT) “鬓”(Bin)字头③基本偏旁是由同一特征字或相同的笔划群重复而成却未构成字的基本偏旁,其代码取重复数字的拼音首字母。例如偏旁 代码 例字 说明 (冫,丷, L 冬(DWL) 两(Liang)点冰(BLV)半(BLQ)飞(FGL)L 坚(JLT) 两(Liang)竖帅(VLJ)齐(QWL) S 学(XSZ) 三(San)点彡 S 须(XSY) 三(San)撇灬 S热(RIS)四(Si)点 L琴(QIJ) 两(Liang)个“王” S桑(SSN)三(San)个“又” L嚣(XLY) 两(Liang)组“口口” L丝(SLH)两(Liang)组 ④当基本偏旁有常用名称时,取名称第一个字的拼音首字母。如下表偏旁代码 例字 说明阝(卩, ) E 队(OER),却(QQE) “耳(Er)旁卫(WEH)冖 P 写(XPQ) 平(Ping)宝盖⑤以下两个基本偏旁在汉字中较常用,为减少重码,作为特例,取其名称中某字的拼音韵母首字母,即偏旁代码 例字 说明氵 A 海(HAW) 三(san)点水刂 A 到(DIA) 利刀(dao)旁在本发明中,如果汉字是多音字且声母不同,则由于有多个字代码,该汉字有多个编码,如果字根是多音字根且有多个编码,则按以下方法选取一个编码为被编码字进行偏码a、著多个编码中有一个编码其第一码与被编码字的字代码相同,则选该编码;b、否则,选常用的一个编码。
综上所述,本发明利用汉字的读音和基本偏旁及笔划的代码,对汉字采用三码编码,由于汉字的读音和基本偏旁及笔划的名称,对具有一般汉语知识的人都很熟悉,且只需将汉字拆出两部分,拆字非常简单,所以三声码汉字输入法具有简单易学,容易掌握而又不会忘记的特点,是一种基于拼音、非常简单实用的编码方法,该方法概括起来可为两句话“设法把字拆两字,三声合成即是码;合成要顾前和后,声母相同要变码。”由于编码总为字和前后两个特征字的声母或相关字的声母,故本发明命名为“三声码汉字编码方法”。
3、汉字的选择码。
在本发明中采用三码编码使得编码简单易学的特点,非常适合一般人员使用,但用三码编码时有一定的重码,为适应专业打字员盲打的需要,在编码后可加一选择码,以代替数字键选择所需要的汉字。当编码无重码时,选择码无意义,因用任何选择码都可选择该字,选择码的编码方法是a、对于类型二的字,取剩余特征字中最后一个特征字的字代码,即包含剩余笔划最后一笔的特征字代码。例如例字编码选择码说明以 YZR D 剩余特征字只有一个基本笔划点,其代码为D。掌IXV K 剩余特征字有“冖”和“口”,包含剩余笔划末笔的特征字为“口”而“口的字代码为“K”。
b、对于类型一的字,选择码要分三种情况选取①当特征字1为字根,特征字2为基本笔划、基本偏旁或“心”字、“鸟”字时,选特征字1编码的第二码。例如“术”(VMO)的选择码为“V”,因特征字1“木”的编码为“MVB”,同样,“选”(XXZ)的选择码“N”,“忘”(WWX)的选择码为“E;“鹉”(WWN)的选择码为“E”。
②对于全包围结构的汉字,均选特征字1“口”(KSJ)的第二码“S”。例如“囤”、“固”等字的选择码均为“S”。
③其他情况,均选特征字2编码的第二码或第三码(当第二码已作编码时就顺取第三码)。例如“拼”(PFB)的选择码为L1“码”(MUZ)的选择码为H,因“马”(MZH)的第二码已作编码用,故取第三码“H”。
使用选择码可以进行盲打,大大提高输入速度,但是要以熟悉选择码为代价,作为非专业打字人员,一般用数字选择重码字就行了,因为对于常用字,需要用选择码的不多。
4、使用的键盘利用本发明的汉字输入方法所使用的键盘,是采用标准键盘,并使标准键盘上的各字母键与汉字拼音的声母字母相对应,或与无声母汉字的拼音首字母相对应。字母键上的字母“I”、“U”、“V”分别与拼音卷舌声母“zh”、“ch”、“sh”相对应。另外,拼音以“YU”为首的汉字,其字代码一律为“0”,例如“于”(yu)和“运”(yun)的字代码均为“0”。
5、其他在本发明中利用字编码可实现简单方便的词组编码方案。词组编码采用四码,使字的编码和词的编码完全分开,这样有利于向“以字为基础、以词为主导”的快速输入汉字技术方向发展。
为减少重码,提高汉字输入速度,还可采用一级简码字和词、二极简码字和词、高频字处理、智能修改一、二级简码字等方法。
考虑到汉字的一字多音、拆分非单一化等特点,对某些汉字增设了容错码,即允许某些汉字有不同的编码。例如“董”的正确码为“OCU”,容错码为“DCI”;“坐”的正确码为“ZCE”,容错码为“ZCT”。
综上所述,本发明兼具拼音码和拼形码的优点,易学易记,重码率低,一般采用三码,击键次数少,实用性强,汉字输人速度快。本发明在汉字拼形中采用少量的基本笔划、基本偏旁和大量的汉字为要素,其代码极易掌握,无须强记,只要熟悉拼音即可输入汉字,对具有汉语普通话知识的人员,一说就会,一用就熟,特别适合于非专业打字人员。通过增加一选择码,又使本发明适合专业打字人员。本发明符合汉字规律和人们拆字认字的习惯,简单实用,适用面广。
权利要求
1.一种三声码汉字编码方法,其特征在于a、利用特征字(包括汉字、汉字的基本笔划和基本偏旁)将汉字拆分成两个或两个以上的特征字,并按特征字的多少把汉字分为两类类型一特征字1+特征字2,即只包含两个特征字的字;类型二特征字1+X+特征字2,即含两个以上特征字的字;X—代表剩余部分的特征字,其中特征字1是指包含汉字起笔的特征字,特征字2是指包含除特征字1笔划外的末笔的特征字;b、对任何汉字(包括基本偏旁和基本笔划)按以下递推规则进行编码字编码=字代码+特征字1编码的第n码+特征字2编码的第n码(m、n通常为1在某些情况下也可为2或3)其中字代码,即被编码汉字、基本偏旁或基本笔划的代码按以下方法选取①对于汉字,取该汉字汉语拼音的声母或第一个字母;②对于基本笔划,取笔划名称字之汉语拼音的第一个字母;③对于基本偏旁,取与其有关的演变字、常用字或通用名中第一个字之汉语拼音的第一个字母;c、对每个汉字还可增加一选择码但不是必须,因其作用只是当有重码时代替数字键选择所需的汉字,当无重码时,选择码无意义,选择码的选取方法是选择码=特征字1或特征字2编码的第S码(S=2或3)或剩余部分中最后一个特征字的字代码。
2.根据权利要求1所述的三声码汉字编码方法,其特征在于a、特征字是基本笔划、基本偏旁和字根的统称;b、基本笔划是指汉字中最基本的单笔,即点、横、竖、撇、捺、提、折、钩8种笔划;c、基本偏旁是指经常用来作为字的组成部分但又不是汉字的笔划群;d、字根是指国标一、二级汉字库中的汉字或其近似体。
3.根据权利要求1所述的三声码汉字编码方法,其特征在于a、字代码是被编码字代码、基本偏旁代码和基本笔划代码的统称;b、被编码字代码按以下方法选取①该字汉语拼音之声母为“zh”、“ch”、“sh”时,其字代码相应的为“I、“U”、“V”;②该字汉语拼音的头两个字母为“yu”时,其字代码为“0”;③其他情况,均为该字汉语拼音的第一个字母;c、基本笔划的代码均取笔划名称汉语拼音的头一个字母;d、基本偏旁的代码按以下几种方法选取;①是由某个字演变而来的基本偏旁,取该字汉语拼音的头一个字母;②属于某个常用字的基本偏旁,取该常用字汉语拼音的头一个字母;③由同一特征字重复或相同笔划群重复而成的基本偏旁,取重复数拼音的头一个字母;④有通用名称的基本偏旁,取通用名称之第一个字汉语拼音的第一个字母;⑤个别的取通用名称的某字汉语拼音韵母的第一个字母。
4.根据权利要求1所述的三声码汉字编码方法,其特征在于对汉字进行拆分时要遵循以下几条原则a、最小原则尽量直观地用最小个数的特征字将汉字进行拆分;b、最大原则在必须拆成两个以上的特征字时则在兼顾直观性的情况下,优先选特征字1和特征字2包含笔划多的拆法;c、连续原则在同样满足以上原则的情况下,优先用笔划连续的特征字进行拆分;d、小元优先原则将汉字拆成两个特征字时,在满足连续原则的情况下仍有多种拆法时,则在兼顾直观性和人们的习惯拆法前提下,优先选用特征字1笔划少的拆法。
5.根据权利要求1所述的三声码汉字编码方法,其特征在于a、汉字的编码通常为被编码字代码+特征字1编码的第一码+特征字2编码的第一码,即被编码字代码+特征字1代码+特征字2代码,当特征字1和2均为字根时,则编码为被编码声母或首字母+特征字1声母或首字母+特征字2声母或首字母;b、但当特征字2是字根且其代码与被编码的字代码相同时,则编码为被编码字代码+特征字1编码的第一码+特征字2编码的第二码,即被编码字代码+特征字1代码+特征字2的“特征字1之代码”,这种情况属于三声码编码方法的变码情况。
6.根据权利要求1所述的三声码汉字编码方法,其特征在于每个汉字的编码为三码,其后还可增加一选择码以代替数字键选择所需的字,从而可进行盲打提高输入速度,选择码的选取方法是a、对于类型二的字,其选择码取剩余特征字中最后一个特征字(即包含剩余笔划末笔的特征字)的字代码;b、对于类型一的字,其选择码分三种情况选取①当特征字1为字根,特征字2为基本笔划、基本偏旁或为“心”、“鸟”字时,选特征字1编码的第二码,即特征字1的“特征字1”之字代码;②对全包围结构汉字,均选其特征字1“口”的第2码“S”为选择码;③其他情况,均选特征字2编码的第2码或第3码为选择码,一般取特征字2编码的第2码,即特征字2之“特征字1”的代码,但当该代码已作编码时,则取第3码,即特征字2之“特征字2”的代码。
7.根据权利要求1所述三声码汉字编码方法所用的键盘,其特征在于标准键盘上的字母键与汉字拼音的声母字母相对应,或与无声母汉字拼音的第一个字母相对应,而字母键上的“I”、“U”、“V”分别与拼音“zh、“ch”、“sh”相对应。
全文摘要
本发明涉及计算机汉字输入法,其特点是将汉字的首尾二个笔划群划分为由基本笔划、基本偏旁或字根构成的特征字1和特征字2,汉字编码的首码取其拼音的声母或首字母,其后是特征字1和2代码,共三码,特征字代码可为基本笔划名称的拼音首字母、字根字首字母、基本偏旁名称拼音首字母或与其有关的演变字、常用字的拼音首字母;本发明所用键盘上的字母与拼音声母或首字母相对应。本发明易学易记,重码少,输入汉字速度快,实用性强。
文档编号G06F3/023GK1143215SQ9511065
公开日1997年2月19日 申请日期1995年3月3日 优先权日1995年3月3日
发明者朱荣华 申请人:朱荣华
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1