结构型汉字编码输入法的制作方法

文档序号:6406269阅读:323来源:国知局
专利名称:结构型汉字编码输入法的制作方法
技术领域
本发明涉及一种汉字编码输入技术,特别涉及在计算机、打字机及类似装置上使用的汉字编码输入方式的文字处理系统。
随着微型计算机在各个领域的广泛使用,国内外的研究人员通过对微型计算机上流行的行编辑程序以及字处理系统进行改造,已将其用于对汉字的输入与编辑。在汉字输入方法上应用面较广泛的几种汉字操作系统中,主要配备了拼音、联系、区位、国标、电报、首尾、五笔字型等汉字输入方案。其中“五笔字型”是目前国内影响较大,应用面较广,公认使用较为方便合理的一种汉字输入法。虽然“五笔字型”汉字输入方法比较直观易学,输入速度也较快,但由于其必须使用二十五个字母键来表示125个字根,在每个键位上一般安排有2至6种字根,键入字根时,需要查找各基本字根所在的键位,操作者在指法上必须经过较长时间的专门训练、熟练记忆并掌握各字根所在的键位,才能达到一定的操作速度和实现盲打,训练时间较长,记忆量较大,不便于迅速普及推广。
本发明的目的在于提供一种操作更为简便迅度的汉字编码输入方法。
当我们对汉字字形加以分析,就能得出这样的结论,有的汉字可以分析出几个具有独立意义的汉字,有的汉字却不能再行分析,那些不能再行分析的具有完整形体和独立造字意图的汉字,我们称之为独体字。而那些由两个或两个以上的独体字按一定的组合规律组合而成的,有一定造字意图的汉字,称之为合体字。部首是指不具有独立造字意图的,但具有完整的形体,与独体字能够构成合体字的单位,部首中有的是独体字的变形,更多的则是纯粹的结构符号。当我们把部首和独体字称为字根时,也可以说汉字是以字根为单位,采用积木方式拼合起来的,而字根又由笔形构成。也就是说把每个字根机械地进行分析,就可得到若干的笔形,每个字根都具有一定数目的笔形,笔形的数量我们称之为笔画。
本发明就是利用了汉字组合的这一特征,设计出结构型汉字编码方案的。
本发明是这样实现的。
本发明涉及一种在计算机、打字机及类似装置上使用汉字编码输入方式的文书处理系统,在该文书处理系统中的操作键盘上至少包括下列操作键功能键,即用于决定操作时编码的输入方式的键;
数字键,即用于输入汉字编码的键;
选字键,即用于对提示行上的字进行选择的键;
空格键,即用于要求继续提示的键;
清除键,即用于作废某一次字码输入的键;
对于错误码或不存在的字码的输入,系统会自动作废该次输入,并发出信号,等待新的输入,本发明特征在于在对上述数字键进行操作时,所采用的汉字编码输入方法为一、将独体字的编码按照第一码取该字的笔画,即字码,第二码补零,第三码取该字的起笔笔形代码,第四码取该字的收笔笔形代码。
上述编码中所提到的笔形是指构成现代汉字的各种点和线的形状。为了适合汉字编码技术的需要,我们将各种笔形概括为五种笔形,即横、竖、捺、撇、勾。依其使用频度,设立相应的代码为0、9、8、7、6。即下列笔形配上下列相应的笔形为0-横-一ㄥ
9-竖-丨
亅8-捺-
丶ㄑ7-撇-丿フ
6-勾-乙乚乛了
由上述规则可见,下列独体字的编码为手4079,笔画4,补0,起笔笔形代码7,收笔笔形代码9。
良7088,笔画7,补0,起笔笔形代码8,收笔笔形代码8。
二、将合体字的编码按照笔形的书写顺序“读”出组成合体字的各个部件(包括独体字、部首或笔形)的笔画数(即字码或代码,一般为0-9)的一组四位码作为该合体字的编码。
a、如果一个合体字的部件超过四部时,按汉字的结构取前四部笔画编码,例如嘲3242口-3,十-2,日-4,十-2橙4513木-4,癶-5,一-1,口-3滚3222氵-3,亠-2,八-2,厶-2b、如果一个合体字的部件刚好四部时按汉字的结构顺序依次取四部笔画,构成汉字的四位编码,例如路3433口-3,止-4,夂-3,口-3统3222纟-3,亠-2,厶-2,儿-2常3233-3,冖-2,口-3,巾-3c、如果一个合体字的部件为三部时按汉字的结构顺序依次取三部笔画,第四码取该字末部的收笔笔形代码,如程5340禾-5,口-3,王-4,收笔“一”的笔形代码为0,黄4528-4,由-5,八-2,收笔“丶”的笔形代码为8,d、如果一个合体字的部件为二部时按汉字的结构顺序依次取二部笔画,第三、四码取末部的起笔及收笔笔形代码,如取6278 耳-6,又-2,又的起笔笔形“
”代码为7,收笔笔形“
”代码为8,三、词汇编码,在中文中,由单字可以组成成千上万条的词汇,且字和词是混合在一起使用的,为了体现中文汉字的这一特点,在以单字编码为基础上,结构型设立了词汇编码,使系统既能准确地处理尽可能多的单字,又能有效地处理常用词汇。为了相应地提高输入速度,所有词汇编码一律为等长四码,其码型与单字码完全相同。词汇编码按组成词汇的单字数,分为双字词、三字词、四字词和多字词四种情况,其输入方式如下a、双字词取每个单字的前二码,组成四位码,如果词汇中的字为独体字,则按该独体字的笔画取两个相同的重码,如对待2332一定1135滋长3344b、三字词取前两个字的第一码,最后一个字的前两码,(若最后一个字为独体字时,取相同码)组成四码,如新技术2355计算机2642微型机3142c、四字词每个字各取其第一码,组成四码,如中外合资4332家用电器3253自动控制6232d、多字词取前四个单字的第一码,组成四码,如中国科学院4353中华人民共和国4225本发明的结构型汉字编码输入方法是将汉字分析为独体字、部首和笔形三部分,由于只利用0~9十个数字键,因此不需要经过专门的指法训练,就能实现对汉字及其词汇进行直观快速的编码输入(即实现盲打),做到见字识码,会写就会输入,且简明易学,记忆量少,本编码的输入方法对简体字和繁体字均可适用。
采用本编码法出现重码字时,可以采用按其实用频度作分级处理的办法。即较常用的字首先显示在显示行的正常编辑位置上,若正好是用这个常用字,可继续输入下文,此字会自动显示在正常编辑位置上,而不影响输入速度。如果需要的是不常用的字,只需按与该字在提示行中的序号相同的数字键,所要的字即可显示在现行编辑位置上。重码时也可采用拼音字母进行选字,即当出现重码时,只需按与该字的第一个拼音字母相同的字母键,所要的字即可显示在现行编辑位置上,从而大大地缩短了重码的选择。
参见附图
,这是作为一个实施例的操作键盘,采用结构型汉字编码输入法必须至少具有下述操作键并且按下述规程操作1、功能键(1),位于键盘的左边,用于决定操作时编码的输入方法的键,因为一个文字处理系统可以同时采用几种汉字输入方法进行操作,所以必须通过功能键进行转换。
2、数字键(2),位于键盘的右边,用于输入汉字编码的键,键入一经开始显示器的正常编辑位置上立即显示与键入的编码相对应的汉字。
3、数字选字键(3),位于键盘的顶部,用于对提示行按频度顺序出现的字进行选择的键,由于在做了上述操作后,所要的汉字按频度顺序停留在提示行上,故需按与所要字在提示行中的序号相同的数字选字键。(包括0-9,10个数字键)。
或采用字母选字键(4),位于键盘的中央,用于对提示行中按拼音的第一个字母出现的字进行选择的键(包括26个字母键)。
4、空格键(5),位于键盘的下部,用于要求继续提示选字的键,若提示行所提示的五个或十个汉字中,没有所要求的汉字,这时须按下空格键,要求继续提示,然后用选字键输入。
5、清除键(6),键盘中的ESC键被定义为清除键,是用于作废其一次字码输入的键,即当操作者误打为另一组编码时,具有清除该编码的功能。
至于错误码或不存在字码的输入,系统会自动作废该次输入。
为了方便掌握汉字的部首及独体字,充分有效地使用本编码法,现列出《汉字部首及字例表》以及《独体字及其检码表》。
彡3077
3077 凡3078 么3078 及3078久3078夕3078叉3078丸3078勺3078孓3078夂3078夊3078矢3078个3079千3079川3079彳3079女3080亡3080门3086宀3086广3087之3088义3088巛3088丫3089口3090上3090马3090囗3090彐3090己3096弓3096已3096巳3096尸3097小3098山3099巾3099弋3008四画王4000 巨4000 廿4000
4000
4000无4006丐4006屯4006丏4006旡4006兂4006牙4007毋4007不4008木4008太4008犬4008专4008瓦4008歹4008尤4008 戈4008
4008 不4008 中4009车4009丰4009井4009韦4009卅4009爿4009币4009母4009卐4009月4070鸟4070丘4070壬4070毛4076片4076氏4076 冘4076 今4077 勿4077
4077长4078乏4078爪4078丹4078夭4078
4078 手4079 升4079 斤4079 牛4079予4079币4079方4080方4087户4087
心4088为4088火4088卞4088日4090止4090丑4090日4090市4090见4096巴4096少4097尹4097水4098书4098尺4098肀4099弔4099五画本5000世5000甘5000玉5008东5008母5008术5008丙5008未5008末5008
5008 木5008
5008 玉5008 戋5008卌5009
5009 疋5068 白5070 生5070乍5070矛5077鸟5078禾5078令5078皮5078乐5078瓜5078斥5078氐5078癶5078乎5079主5080必5087永5088四5090目5090且5090田5090由5090业5090皿5090冉5090凹5090凸5090
5090
5090
5090 电5096 民5096
5096
5098 水5098 甲5099 申5099
5099六画西6000 耳6000 臣6000 互6000
6000
6006 米6008 页6008 而6009
6009
权利要求
1.一种结构型汉字编码输入法,特别是在计算机、打字机及类似装置上使用汉字编码输入法的文书处理系统,在该文书处理系统中的键盘上至少包括下列操作键功能键,即用于决定操作时编码的输入方式的键;数字键,即用于输入汉字编码的键(一般只采用0-9,10个数字键);选字键,即用于对提示行上的字进行选择的键(包括0-9,10个数字键以及26个相对于汉字读音的字母键);空格键,即用于要求继续提示的键;清除键,即用于作废某一次字码输入的键;对于错误码或不存在的字码的输入,系统会自动作废该次输入,并发出信号,等待新的输入,本发明的特征在于,在对上述数字键进行操作时,所采用的汉字编码输入方法为A、将独体字的编码按照第一码取该字的笔画,即字码,第二码补零,第三码取该字的起笔笔形代码,第四码取该字的收笔笔形代码,这样一种四位码的方式输入;或B、将合体字的编码按照笔形的书写顺序“读”出组成合体字的各个部件(包括独体字、部首或笔形)的笔画(即字码)或笔形代码组成的一组四位码作为该合体字的编码。a、当一个合体字的部件超过四部时按汉字的结构取前四部笔画编码,b、当一个合体字的部件刚好四部时按汉字的结构顺序依次取四部笔画,构成汉字的四位编码,c、当合体字的部件为三部时按汉字的结构顺序依次取三部笔画,第四码取该字末部的收笔笔形代码,如d、当合体字的部件为二部时按汉字的结构顺序依次取二部笔画,第三、四码取末部的起笔及收笔笔形代码,或C、将词汇编码按照如下方式输入a、双字词取每个单字的前二码,组成四位码,如果词汇中的字为独体字,则按该独体字的笔画取两个相同的重码,b、三字词取前两个字的第一码,最后一个字的前两码,c、四字词每个字各取其第一码,组成四码,d、多字词取前四个单字的第一码,组成四码。
2.根据权利要求1所述的结构型汉字编码输入法,其特征在于上述代码代表的笔形为0-一
レ9-丨
亅8-
丶く7-丿フ
6-乙乚乛了
3.根据权利要求1所述的结构型汉字编码输入法,其特征在于重码的处理方法是在按本编码法输入编码后,再输入所需汉字的头一个拼音字母,此字即首先显示在屏幕正常的编辑位置上,不需作任何处理,即可正常继续键入。
全文摘要
本发明涉及一种结构型汉字编码输入技术,特别涉及在计算机、打字机及类似装置上使用的汉字编码输入方式的文字处理系统。本发明是将汉字分解为独体字、部首和笔形三部分,利用0—9十个数字键对汉字进行编码。利用本发明方法不需经过专门的指法训练,就能实现对汉字及其词汇进行直观快速的编码输入,做到见字识码,会写就会输入,且简明易学,记忆量少,本编码的输入法对简体字和繁体字均可适用。
文档编号G06F3/023GK1069350SQ9110405
公开日1993年2月24日 申请日期1991年8月4日 优先权日1991年8月4日
发明者黄文智 申请人:黄文智
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1