改进结构型汉字编码输入法的制作方法

文档序号:6406581阅读:299来源:国知局
专利名称:改进结构型汉字编码输入法的制作方法
技术领域
本发明涉及一种汉字编码输入技术,特别涉及在计算机、打字机及类似装置上使用的汉字编码输入方式的汉字操作系统。
随着计算机在国内应用的推广和普及,已经出现了各种各样的汉字输入方法。目前,在微型机上应用面较广的几种汉字操作系统中,主要配备了拼音、联想、区位、国标、电报、首尾、二维三码、王码(五笔字型)、自然码等汉字输入方式。其中“五笔字型”汉字输入法是目前国内影响较大、应用面很广,公认使用较为方便合理的一种快速汉字输入法。虽然“五笔字型”输入法具有见字识码,会写就会输入,输入速度很快等优点,但同样存在着一定的不足之处,例如使用二十五个字母键来表示125个字根,在每个键位上一般安排2~6种字根,键入字根编码时,除了需要熟练记忆并掌握不同的125种字根外,还需要查找各基本字根所对应的字母键位。操作者在指法上还须经过专门训练,才能达到一定的编码操作速度和实现盲打;以及不便于迅速普及推广等。
本发明的目的在于提供一种操作更为简便迅速且易于推广普及的汉字编码输入方法。
当我们对汉字字形加以分析后,就能得出这样的结论,汉字可以采用积木式拼合起来(王永民正是利用汉字这一特点,设计出五笔字型汉字输入法)。一般汉字可以分析出几个具有独立意义的汉字,有的则不能再行分析。那些不能再行分析的具有完整形体和独立造字意图的汉字,我们称之为独体字(五笔字型称为键名或成字字根)。那些不具有独立造字意图的,但具有完整的形体;与独体字能够组成合体字的单位,我们称之为部首。部首中有的是独体字的变形,有的则是纯粹的结构符号(五笔字型称从属字根)。当我们把部首和独体字称为字根时,也可以说汉字是以字根为单位,采用积木式拼合起来的。而当我们把每个字根再进行机械地分析,就可得到这样的结论,每个字根都是由一定数目的笔形构成的。笔形的数量我们称之为笔画。
本发明就是利用了汉字组合的这一特征,设计出改进结构型汉字编码方案的。
本发明是这样实现的。
本发明涉及一种在计算机、打字机及类似装置上使用汉字编码输入方式的汉字操作系统,在运行该汉字程序系统中的操作键盘上至少包括下列操作键
功能键,即用于决定操作时编码输入方式的键;
数字键,即用于输入汉字编码的键;
选字键,即用于对提示行上显示的字进行选择的键;
空格键,即用于要求继续提示的键;
清除键,即用于作废某一次字码输入的键;
识别键,即用于识别词汇编码输入的键;
对于错误码或不存在字码的输入,程序自动响铃提示,并自动删除该次输入,等待新的输入。
本发明的特征在于,在对上述数字键进行操作时,所采用的汉字编码输入方法为
一、将独体字的编码按照第一码取该字的笔画,即字码,第二、三码取该字的起笔和次笔笔形代码,第四码取该字的收笔笔形代码,不足四码的补零,这样一种四位码的方式输入。
上述编码中所提到的笔形是指构成现代汉字的各种点和线的形状。为适合汉字编码技术的需要,我们将各种笔形概括为五种,即横、竖、撇、捺、勾。依其使用频度设立相应的代码为0、9、8、7、6。即下列的笔形代码配上相应的笔形为
0-横-一
9-竖-丨 亅
8-撇-丿
7-捺-丶
乀 ㄑ
6-勾-乙 乚  乛 ㄋ
此笔形代码同样适用于合体字编码中的笔形代码。
由上述规则可见,下列独体字的编码为
厂2080 字码2,起笔代码0,次笔代码8,不足四码补0。
口3990 字码3,起笔代码9,次笔代码9,收笔代码0。
水4987 字码4,起笔代码9,次笔代码8,收笔代码7。
二、将合体字的编码按照笔形的书写顺序“读出”组成合体字的各个部件(包括独体字、部首或笔形)的笔画(即字码)或笔形代码构成的一组四位码作为该合体字的编码。
a.如果一个合体字的组成部件超过四部时,按该字的结构顺序依次取第一、二、三、末部笔画编码,例如
攀4224 木-4,
-2,
-2,手-4
滚3224 氵-3,亠-2,八-2,
-4
倒2122 亻-2,一-1,厶-2,刂-2
b.如果一个合体字的组成部件刚好四部时,按该字的结构顺序依次取四部笔画编码,例如
路3433 口-3,止-4,攵-3,口-3
照4234 日-4,刀-2,口-3,灬-4
镜5542 钅-5,立-5,日-4,儿-2
c.如果一个合体字的组成部件为三部时,按该字的结构顺序依次取三部笔画编码,第四码取该字末部的收笔笔形代码,例如
黄4527,-4,由-5,八-2,末部八的收笔笔形代码为7。
惭3449,忄-3,车-4,斤-4,末部斤的收笔笔形代码为9。
温3450,氵-3,日-4,皿-5,末部皿的收笔笔形代码为0。
d.如果一个合体字的组成部件为二部时,按该字的结构顺序依次取二部笔画编码,第三、四码分别取该字首部的起笔笔形代码和该字末部的收笔笔形代码,例如
地3306,土-3,也-3,首部土的起笔笔形代码为0,末部也的收笔笔形代码为6。
肥4486,月-4,巴-4,首部月的起笔笔形代码为8,末部巴的收笔笔形代码为6
季5380,禾-5,子-3,首部禾的起笔笔形代码为8,末部子的收笔笔形代码为0。
三、词汇编码,中文中由单字(独体字和合体字)可以组成词汇,且字和词是混合在一起使用的。为了体现中文的这一特点,改进结构型在以单字编码的基础上,设立了词汇编码,使系统既能准确地处理尽可能多的单字,又能有效地处理常用词汇。为了相应地提高字词的输入速度,所有的词汇编码一律为等长四码,其码型与单字编码完全相同。词汇编码按组成词汇的单字数,分为双字词、三字词、四字词和多字词四种。为了降低字词间重码,在“改进结构型”状态下,每键入一条词组前,首先应键入一个DEL键,作为词汇编码识别符,系统自动处于改进结构型输入状态,DEL键即被定义为词汇识别符。然后将词汇编码按照如下方式输入
a.双字词取每个单字全码的前两码构成四码,如
微机3342 智能2324 技工3230
b.三字词取前两个单字的第一码,最后一个单字的前两码构成四码,如
计算机2642 座右铭3253
c.四字词每字各取其全码的第一码构成四码,如
科技市场5323 数据处理6334
d.多字词取第一、二、三、及最末一个单字的第一码,构成四码,如
国防科工委3255 汉字操作系统3333
本发明的改进结构型汉字编码输入方法是将汉字分析为独体字、部首和笔形三部分,以笔画为键入编码。由于只利用0~9十个数字键,因而不需要经过专门的指法训练,就能实现对单字及词汇进行直观快速的编码输入(即实现盲打),做到见字识码,会写就会输入,且简明易学,记忆量少。本编码法对简化字和繁体字均可适用,同时,本输入法可以作为汉字编码检索方法进行推广普及应用。
采用本编码法出现重码字时,可以采用按其重码字实用频度作分级处理的办法。
为了更进一步地提高重码字的选择输入,当采用本编码法进行编码出现重码字时,对于能读出所需字或词的拼音,则再键入一个字音码进行选择。即对于单字重码时,再加上一个与该字拼音第一个字母相同的英文字母键;对于词汇重码时,则再加上一个与该词汇最后一个单字拼音第一个字母相同的英文字母键。若仍出现重码字,则重码采用实用频度作分级处理。
为了提高常用汉字的输入速度,本方案设立了简码输入法。即对常用的汉字只取其全码的第一个、两个或三个字码,构成一级、二级或三级简码汉字,简码汉字不考虑笔形代码。简码共分为两类,每类分三级。
第一类为,在键入简码后,再加打空格键即可输入。
第二类为,在键入简码后,再加打字音码即可输入。
参见附图
,这是作为一个实施例的操作键盘,采用改进结构型汉字编码输入法必须至少具有下述操作键并且按下述规程操作
1.功能键(1),位于键盘左边,用于决定操作时选择编码输入方式的键,因一个汉字操作系统通常采用几种汉字输入法进行选择操作,功能键用于转换任一种输入法。
2.数字键(2),位于键盘右边,用于输入汉字编码的键,当键入一组编码,显示器将显示与该编码相对应的字词。
3.数字选字键(3),位于键盘的顶部,用于对提示行中按实用频度排列出现的字进行选择的键,由于在做了上述操作后,所要的字词按频度顺序显示在提示行上,故需键入与所需要字在提示行中序号相应的数字键。
4.字母选字键(4),位于键盘中央,用于采用字音码选择重码的键(包括与23个汉语拼音相对应的23个字母键)。
5.空格键(5),位于键盘下部,用于要求继续提示待选字的键,若一次提示行中没有所需要的待选字,这时须按空格键,提示行自动显示下一批待选字。
6.清除键(6),键盘中的ESC键被定义为清除键,用于作废某一次编码输入的键。
7.识别键(7),键盘中的DEL键被定义为识别键,用于识别词汇编码输入的键。
至于错误码或不存在字码的输入,程序自动响铃提示,并自动删除该次输入。
为方便掌握并充分有效地使用本编码法,以下列出字根总表。本表适用于简化字编码输入方案。分独体字和部首表,并按笔画顺序排列。其中“部首”表中也包括部分不常用独体字,< >内为前一字根的变形。<注在各种可能的字根分析中,应按取尽可能大的字根进行编码。>
独体字
一画一 乙()
二画八(
)卜(
)厂 刀()丁 儿 二 几(
)九 力 了 乃 七 人(人) 入 十 又(
) 丌 匕(
)乜 厶
三画才 川(
)寸 大 干 工 弓 广 已 巾 口 马 门 女 千 三 山 上 尸 士 巳 土 万 亡 夕 乡 小()也 已 于 与 丈 之 子(孑) 弋 彳 孑 孓 幺
四画巴 贝 不 长 车 丰(
) 夫 戈 火 见 斤 井 巨 六 毛 木 牛(
)片 壬 日 氏 手(
)书 水(氺)屯 瓦 王 韦 乌 毋(
) 五 心 牙 尹 日(曰)月(月)止 爪(爫
)廿 爿
五画白 电(
) 瓜 禾(禾)甲 立 民 皿 母 目 鸟 皮 且 丘 申 石 四(罒)田 穴 业 永 由 戋 疋(
)
六画臣 虫 而 耳 臼 米(※)曲 西(西)血(
) 页 曳 羽 舟 竹()自 耒 艮(
)
七画甫 身 辛 言 酉 豕
八画金(
)鱼 雨(
)
部首
一画丨 丿 丶 
二画匚 刂 (刂
)冂(冂
)亻 勹()亠 冫
讠 阝 卩() 廴 凵  (
)

(
) 
三画艹 廾 扌 尢 囗 彡 犭(
) 夂(攵) 饣 忄()丬 氵 宀 辶 彐(
)屮(
) 纟 巛
)

四画攵 灬 礻 肀  耂 
五画钅 疒 衤  癶
六画虍 
七画

权利要求
1、一种改进结构型汉字编码输入法,特别是在计算机、打字机及类似装置上使用汉字编码输入法的汉字操作系统,在运行该汉字程序系统中的键盘上至少包括下列操作键
功能键,即用于决定操作时编码的输入方式的键;
数字键,即用于输入汉字编码的键(采用副键盘十个数字键);
选字键,即用于对提示行上的字进行选择的键(采用打字机键盘上的十个数字键)
空格键,即用于要求继续提示的键;
清除键,即用于作废某一次字码输入的键;
识别键,即用于识别词汇编码输入的键;
对于错误码或不存在字码的输入,程序自动响铃提示,并自动删除该次输入,等待新的输入。
本发明的特征在于,在对上述数字键进行操作时,所采用的汉字编码输入方法为
A将独体字的编码按照第一码取该字的笔画,即字码,第二、三码取该字的起笔和次笔笔形代码,第四码取该字的收笔笔形代码,不足四码的补零,这样一种四位码的方式输入
或B,将合体字的编码按照笔形的书写顺序“读出”组成合体字的各个部件(包括独体字、部首或笔形)的笔画(即字码)或笔形代码构成的一组四位码作为该合体字的编码。
a.当一个合体字的组成部件超过四部时按该字的结构顺序依次取第一、二、三、末部笔画,构成四位编码。
b.当一个合体字的组成部件刚好四部时按该字的结构顺序依次取四部笔画,构成四位编码。
c.当一个合体字的组成部件为三部时按该字的结构顺序依次取三部笔画,第四码取该字末部的收笔笔形代码。
d.当一个合体字的组成部件为二部时按该字的结构顺序依次取二部笔画,第三、四码分别取该字首部的起笔笔形代码和该字末部的收笔笔形代码。
或C,在“改进结构型”状态下,每键入一条词组前,首先应键入一个DEL键,作为词汇编码识别符,然后将词汇编码按照如下方式输入
a.双字词取每个单字全码的前两码构成四码。
b.三字词取前两个单字的第一码,最后一个单字的前两码构成四码。
c.四字词每字各取其全码的第一码构成四码。
d.多字词取第一、二、三、及最末一个单字的第一码,构成四位码。
2、根据权利要求1所述的改进结构型汉字编码输入法,其特征在于上述笔形代码代表的笔形为
0-横-一
9-竖-丨 亅
8-撇-丿
7-捺-丶

6-勾-乙 乚  乛 ㄋ
3、根据权利要求1所述的改进结构型汉字编码输入法,其特征在于重码的处理是在键入按本编码法输入的四位码字后,再加上一个字音码输入进行重码字的选择。若仍出现重码,则重码字采用实用频度作分级处理。
4、根据权利要求1和3所述的改进结构型汉字编码输入法,其特征在于当对常用的汉字进行编码时,可取其简码输入。
全文摘要
本发明涉及一种改进结构型汉字编码输入技术,特别涉及在计算机、打字机及类似装置上使用的汉字编码输入方式的汉字操作系统。本发明是将汉字分析为独体字、部首和笔形三部分,利用0~9十个数字键对汉字进行编码操作。利用本发明方法不需经过专门的指法训练,就能实现对汉字及其词汇进行直观快速的编码输入,做到见字识码,会写就会输入,且简明易学,记忆量少,本编码的输入方式对简化字和繁体字均可适用,同时,本编码输入法可以作为一种汉字编码检索方法进行推广应用。
文档编号G06F3/023GK1064958SQ92101839
公开日1992年9月30日 申请日期1992年3月18日 优先权日1992年3月18日
发明者黄文智 申请人:黄文智
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1