专利名称:计算机音形汉字输入法的制作方法
技术领域:
本发明涉及一种计算机汉字输入法。尤其与根据汉字构件的音和形编码输入计算机的方法有关。
已有的计算机音形汉字输入法,将汉字拆分成构件单元,构件可以是汉字或部首,一个汉字的构件数目为3个以下(包括3个)。由于汉字的构成有既不是汉字,又不是部首的独立完整部分,有的汉字难于拆分。
取码规则是将汉字笔画制成《笔画次序表》,共有18种笔画。笔画地种类较多。
将汉字构件取其读音的第一个字母为该构件的语音码元,而部首构件有读音的则取其读音的第1个字母为该构件的语音码元,有名称无读音的参照其名称给其指定语音码元,对于少部分名称不为人熟知的部首则规定其语音码元为特定同一字母。这样制成的《汉字部首读音、语音码表》结构复杂,码元太多,记忆和使用较难。
编码规则是汉字和词编成四码输入。单构件汉字的编码依次为字的音码,字的第一形码,字的第二形码,字的第三形码,二构件汉字的编码依次为第一构件的音码,第一构件的形码,第二构件的音码,第二构件的形码。三构件汉字的编码依次为第一构件的音码,第一构件的形码,第二构件的音码,第三构件的音码。由于编码数量较少,容易出现重码。
本发明的目的是提供一种符合汉字造字规律,符合中国人使用汉字的习惯,易于用户对笔划的正确判断。方法简单,便于普及,使用方便,而重码少的计算机音形汉字输入法。
本发明是这样实现的
本发明是以汉语拼音的首字母(音码)和汉字的笔画(形码)为基本单元,每一个基本单元被赋予一个输入键,每个汉字可由一至五个代表首字母或笔画或汉字本身的输入键串组成,也可有其它健作为组成单元,其方法如下
a.将汉字按形拆分成构件单元,其方法如下
①构件基本单元必须是汉字或部首或不定构件(即不是汉字或部首的汉字中的一个独立、完整的组成部分),一个字只允许取一个不定构件,此外,凡一个字可以取现代汉字或部首为第一构件和第三构件者,其中间部份可作为一个不定构件处理,
②一个汉字只能完整地分成二个或三个构件单元,汉字拆分后不能有多余的笔画,构件之间笔画不能交叉或共用一笔,也可以不拆分,为单构件字。
③一个汉字的构件拆分顺序如下
对于能拆成不含不定构件的三构件字,按三构件字输入,若同时能拆成不含不定构件的二构件字,按二构件字输入也可,否,则能否拆成不含不定构件的二构件字,否,则能否拆成含不定构件的三构件字,若同时能拆成含不定构件的二构件字,按二构件字输入也可,否,能否拆成含不定构件的二构件字,否,则为单构件字。
④按字的书写顺序分第一构件、第二构件,第三构件,以每个构件末笔为准排列书写顺序,
⑤对一部分常用汉字赋予一个输入键。
b.取码规则
一、音码规则
①凡构件是汉字或与现代汉字同形的部首者,取其读音的首字母为该构件的音码。
②凡构件是不与现代汉字同形的部首者,选取其中一部分常用部首,给定读音首字母,作为该构件的音码。
③凡②中未选取的不与现代汉字同形的部首,则可以以同一拼音字母作为该构件的音码。
④不定构件以待输入汉字读音的首字母为其音码。
二、形码规则
将汉字的笔画按在汉字中出现的频率不同,由低到高整理,归纳成笔画序表。
构件所有的笔画中,其在笔画序表中列为最前者为该构件的第一形码,列于次前者为该构件的第二形码,依此类推,
c.编码规则
一、单个汉字一至五码键入。
①三构件字编码依次为字的音码、第一构件音码,第一构件第一形码,第二构件音码,第三构件音码。
②二构件字编码依次为字的音码、第一构件音码,第一构件的第一形码,第二构件音码,第二构件第一形码。
③单构件字编码依次为字的音码、字的第一形码、字的第二形码,字的第三形码,字的第四形码。
④如果一个字没有五码则输入该字的码后,按一次空格键即表示该字输入已完成。
⑤如果一个字虽有五码但不需五码即可确定,则可以输入五码也可以在输入确定该字的码后按空格键或其它键,完成输入。
⑥对赋予一个输入键的常用汉字,输入该键后击一次空格键完成输入。
二、词的输入,以四码或五码键入。
①二字词的编码依次为第一字的音码,第一字第一构件音码(单构件字用其第一形码),第二字音码,第二字第一构件音码(单构件字用其第一形码),空格键。
②三字词的编码依次为第一字音码,第二字音码,第三字音码,点键(英文键盘上N键),空格键。
③四字词的编码为第一字音码,第二字音码,第三字音码、第四字音码,点键(英文键盘上N键)。
④多字词的编码依次为第一字音码,第二字音码,第三字音码,第四字音码,最后一字音码。
本发明的一字可对应多组编码键入。
本发明有利于同形不同读音字的输入,个别有两种拆分形式的字的输入,以及不同文化水平的使用者编码可能有所不同的字的输入。
本发明利用计算机英文键盘的键分别与音码和形码和汉字相对应。
本发明的笔画序表如下
本发明的笔画序表如下
本发明的选取的不与汉字同形的部首给定读音首字母如下表所示
凡上表中未注明的不与现代汉字同形的部首允许用0表示。
本发明的计算机英文键盘的键与对应的首字母和笔画和汉字的关系如下
本发明的计算机英文键盘的键与对应的首字母和笔画,汉字的关系如下
本发明的如果待输入汉字是九年制义务教育语文课本中未有的汉字,可以以字母a代替该字读音的首字母编码。
本发明的优点如下所述
(一)极易学会使用而且重码率极低。这是由于
(1)码元极少而且是一般用户所熟悉的汉字读音和字形最基本的特征——首字母和笔画。
(2)编码基于最广大的构件基础上却完全不必记住构件。构件的认定也很简单明确,只要是现代汉字或部首就可以作为构件。非限定构件认定是汉字(取构件信息)编码中一个难题,这一问题近于完善的解决得力于字的拆分规则和“不定构件”的运用。特别是“不定构件”是本发明的一个有价值的创造。规定“不定构件”所在汉字的读音的首字母为“不定构件”的音码既方便用户使用又有效地减少重码。
(3)部首是组成汉字的常用的构件。非字部首的读音至今未有统一规范,一些部首读音为许多人不熟悉。本发明只规定了一些最常见的非字部首如《氵》《扌》《亻》《竺》等的读音。而且所规定的读音是与这些部首的通俗名称是一致的,如《氵》读《shuǐ》《扌》读shǒu《亻》读《rèn》《竺》读《zhú》等,其余的非字部首允许以《O》作为其音码,使用户学习和使用都不感到困难。
(4)使用笔画作为码元比使用字根作为码元容易学习掌握。但众所周知使用笔画作码元异化重码能力低。提高笔画作为码元的异化重码能力得力于本发明另一个有价值的创造——笔画序表。它直接提取构件中最有代表性笔画作为形码,有效地提高了异化重码能力。
(二)普及面广而且初中以上文化水平的用户都能够使用它不困难地输入国家标准GB2312-80所规定的6763个汉字。这是由于
(1)使用本发明所涉及的语文的知识包括汉语拼音首字母、汉字笔画、常用汉字、部首都是有初等语文知识的用户已熟悉知的。
(2)汉语拼音首字母f与h、l与n、c与ch、s与sh、z与zh兼容充分考虑了部分用户地方口音及读音不准的语音缺陷。
(3)超过初中语文教本的汉字允许以《a》为音码充分照顾到部分用户的知识水平。
(4)一字对应多组编码充分兼顾了不同语文知识层次的用户编码可能产生的差异。如《栈》字本应是不含“不定构件”的二构件字。有的用户不知《戋》是一个字,按“不定构件”处理。以《栈》字音码《Z》作为《戋》的音码,仍可编码输入。如果用户连《栈》字也不认识可以《a》为《戋》的音码也可编码输入。
(三)规范性好
(1)编码方法符合汉字造字规律,符合中国人使用汉字的习惯,没有生造的构件。
(2)所涉及的字集、汉语拼音字母、汉字笔画、部首都符合国家标准或国家语委的推荐使用标准。其中汉语拼音首字母、汉字笔画、部首读音都符合语文教本或语文教学参考材料。
如下是本发明的附图
图1为本发明的笔画序表。
图2为本发明的另一种笔画序表。
图3为本发明的常用非汉字部首读音首字母表。
图4为本发明的计算机英文键盘的键名与图1所示笔画序表中的笔画和首字母以及部分常用汉字的对应表。
图5为本发明的计算机英文键盘的键名与图2所示笔画序表中的笔画和首字母以及部分常用汉字的对应表。
如下是
具体实施例方式
笔画序表如图1,2所示。
常用非汉字部首读音首字母表如图3所示。
计算机的键盘英文键名与笔画和首字母和部分常用汉字的对应表如图4、图5所示
一部分常用汉字可以五键输入,也可以键入第一键后击一次空格键完成输入。
这部份汉字包括
A B C D E F G J K L M O
爱 比 出 的 二 火 工 进 可 了 没 欧
P Q R S T W X Y Z
平 其 人 所 太 往 象 用 中
另有个别常用汉字可以五键输入也可以二键输入,但是二键输入时第一键不是对应于字音首字母的键而是特别指定的键。
这些汉字包括
N V H I U
个 十 百 千 万
凡不能二键输入的汉字可以五键输入,也可以在键入前二键,前三键或前四键后提示行中只有待输入的汉字时击一次空格键完成输入或不击空格键,在输入下一个汉字或词时,将自动完成该字的输入。若键入前二键或前三键、前四键之后待输入汉字已排列在提示行中,则击一次空格键,之后进行选择输入,若该字排在提示行左端首位,则再击一次空格键或输入下一个汉字或词时,完成对首位字的输入,若该字不在首位则分别击一次与提示行中所标明的序号相对应的数字键而完成对该字的输入,或者键入前二键、前三键、前四键之后待输入汉字已排列在提示行中,可以通过同时按下Alt键和空格键或Alt键和数字键来完成对首位字或其他提示行中标有序号的各字的输入。
词输入可以五键输入,也可以在键入前三键、前四键后,提示行中只有待输入的词时,击一次空格键完成输入,或不击空格键,在输入下一个汉字或词时,将自动完成该词的输入。若键入前三键或前四键后待输入汉字已排列在提示行中则击一次空格键,之后进行选择输入,若该词排在该字排提示行左端首位则再击一次空格键或输入下一个汉字或词时,完成对首位词的输入,如果不在首位,则击一次与提示行中所标明的序号相对应的数字键,而完成对该词的输入。或者,键入前三键或前四键后待输入的词已排列在提示行中可以通过同时按下Alt和空格键。或Alt键和数字键来完成对首位词或其他提示行中标有序号的各词的输入。
(1)不含“不定构件”的三构件字或二构件字输入
例字“碧”拆分为“王”、“白”、“石”,均为汉字构件。音码为其读音首字母。形码按图(1)或图(2)。
形码按图(1)编码bw丨bs计算机键名串BWHBS
形码按图(2)编码bw丨bs计算机键名串BWVBS
例字“杉”拆分为“木”、“彡”,其中“木”为与汉字“木”同形的部首读音同“木”。“彡”为图(3)未注明的部首,音码可以用“O”。
形码按图(1)编码Sm丿o丿计算机键名串SMIOI
形码按图(2)编码Sm丿o丿计算机键名串SMIOI
例字“语”可以拆为“讠”、“五”、“口”。也可拆分为“讠”、“吾”。
拆分为“讠”、“五”、“口”,“讠”图3中注明的常用部首。“五”、“口”为汉字构件。
形码按图(1)编码yy讠WK计算机键名串YY8WK
形码按图(2)编码yy讠WK计算机键名串YY7WK
拆分为“讠”、“吾”,“讠”为图3中注明的常用部首,“吾”为汉字构件。
形码按图(1)编码yy
w
计算机键名串YY8W0
形码按图(2)编码yy
w
计算机键名串YY7W9
(2)含“不定构件”的三构件字或二构件字输入
例字“在”拆分为“ ”、“土”,其中“ ”为“不定构件”
形码按图(1)编码ZZ丿t丨计算机键名串ZZITH
形码按图(2)编码ZZ丿t丨计算机键名串ZZITV
例字“坚”拆分为“
”、“又”、“土”,其中
为不定构件。
形码按图(1)编码jj丨yt计算机键名串JJHYT
形码按图(2)编码jj丨yt计算机键名串JJVYT
例字“器”拆分为“口”、“”、“口”,其中“ ”不是构件,但因“器”字可拆出第一构件“口”和第三构件“口”所以中间部分
可以当作一个“不定构件”处理。
形码按图(1)编码qk
qk计算机键名串QK0QK
形码按图(2)编码qk
qk计算机键名串QK9QK
(3)单构件字输入
例字“见”
形码按图(1)编码j乚
丿丨计算机键名串J40IH
形码按图(2)编码j乚
丿丨计算机键名串J49IV
(4)一字对应多组编码输入
例字“长”有两种不同读音,故有两种输入法。
读“cháng”时
形码按图(1)编码c
丿-计算机键名串C6UIV
形码按图(2)编码c
丿-计算机键名串C5UI-
读“Zhǎng”时
形码按图(1)编码z
丿-计算机键名串Z6UIV
形码按图(2)编码;z
丿-计算机键名串Z5UI-
例字“栈”拆分为“木”、“ ”,其中“木”为与汉字“木”同形部首,读音同“木”。“ ”为汉字构件。
形码按图(1)编码Zm丿j
计算机键名串ZMIJ1
形码按图(2)编码Zm丿j
计算机键名串ZMIJ1
因为“ ”是超过初中语文教材的字,如果有的用户不知其为汉字,也可以作为“不定构件”处理。
形码按图(1)编码zm丿Z
计算机键名串ZMIZ1
形码按图(2)编码zm丿Z
计算机键名串ZMIZ1
如果用户不知“栈”的读音,可以用“a”代替“栈”的读音字母编码
形码按图(1)编码am丿a
计算机键名串AMIA1
形码按图(2)编码am丿a
计算机键名串AMIA1
例字“凸”其第一笔形按正字表应为“ㄋ”
形码按图(1)编码tㄋ11-计算机键名串T7HHV
形码按图(2)编码tㄋ11-计算机键名串T6VV-
因为“ㄋ”属罕见,如果用户不知笔画“ㄋ”第一笔形也可以取“”。
形码按图(1)编码t
11计算机键名串T00HH
形码按图(2)编码t
11计算机键名串T99VV
(5)码长不足五码的汉字输入
例字“一”因为该字只有两码,所以输入其编码后加击空格键,表示该字输入已完成。
形码按图(1)编码y-计算机键名串YV
形码按图(2)编码y-计算机键名串Y-
(6)字的简化输入
例字“的”拆分为“白”、“勺”。
形码按图(1)编码db
s
计算机键名串DB0S8
形码按图(2)编码db
s
计算机键名串DB9S7
当键入第一健后提示行出现的
再击一次空格键 即完成输入。如果不击空格键而继续击完五键也可以完成输入。像“的”这样可二键简化输入的字共有26个。
侧字“百”
形码按图(1)编码by-b
计算机键名串BYVB0
形码按图(2)编码by-b
计算机键名串BY-B9
形码按图(1)编码b
丿丨-计算机键名串B0IHV
形码按图(2)编码b
丿丨-计算机键名串B9IV-
可以五键输入,也可以二健输入,二键输入时第一键为H(特别规定的)击H键后提示行出现百
再出一次空格键 即完成输入。例“百”这样可以二键简化输入的(第一键是特别规定的)字还有“个”、“十”、“千”、“万”共五个字。
例字“是”拆分为“日”、“
”,“
”可作为“不定构件”。
形码按图(1)编码sr
s计算机键名串SR0SU
形码按图(2)编码sr
s计算机键名串SR9SU
可以五健输入,也可以简化输入。
击第一键S,提示行显示所
再击第二键R,提示行显示是1使 2时 3似 4份 5俊 6晒7食 8俗 9伞 0曙
因为待输入汉字“是”这时已排列在提示行首位,所以只要再击一次空格键即可以进行选择输入。若要“是”字则在进行下一个汉字或词的输入时它将自动完成输入,或者再击空格键也可完成输入。所以“是”字简化输入计算机键名串是SR
或SR(Alt+
)。
例字“食”拆分为“人”、“良”。
形码按图(1)编码Sr
计算机键名串SRUL2
形码按图(2)编码Sr
计算机键名串SRUL2
可以五键输入也可以简化输入。
击第一键S,提示行显示所
再击一第二键SR,提示行显示是 1使 2时 3似 4份 5俊 6晒 7食 8俗 9伞 0曙。
因为待输入汉字“食”已显示在提示行中但不在首位,所以再击一次空格键和一次数字键7就完成输入。也可以不击空格键
而同时按下Alt键和数字键7完成输入。所以“食”字可以用键名串,SR
7或SR(Alt+7)简化输入。
“食”字还可以另一种形式简化输入
输入前四健SRUL,提示行显示食
因为待输入汉字“食”已显示在提示行中并且只有它一个字,所以只须再按一次空格键
即完成输入,实际输入键名串是SRUL
,或者不按空格键,在输入下一个汉字或词时,它自动完成输入。
(7)二字词输入
例“说明”编码symr
计算机键名串SYMR
例“人民”
形码按图(1)编码rm
计算机键名串RUM1
形码按图(2)编码rm
计算机键名串RUM1
(8)三字词输入
例“说明书”编码smsn
计算机键名串SMSN
(9)四字词输入
例“黑龙江省”编码hljs计算机键名串FLJSN
形码按图(1)编码hljsN计算机键名串FLJSN
形码按图(2)编码hljsN计算机键名串HLJSN或FLJSN
(10)多字词输入
例“中华人民共和国”
形码按图(1)编码zhrmg计算机键名串ZFRMG
形码按图(2)编码zhrmg计算机键名串ZHRMG或ZFRMG
(11)词的简化输入
例“各类”
形码按图(1)编码gwlm
计算机键名串GWLM
形码按图(2)编码gwlm
计算机键名串GWLM
可以五键输入,也可以简化输入
击第三键L后,提示行显示各类1、瑰丽。
待输入的词“各类”已显示在提示行中左端首位,这时只要击空格键就可进行选择输入,再击空格键就可完成该词“各类”的输入或者不再击空格键在输入下一汉字或词时,它将自动完成输入。
(12)重码的选择输入
如果待输入字、词对应的计算机键名串已全部键入之后,提示行显示仍有重码,可以击空格键或提示行标明的数字键选择输入。
例健入SRIS8五键之后,
提示行显示伤1伺
如果待输入汉字是“伤”字,再击一次空格键输入。
如果待输入汉字是伺字,再击一次数字键1输入。
权利要求
1、一种计算机音形汉字输入法,其特征在于以汉语拼音的首字母(音码)和汉字的笔画(形码)为基本单元,每一个基本单元被赋予一个输入键,每个汉字可由一至五个代表首字母或笔画或汉字本身的输入键串组成,也可有其它健作为组成单元,其方法如下
a.将汉字按形拆分成构件单元,其方法如下
①构件基本单元必须是汉字或部首或不定构件(即不是汉字或部首的汉字中的一个独立、完整的组成部分),一个字只允许取一个不定构件,此外,凡一个字可以取现代汉字或部首为第一构件和第三构件者,其中间部份可作为一个不定构件处理,
②一个汉字只能完整地分成二个或三个构件单元,汉字拆分后不能有多余的笔画,构件之间笔画不能交叉或共用一笔,也可以不拆分,为单构件字,
③一个汉字的构件拆分顺序如下
对于能拆成不含不定构件的三构件字,按三构件字输入,若同时能拆成不含不定构件的二构件字,按二构件字输入也可,否,则能否拆成不含不定构件的二构件字,否,则能否拆成含不定构件的三构件字,若同时能拆成含不定构件的二构件字,按二构件字输入也可,否,能否拆成含不定构件的二构件字,否,则为单构件字,
④按字的书写顺序分第一构件、第二构件,第三构件,以每个构件末笔为准排列书写顺序,
⑤对一部分常用汉字赋予一个输入键,
b.取码规则
一、音码规则
①凡构件是汉字或与现代汉字同形的部首者,取其读音的首字母为该构件的音码,
②凡构件是不与汉字同形的部首者,选取其中一都分常用部首,给定读音首字母,作为该构件的音码,
③凡②中未选取的不与现代汉字同形的部首,则可以以同一拼音字母作为该构件的音码,
④不定构件以待输入汉字读音的首字母为其音码,
二、形码规则
将汉字的笔画按在汉字中出现的频率不同,由低到高整理,归纳成笔画序表,
构件所有的笔画中,其在笔画序表中列为最前者为该构件的第一形码,列于次前者为该构件的第二形码,依此类推,
c.编码规则
一、单个汉字一至五码键入,
①三构件字编码依次为字的音码、第一构件音码,第一构件第一形码,第二构件音码,第三构件音码,
②二构件字编码依次为字的音码、第一构件音码,第一构件的第一形码,第二构件音码,第二构件第一形码,
③单构件字编码依次为字的音码、字的第一形码、字的第二形码,字的第三形码,字的第四形码,
④如果一个字没有五码则输入该字的码后,按一次空格键即表示该字输入已完成,
⑤如果一个字虽有五码但不需五码即可确定,则可以输入五码也可以在输入确定该字的码后按空格键或其它键,完成输入,
⑥对赋予一个输入键的常用汉字,输入该键后击一次空格键完成输入。
二、词的输入。以四码或五码键入,
①二字词的编码依次为第一字的音码,第一字第一构件音码(单构件字用其第一形码),第二字音码,第二字第一构件音码(单构件字用其第一形码),空格键,
②三字词的编码依次为第一字音码,第二字音码,第三字音码,点键(英文键盘上N键),空格键。
③四字词的编码为第一字音码,第二字音码,第三字音码、第四字音码,点键(英文键盘上N键)。
④多字词的编码依次为第一字音码,第二字音码,第三字音码,第四字音码,最后一字音码。
2、根据权利要求1所述的计算机音形汉字输入法,其特征在于一字可对应多组编码键入,
有利于同形不同读音字的输入,个别有两种拆分形式的字的输入,以及不同文化水平的使用者编码可能有所不同的字的输入,
3、根据权利要求1或2所述的计算机音形汉字输入法,其特征在于利用计算机英文键盘的键分别与音码和形码或汉字相对应。
4、根据权利要求3所述的计算机音形汉字输入法,其特征在于所说的笔画序表如下
5、根据权利要求3所述的计算机音形汉字输入法,其特征在于所说的笔画序表如下
6、根据权利要求4或5所述的计算机音形汉字输入法,其特征在于所选取的不与汉字同形的部首给定读音首字母如下表所示
凡上表中未注明的不与现代汉字同形的部首允许用0表示。
7、根据权利要求6所述的计算机音形汉字输入法,其特征在于计算机英文键盘的键与对应的首字母和笔画和汉字的关系如下
8、根据权利要求6所述的计算机音形汉字输入法,其特征在于计算机英文键盘的键与对应的首字母和笔画,汉字的关系如下
9、根据权利要求7或8所述的计算机音形汉字输入法,其特征在于如果待输入汉字是九年制义务教育语文课本中未有的汉字,可以以字母a代替该字读音的首字母编码。
全文摘要
本发明为一种计算机音形汉字输入法。以汉语拼音的首字母和汉字的笔画为基本单元,一个基本单元被赋予一个输入键,每个汉字可由一至五个代表首字母和笔画和汉字的输入键串组成,其方法是首先将汉字按形拆分成构件单元。制定笔画序表,常用部首读音字母表,根据音码规则取构件的音码。根据形码规则取构件的形码,根据编码规则将汉字用音码、形码表示,再用与音码、形码对应的计算机键盘英文键名输入计算机。
文档编号G06F3/023GK1178933SQ9710767
公开日1998年4月15日 申请日期1997年9月15日 优先权日1997年9月15日
发明者邓仁 申请人:邓仁