音形字根检索的制作方法

文档序号:6597215阅读:410来源:国知局
专利名称:音形字根检索的制作方法
技术领域
计算机汉字输入(三)现有技术目前,汉字编码按使用情况基本上有两种类型1.以字音或笔形作为主要编码部件,其特点是由汉字的字音或笔形直接定出汉字的编码。一般说,这种编码规则较少,比较易学。但由于重码较多或码长较长,因此输入速度不可能很快。它主要适用于非专业操作员使用。
2.以字根作为主要编码部件,即把汉字看作字根的组合,然后定出编码所需的字根,并按某种法则确定这些字根的对应码,从而定出所有汉字的编码。一般说,这种编码规则较多,比较难学。但由于重码率低,码长短,因此熟练以后可以达到较高的输入速度。它主要适用于专业操作人员使用。
最理想的汉字编码应该是既要学习容易,又要有较高的输入速度。但是由于汉字的字音分布极不均匀(有的字音对应的单字很多,有的字音对应的单字很少,而且很多字音没有对应的单字),因此以音为主要部件的汉字编码,要想避开重码是不可能的。因此难以实现盲打。
对于以笔形作部件的编码,由于汉字的笔形种类有限,因此取少量的笔形决不可能将数千个汉字分开,欲降低重码率只有增加码长。所以这两种编码方式都不可能达到较高的输入速度。
另一方面,由于汉字的字形结构特别复杂,对于以字根为主要编码部件的汉字编码,要想以较少的码元、较短的码长和较简单的规则将汉字分开,使重码率降低到可以实现盲打的程度,也是办不到的。要做到这一点,只有增加规则,因而也就增加了学习的难度。
因此,如果汉字的字音与字形都不变,要想找到一种既易学(规则少)又易用(码长短、码元少、重码率低)的汉字编码是不可能的。所以,任何汉字编码都有其长处,但又有其不足。也正因为如此,尽管目前汉字编码已有数百种,但各种新的汉字编码还在不断涌现。
(四)发明目的为了解决汉字编码易学与易用的矛盾。

发明内容
为了解决这个矛盾,我提出了一种音形字根检索的新技术。这种技术并不是什么新的编码方法,而是利用了上述两种类型汉字编码的各自长处,从而弥补了各自的不足。从原则上说,这种技术对所有以字根作编码部件的汉字编码都适用。其主要作用是将以字根作部件的汉字编码的学习难度降低到拼音码或笔形码的水平。
所谓音形字根检索,就是通过拼音或笔形去查找所有字根的对应码(包括所有单体字),然后再由字根的对应码找相应的汉字。同时,也可以由字根的对应码找相应的编码规则。主要包括以下三部分内容(1)按拼音查字根。当转换到检索状态后,按拼音击前三码(如不足三码加空格键),即可在屏幕的提示行中出现所有同音字根及其对应的两码。但对现有的汉字拼音要作如下更改声母ZH、CH、SH分别与Z、C、S合并,韵母IA与A合并。这样,即使对普通话的发音不太准确的用户,也能比较容易按拼音找到所需字根的对应码。
例如,‘羊’对应于YAN,‘艮’对应于GEN,‘之’和‘子’都对应于ZI,‘石’和‘四’都对应于SI,‘斤’和‘井’都对应于JIN,‘半’与‘卞’都对应于BAN。
(2)按笔形查字根。将汉字笔形分成横、竖、点、撇、捺、挑、折、拐、口九种,分别对应于它们的声母H、S、D、P、N、T、Z、G、K。其中折表示按顺时针方向的折,拐表示按反时针方向的折(字母‘Z’与‘G’不仅是‘折’与‘拐’的声母,而且它们的形状也正好是‘折’与‘拐’)。当转换到检索状态后,按字根的第一、第二、和最后一笔的笔形击三键(不足三键加空格键),即可在屏幕的提示行中出现这三笔相同的所有字根及其对应的两码。
例如,字根‘羊’第一、二、末笔分别为点撇竖,因此对应于DPS。当用户在转入检索状态后,如依次击‘D、P、S’键,提示行中便会出现字根‘羊’及其对应码。
字根‘艮’第一、二、末笔分别为折横捺,因此对应于ZHN。如依次击‘Z、H、N’键,提示行中便会出现字根‘艮’及其对应码。
字根‘古’第一、二、末笔分别为横竖口,因此对应于HSK。如依次击‘H、S、K’,提示行中便出现字根‘古’及其对应码。
(3)按基本键位查相应的编码规则。当转换到检索状态后,击任一码元所对应的键位再击空格键,即可在屏幕的提示行中出现对应于这个码元的编码规则。这样,当用户通过拼音或笔形找到所需要的字根的对应码时,如有不明之处,则可利用这个功能找出为什么这个字根要取这个码。显然,一些按规则比较难学的单字,也可以收在检索中。
由于(1)按笔形检索不带韵母,(2)按拼音检索一定带韵母,(3)规则检索只取一码(仅有一笔的字根可以重复取两码),因此,这三部分内容完全可以混编而不会重叠。
音形字根检索应与屏幕链索提示配合使用其主要功能是,如击某字第一码所对应的键位,即在提示行中出现所有第一码与此码相同的汉字,并在其后显示该字的第二码;如再击第二码所对应的键位,即在提示行中出现所有前两码与此两码相同在汉字,并在其后显示该字的第三码。依此类推。
这种方法最适用于最大码长为3的字根形码。因为以字根作部件的汉字编码一般都是第一码比较容易找,第二码次之,越往后越难找。如最大码长只有三键,那么击了两键后,所有前两码相同的一级字几乎全在提示行的第一页中。对于那些第二码比较难找的常用字,可以将它们提到最前面,以保证击了第一键后,这些汉字都出现在提示行的前两页上。因此,在检索出的字根或单体字中,只需标出前两码。
对于刚刚开始学习的用户,如果第一码也找不到,则可利用检索去找。由此可见,检索主要用来查找第一码和部分第二码,提示主要用来查找第二码和全部第三码。这样,在设计时只需用一个转换键在击第一码之前,如击此转换键则转入检索状态;在击第一码之后如击转换键则转入提示状态;如再击一次转换键,都能还原成正常状态。
目前这种技术已用在二维汉字形码《D2-A》上,经初步实践,它不仅可以将字根码的学习难度降低到拼音码或笔形码的水平,而且还可以使汉字编码的‘学、练、用’同时在屏幕上实现,大大提高了用户的学习兴趣和记忆速度,真正做到易学易用。
如其它汉字编码需要利用这个技术,只需根据其编码规则改变检索中字根的对应码即可。
权利要求
利用拼音或笔形查字根码,然后由字根查汉字编码。主要特征是1、按拼音查字根时,ZH、CH、SH分别与Z、C、S合并,IA与A合并,NG与N合并,然后取前三码。2、按笔形查字根时,将汉字笔形分成横、竖、点、撇、捺、挑、折、拐和口九种,并以其相应的辅音H、S、D、P、N、T、Z、G和K编码。取字根的一、二、末笔作为其对应码。3、以上两种编码一起混编,互不重叠。
全文摘要
此项技术适用于一切以字根作部件的汉字编码,它将汉字编码分两步查找先按拼音或笔形查字根,然后再按字根查汉字。
按拼音查找时,对现有的汉语拼音进行简化取前三码;按笔形查找时,只需根据一、二、末笔所对应的汉语辅音取三码。任何略知汉语拼音的人都可很容易学会。其主要作用是将以字根作部件的汉字编码的学习难度降低到拼音码或笔形码的水平,而熟练后仍可达到字根码那样的输入速度。
文档编号G06F3/00GK1034439SQ8810786
公开日1989年8月2日 申请日期1988年11月18日 优先权日1988年11月18日
发明者石啸生 申请人:石啸生
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1