汉字二维三点取码输入法的制作方法

文档序号:6530448阅读:507来源:国知局
专利名称:汉字二维三点取码输入法的制作方法
技术领域
本发明涉及一种汉字输入技术,属于电子计算机中文、日语或其它使用汉字的信息处理的技术领域。尤其是涉及采用计算机键盘副键上10个数字码进行编码实现文字输入的输入技术。
现有的“汉字输入法”很多,据有关资料表明目前汉字编码方案大约有400多种,在电子计算机上实际使用且广泛使用的也大约只有十几种。
汉字编码方案主要可以划分为字音类、字形类、音形结合类三大类。其中字音类的编码以汉字拼音为基础,其特点是有拼音基础知识的人很容易学,但输入码数长,重码多,读音不准等缺陷大大限制了其汉字输入速度;字形码则是以汉字书写形状为基础,把汉字归纳为200个字根进行编码,如“五笔字型输入法”,其特点是整体性强,码数短,输入速度较快,但由于“字根”量大,析码困难,记忆量大,难学易忘,一般非专业技术人员,特别是少年儿童及中老年人不容易掌握,也就更谈不上输入速度的提高。
此外,就检字方法而言,目前使用较为广泛的四角号码检字法,该法把汉字机械地切分为四个角,用五个码代表一个字,码数长,重码率达80%左右,显然用于计算机输入是不合适的,就是作为检字法也是不方便的。
综上所述现有的汉字输入法、检字法各有其优点,但都存在着一些共同的缺憾如读码难,重码多,输入速度慢等问题。
有关资料表明如果汉字输入的速度提高一倍,则在每两个小时的工作时间里,就可以帮助需要汉字输入的计算机用户节省10亿个小时。可见当今信息社会对高效的汉字输入技术求贤若渴。
本发明的目的在于克服以上技术的不足之处,而提供一种真正具有读码、编码容易,记忆量少,输入速度快等功能,遵循“二维三点取码、顺时针曲尺形路线读码”规则,采用计算机键盘上的副键区域里的10个阿拉伯数字键作代码或键盘上10个字母键作代码,即可完成文字输入的汉字输入法。该法同样也可适用于字(词)典检字,图书编目录、户口编码、盲人打字…以至军事文件传递(需保密传递)等领域。
本发明的技术方案是这样实现的本发明的作者认为1、汉字是一种存意功能恒久,并且不受时空推移与转换所造成的,任何语言普遍具有的语音不稳定性的影响,形意结合严格而能容纳生活在不同时空的人们用特定语音和腔调去识读的,在字形方面则由单一和复合造字部件按一定顺序构造而成的组合式的表意文字。2、参照二维空间最简单而稳定的图形是三角形这一常识,认为一个方块字,只要抓住三个点,就能描述出一个汉字不同于另一个汉字的特点。3、方块字(汉字)形方实圆,所以观察汉字时,在脑子里应设定每个方块的圆心O点,围绕圆心O,先按字的角或边循顺时针作曲尺形定点取基本码(实际上作圆周运动),然后,以最后一个基本码(即汉字的右下角)为出发点继续顺时针方向找邻近的造字部件取区别码(识别码)。
所有细则都是在上述基础上确立的。
以上述观点为基础来设计本发明的技术方案1、将汉字拆分成10个单、复部件,用10个数字键或10个字母键进行编码作代码;2、确定每一个汉字的码节其基本码长为3码,加上最后一码区别码,绝对码长为4码;3、采用二维空间三点取码方式;4、按顺时针方向读码,读码路线相当于曲尺形(鲁班尺形)走向,即从每一个汉字的左上角到右上角至右下角依次取码,每一造字部件只取一码,其中某点出现空档时,跳过不计,码长可以是1,可以是2,也可以是3,加上区别码1,总码长绝对上限为4;5、识别(或区别)码的取码方式以最后一个基本码(汉字的右下角)为出发点顺时针方向找,“独体字或竖叠字”为顺时针方向左旋向上找最邻近的部件取码,“其他合体字(除竖叠字)”为顺时针方向向左下角找最邻近的部件取码,若遇到空档,该识别码可略去不计。6、特殊字符的编码如遇到四面有框围住,框取一码,其余码进入框内,从下往上取;三面包围,外取两码,内自下而上取一个第三码和区别码;左下半包围右底看内,右上半包围看左下;夹心式的区别码必须从底或左侧取。7、高频词语、固定结构、成语、歇后语、专用语串及诗词名句等设连打长码,取每一个字的第一码(左上角),最后一字的首、尾两码,前缀字母“L”即可组成。8、外来词,其词形在原则上一律还原。9、日语汉字的编码方法,其取码的规则与上述规则相同,有所区别的是(1)对日语汉字(真名)编码时,需在码节前加“Z”键。
(2)对日语汉字(假名)编码时,需在码节前加“J”键。
本发明的优点如下1、读码、编码容易,即使不认识的字或识字很少的人稍经培训也能轻而易举地掌握。
2、减轻记忆量,真正做到简单易学,尤其适合非专业人员学习使用。
3、由于每个汉字码节长上限设定为4码,从而使得输入速度得以提高。
4、速度提高的另一重要原因在于,采用计算机键盘副键上10个数字键为编码的代码,手指活动范围小真正实现了高效率击打。
5、本发明的析码方法也可适用于字(词)典检字、图书编目录、户口编码、盲人打字以至军事文件传递的编码等领域。
6、本发明适用汉字系统的输入技术如中文输入、日语输入等。
本发明以下将结合实施例对技术方案进行详细描述一、把汉字的造字部件归纳为单一(一笔到底)部件和复合部件(由两笔或两笔以上、甚至就是一个常作偏旁的独体字)两大类。
书法学上说的横、竖、点、捺、折,在本发明中统称为单一造字部件,把“交”、“串”、“框”、“八”、“小”、“顶”等叫做复合造字部件。具体地说,上述复合部件里的几种称呼指的是对汉字笔形的描述。
详细划分见表一部件名称、具体笔形 表一
各部件笔形的详细解释如下第一类单一部件有四种(名称用简称)1、横,指从左到右的平直笔形和从左到右向上斜挑的笔形(一/)。
2、竖,指从上到下,从右向左斜撇和竖而向左钩的笔形(丨丿丿亅)。
3、点、捺,(、へ)。在手写字中,点捺有时可在一定条件下变通,所以合并为一种笔形。
4、折,指拐弯抹角而不提笔,一竿子到底的笔形,如フ ㄣㄥ等。它们在与别的笔画相交后,相交点除去,其余部分仍叫折。如“力”、“也”等就含有“交”与“折”两种笔形。
第二类,复合部件,有六种1、交,指独立的两笔或一个横笔与两个以上竖笔相交,或竖笔与折笔某横段相交(折笔仍叫折)如十、册、力等。又如“大”,横与撇视为交,余下(ㄟ)是独立部件。
2、串,指一个竖笔贯穿两个横笔或一个造字部件,如“中”,但被穿插的部件性质不变。
3、框,指由四条边(三画)相连而成的封闭性方形,如口囗等。但它在被串笔的“竖”穿刺或穿透后,性质不变,仍叫框。如“中”、“串”、“由”等字中的框,仍然是一个框的特征。
4、八,指近似“八”的笔形,它有顺、倒、向左、向右四种模样,如“八(人、入)冫”。
5、小,指“小”字及其变形或近似小字模样的部件,如小、氵都有叫小。与它相连而非“小”字部分,属别的笔形,如“木”上头是“交”,下截是“小”。
6、顶,指经常出现在汉字最上端的一点下面接一横的部件如“六、京、高”这类字的头顶,都叫顶。
本发明最佳实施方案为将以上拆分的10个汉字单、复部件,用10个数字键作代码,在计算机键盘的副键上就可完成输入。其部件名和代码对照如下表二
部件名和代码对照表 表二
当然,也可选用计算机键盘上任意10个字母键作代码与以上部件名呼应进行编码。以下本发明在阐述过程中均用数字键作代码举例说明。
本发明的作者经过多年的研究论证,证实了汉字采用以上方案拆分是切实可行的,而且非常容易学习,记忆量很少。
二、本发明确定每个汉字的码长上限为4码,前3码为基本码,最后一码为识别码。以4码为上限,从理论上讲,就可涵盖近万个汉字。以现代汉字而言,常用字约2500个左右,次常用字1000个左右,次次常用字600个左右,外加低频字2900个左右,共大约7000个字,再加上日语汉字和假名共2000个字左右(据日本国官方公布),合计约为9000个字。所以码长为4足以满足将现代汉字输入计算机的需要。至于要把所有汉字(据有关资料统计现已发现的汉字约为7万多字)都输入,只要分层次编码或适当延长码长为5位数,就可实现。
三、取码与编码规则本发明采用二维空间三点取码规则。即本发明认为,一个方块字,只要抓住三个点,就能描述出一个汉字与另一个汉字的不同点。因此本发明的编码方案中确定每个字的读码路线为顺时针、曲尺形走向,即从一个汉字的左上角→右上角→右下角。这是一个大原则,符合大多数汉字的取码,有少数汉字采用以上方法无法完成取码,也是可能的。因此本发明设定了三条补救措施第一、增加一位识别码;第二、在计算机显示屏幕上的显示框中出现重码(本发明的输入法其重码率为千分之五);第三、另设容错码。
四、识别码的找法、位置。
鉴于现代汉字常用字、次常用字、次次常用字、低频字,再加上日本国官方公布的“当用汉字”等,总字数为9000个,涵盖一万字以内的范围,码长必须延长至4。这样确立区别码,是必要的。但区别码就位置而言,它是附在基本码后面的,就性质而言是附加码,相当于楼号里的楼层码,是属下一层面上的特征码。
识别码(区别码)必须以最后一个基本码为出发点,顺时针方向找,它的取法分两类第一类“独体字和竖叠字”以最后一个基本码为出发点,顺时针方向向上找,举例如下(1)
“毛”第一码在左上角,笔形为“丨”,部件名为“竖”,代码为“2”,第2码在右上角,为空码略去不计,接着顺时针往下找,第3码在右下角,笔形为“乚”,部件名为“折”,代码为“4”,第4码即识别码,以第3码为出发点,顺时针方向向上转,最接近第3码的部件“串”,代码为“7”,最后确定该字的编码为“247”。(2)
读码路线同上,省略不写。该字基本码为“11”,加识别码“2”,全码为“112”。(3)
该字的基本码长“11”,识别码为“5”,全码为“115”。
第二类“合体字和横向字”以最后一个基本码为出发点,顺时针方向向左找,举例如下(1)
“横”的基本码长为“558”,识别码为“9”,全码为“5589”。(2)
该字的基本码长为“923”,识别码为空码,略去不计,全码为“923”。若设容错码,则全码为“9435”。(3)
该字全码为“974”,设容错码为“9741”或“9742”。(4)
该字的“忄”切为两段,对照表二,上段代码为“9”,下段为“2”,则全码为“9232”。(5)
同上,全码为“9742”。(6)
“俗”的全码是2868。(7)
“拣”的全码是7794。
五、复合造字部件的使用规则。
由两个单一部件对等合成的,缺少了其中一笔或部分,就不能表达该复合部件所要表达的信息或特征。这种部件,也叫不可再拆析复合部件,例如“交”(乂)、“小”(氵)、“串”(扌)、“八”(丷)、“框”(囗)、“顶”(亠),都是具有不可拆析性的部件,是字形信息载体。
从其往下划分,必须遵守以下两条操作规则(1)上述六种部件,若与其他部件连成一个独体字,则可切分或分离成为两个各自代表一个特征(信息)的部件使用。但这种切分必须在以下两个条件下进行1、切分或分离后,不改原部件的性质。例如“末”,上半看是“串”(代码为7),下半看是“小”(代码为9),它的编码是79,码长为2;2、被切分或分离出来的部分,必须能够有效地表达本方案所定的信息(特征)。例如“力”从左上角看,是“交”,(代码为5),从右角(转折角)看是“折”,(代码为4),“力”的编码是54,码长为2;又如“九”,左上看是“交”(5),右上看折(4),右下看也是折(4),这样切割的每一部分,都能有效地表达信息,同时又没有超越基本码长为三的规定,所以“九”的编码为544。再如“丰”与“串”,左上是“串”部件,一个竖笔贯穿两个横笔,代码为7,右下看前者为“交”(5)、后者为“串”(7),所以“丰”字的编码为75,“串”的编码为77,它们的码长均为2。
(2)每个部件只能使用一次,本发明方案规定的取码点中若出现空码,一概略去不计。
综上所述,需强调的一点即取码观察点必须固定化。即取码时必须以鲁班尺形为参照系,顺时针方向找,严格定位,以避免任意性。以下将对照上述原则,结合具体字符进行实际编码说明。
实施例一(对照表一、表二),描述如下1、严格按照曲尺形,顺时针方向取基本码,即“从左到右,从上至下”的写字规则,看角看边,沿字的最外侧最多取出三个基本码,一个部件只能用一次,出现空档,略去不计。例如“俗”遵循上述取码原则,起点为左上角,其笔形是“丨”,部件名为“竖”,代码为“2”,该码为第1码;接着顺时针看“俗”字的右上角为转折点,其笔形为“八”,部件名为“八”,代码为“8”,该码为第2码;然后顺时针继续往下看,其右下角为终止点,其笔形为“囗”,部件名为“框”,代码名为“6”,最后确定“俗”字的编码为“286”,码长为3,(该字无需识别码)。
“拣”,起始点为左上角,其笔形为
,部件名为“串”,代码为“7”,该码为第1码;接着顺时针看“拣”字的右上角为转折点,其笔形为“ ”,部件名为“串”,代码为“7”,该码为第2码;最后顺时针继续往下看,其右上角为终止点,其笔形为“小”,部件名为“小”,代码为“9”,最后确定“拣”字的编码为“779”,码长为3(同样该字无需添加识别码)。
“限”第1码即左上角,其笔形为“7”,部件名为“折”,代码名为“4”,第2码在右上角,其笔形为“7”,部件名又是“折”,代码名为“4”;第3码在右下角,其笔形为“ㄟ”,部件名为“点、捺”,代码为“3”,记做“443”。
“潜”第1码在左上角,笔形为“氵”,部件名为“小”,代码为“9”,第2码在右上角,其笔形为“扌”,部件名为“串”,代码为“7”;第3码在右下角,其笔形为“日”,部件名为“框”,代码为“6”,最后一码为区别码,则按“有框包围入内找”的规则,看“一”,代码是1,全码为“9761”。
2、有的字由单一部件构成,每个单一部件只记一码,其余取码点是空档,可以略去不计。
“一”第1码笔形为“一”,部件名为“横”,代码为“1”,第2、3码均是空码,略去不计,其编码就是“1”,码长为1。
“乙”该字的第1码笔形为“乙”是单笔部件,部件名为“折”,代码为“4”,略去两个空码,编码为“4”,其码长也是1。
有的字是左右结构或三条以上横向并列的。这类字如一、三。
“一”,左上看是“横”,右上看是空档,用 表示,略去不计。右下看也是空档,“一”字的全码是1,码长为1。
“三”字的全码为111,码长为3。
3、由复合部件单独构成的独体字,例如其中部件各为“串”的,着眼点在于穿透了两个横笔或其它部件的一“竖”,而被穿透的部件性质不变,仍旧可以作为独立部件使用。举例如下“中”字,左上角看,第一笔是“串”,代码为“7”;第二个部件笔形是“口”,代码为“6”;第3码和区别码都是空档,略去不计。该字编码为“76”,码长为2。
“串”字,第1码为7;第2码(看右上角),为“6”;第3码,看右下角,其笔形是“口”,代码为“6”;再顺时针方向从左下角看区别码是空档,或顺时针方向左旋往上看也是空档,略去不计。该“串”字全码为“766”,码长为3。
“事”字,第1码是7;第2码是空档,因为其中的“横”是单一部件,是不可拆折部件,“横”在任何情况下,都视为具有不可拆柝性,单一的“竖”亦然(下文不再另述);第3码(右下角)突出来的部分是“十”笔形,从最外侧看是一横笔横贯于一个“竖”笔,名为“交叉”笔形,代码为5。“事”字的区别码,顺时针方向左旋往上找,离右下角最近,独立性最强又最显眼的是“囗”(框),代码为6。“事”的基本码“75”,附上区别码“6”,其全码为“756”。
4、有的字是左右结构或三条以上横向并列的。这类字取点(码)时,要看外侧,最上端最下端。举例如下“校”字,左上端是“交叉”,代码为“5”;右上端,是“字顶”,点下接横,代码是“0”;右下端是“交叉”,代码为“5”,该字的基本码为“505”。区别码,顺时针方向往左下端找,距离右下角最后一个基本码最近的是“小字”部件,代码为9。“校”的全码是“5059”,码长为4。
“鹅”,第一码(左上)是“竖撇”,代码为2;第2码为“折拐”,代码为4;第3码,也是“折”4;区别码,从右下角出发顺时针方向往左下端找,与右下角最邻近的是“竖串”7。该字的全码为“2447”。
“彬”,第一码为“5”,第2码为“2”,第3码为“2”,第4码(区别码)为9。全码为5229。
“就”,第1码为0。第2码为3,第3码为4,第四码为9,全码为0349。
“发”,第1码为4,第2码为3,第3码为5,第4码,也是交叉,代码为5。该字全码为4355。
从上述字例中,不难看出,本方案取码、读码、编码有三条简明规则1、曲尺形取基本码,自左上一右上一右下,再从右下角出发按顺时针方向,遇独体字或竖三叠合体字,左旋向上找最邻近的显眼部件(含有新信息)取区别码;遇左左结构或三并列字,向左下端找最邻近部件取区别码。2、读码与编码,按顺时针方向排列顺序,十分简便。3、遇到无码可取的空档,一概略去不计,以缩短码长。
5、上下三叠字,据前述三条规则取码,举例如下“章”,字顶是“0”,为第一码;第二码点,为空档,略去不计;第三码,是“交叉”,代码为5;区别码顺时针方向左旋向上找,与第三码点最邻近的部件是“方框”,代码为6。“章”这个竖三叠合体字,它的全码为“056”,长度为3码。
“叠”字,第一码是“折”(4),第二码是空档,略去不计;第三码(右下)是“横”(1),第四码(区别码)左旋向上,最邻近的一个部位是“竖”(2)。该字的全码为“412”。
字(音cuàn,灶也。浙江丽水人说
面条”,则是名作动用)。第一码为2,第二码为4,第三码为3,第四码是9(火除去一捺作“小”字)。全码为“2439”。
6、有的字是呈全包围或左上、右上、左下、右下半包围,或上、下、左、右三包,或夹心式一上下夹住中间,如衷等,左右夹往中间,如辨等,这类字共同特点是包围部件的信息少,区分度低,对这类字取码方法分别具体规定如下(1)全包围外框取1码,6为第一码,然后入“框”自下而上取,码长上限仍为4。例如“国”,第一码取外“框”6,第二码入“框”自下取1(横的代码为1),第三码为空档略,再取横的上一笔“点”(代码为3),“3”为第四码(即区别码)。“国”字的全码是“613”。
“日”的全码是“61”。
“目”的全码是“611”。
“围”的全码为“674”。
“四”的全码为“68”。
“因”的全码为“635”。
(2)半包围和三包围字,最后的区别码必须在围内取。例如“病”,第一码看左外侧,是8;第二码为0;第三码为4;第四码(区别码)为8。全码“8048”。
“司”,是右上半包围字,第一码是“折”,代码为4;第二码(右上)、第三码(右下)都是空档(略去不计);第四码必须从围内取“框”,代码为6。该字全码为“46”。
“遵”,是左下半包围字,第一码是“点”,代码是3;右上,即第二码是“八”,代码为8;第三码围内取“交叉”,代码是5;第四码,顺时针方向往左,是“点”,代码为3。该字全码为“3853”。
三包围字,举例“同”,第一码取“竖”,代码为2;第二码顺时针方向取“折”,代码为4;第三码空档,略去不计;第四码(区别码)入围取“框”,代码为6。该字全码为“246”。
类似“同”字,上三包围字还有“问”、“赢”这种类型“问”,第一码取高笔“点”,代码3;第二码看右上,取“折”4;第三码看右下,空档,(略);第四码看围内取“框”6。该字全码为“346”。
“赢”(赢、赢等),第一码0;第二码空档(略);第三码看右下角“折”4;第四码顺时针入围取“女”字底“交叉”5。“赢”字全码为“045”。依此类推,“赢”字全码为048;“赢”字全码为047。
“叵”,是左侧三包围字。第一码取“横”,代码是1;第二码看右上角,是空档(略);第三码看右下角,入围内取“框”,代码6;第四码左看,是“折”4。该字全码为164。
“幽“,是下侧三包围字。第一码取内”折“4;第二码取内”折“4;第三码取右下,看一”竖“,代码为2,第四码看左侧外,取“折”4,全字为4424。
(3)夹心式的字举例“衣”部构形比较特别,本方案称之为夹心式的字。例如哀、衷、褒、裹。这类字为数不多,但自成一统。对这类字,读码编码作如下规定按顺时针方向读码,按曲尺形取码的原则不变的前提下,第4码(区别码)必取被夹的“心”的部件的左下部件定码。例如“衣”字,没有夹心,编码为034。
“哀”与“衣”不同。“哀”的第一码为“0”;第二码为空档(略);第三码是捺,代码是3;第四码(区别码)必须左旋向上看被夹部位的左下角,“哀”被夹的“心”是“框”,代码为6。该字全码为036。
“衷”,全码为037(“心”部位的“中”是名为“串”的部件);“褒”为032;“裹”为039;其余同类字,依此类推。
7、关于“竖心(忄、小)”这些偏旁的读码法上与下应切分为两个部件来取码。“忄”,上半截为“小”字,代码为9;下半截为“竖”字,代码为2,分离后,没有改变“小”(9)的性质。例“情”的全码为9742。“清”的全码为9741,本方案把“三点水”归入小(横卧的“小”字),如果把左下的一挑分离出来,就改变了“三点水”为“小”字部件的性质,所以“清”字的区别码不能取“挑”,只能从“月”字里边取一横(丨)。“木”与“小”等也应切分成两个部件。“木”字上为5,下为9;“末”字上为7,下为9。其余类似的字,依此类推。但“本”字不能切分为上下两截,“本”从左上角看是一竿子到底的“串”部位,代码为7;右上空档(略);右下角是被“串”隔开的“捺”,代码3;区别码,顺时针方向左旋,找左下角是“撇”,代码为2。“本”字的全码为732。
8、关于“折”(乚、乙)部件使用规定折是单一部件,一般情况下只作一个部件使用。但它是一个“巨型”单一部件,在成字过程中,往往要占据两个或两个以上取码点,只取一码,区分度极低,所以,对“折”特别规定如下①フ(书法中,说作横折竖钩),它只有一个折,本方案只取“折”(4)1码,如“刀”全码为42,“刁”全码为41,“司”为46。②“フ”与其他部件相交时,指的是相交点,切分开来仍是“折”,如“力”字,编码为54。③两个“折”相连时,又恰好分布在取码点上,可切分开来使用。例“九”编码为544,“几”为244,“乃”为442,“凹”为241,“凸”为2441。综上所述,本方案的识别性知识与操作性知识,都极为简易,要求识记的内容极少。设容错码如“录”字的正码为482,若误作488,也能打出该字来,若错码遇上与某字重码,则同时显示在“显示窗”,捺选字键即可进入文件,同时提示正确编码,表示在“显示窗”上。
此外,遇到字形太相近,本发明称之为“自然同码字”,但数量不多,只好“开窗”让它们在计算机显示屏上的显示框上同时出现,据需要临时挑选,如“已、己、巳”等字,至于用检字法上则另附编次第号方法解决。例子从略。
另外,对非汉语人名、地名以及进入汉语使用的非汉语词汇,统称为外来词,编码时一般都采用其原形,如“卡拉OK”。
对高频词语、固定结构、成语、歇后语、专用语串及诗词名句等设连打长码,取字第一码(左上码)连成长码,击字母“L”表示连击开始,然后至最后字击首尾两码表示结束。例如学生会L9283 中华人民共和国L72865261再接再厉L17114茅坑里的木棍一闻(文)不得,舞(武)不得L556255-3(0)12,2(1)1264实施例二日语汉字(真名)的打法,与中国汉字同,举例从略。但扣打前须扣“Z”键为指令,打出来即为日本汉字(少部分字写法不同如 等)。遇上日本从西方吸收的外来词,什么国家字母扣什么国家字母,或用片假名。又如遇上日本某些半中半西的词“空OK”(卡拉OK)空312,OK打英文键。
扣打日语假名,先扣“J”指令。编码以片假名字体为淮,打同来的是平假名;若要打片假名,则须先扣“P”指令,打出来的就是片假名,操作简便。
日语五十音图编码,见附件1、2中的各表,各表为了便于对照,附罗母字注音。
日语五十音图中横排称做“行”,共有十行。每行以该行的第一个假名命名。如“あ行”,“か行”,“さ行”等。纵列称做“段”,共有五段,每段以该段的第一个假名命名,分别称做“あ段”,“い段”,“ラ段”,“え段”,“お段”。
日语辞典中所收词条均按行和段的顺序排列,日语的一些语法规则也与此有关,所以必须熟记五十音图。
实施例三检字法的编码见字读码,如查“单”字876(与输入法同,不另)。
依号查字,如查“单”字字条,只要查“876”所在书页即可,可以免去查辞书目录之劳。
编排法依号分块,共分10块,0、1、2、3…9。
按码节排序先为1码节,2码节,3码节,4码节。
0 1 2 3依此类推。
00 11 220011112210111 1112 222图书编目法以书名每字第一码缩写(末节表区别,可写可不写)《草叶集》5620此外,在编程时注意事项如下词组、国名、人名、地市名、机关单位名(中国人民银行等)歇后语,唐诗宋词、元曲等名言名句(常用的)、名作名著(红楼梦)、工具名等等,可连续击每个字的第一码(左上角取),击扣完毕后,须扣D,表连击终止,恢复单打。
打数字指令S,表示打的数字,不是本方案的代码。但数字完后必须扣D,表示恢复单打。
打汉语拼音扣“H”,打英语扣“Y”键,打俄语扣“E”,打日语扣“R”,打希腊字母扣“X”,打法语扣“F”,打葡文扣“P”…打罗马字母扣“LM”,扣“D”表示终止,恢复汉字单打。
打汉字数字简便打法指令HSX0=0 1=一2=二3=三4=四5=五6=六7=七8=八9=九扣指令SD,以上数字即为大写汉字数字“零…玖”。
文件打印完毕,所用汉字均为国家法定标准印刷字体,改变为楷、隶、篆等与现行方法同。
若据特殊需要,改换为繁体字,扣HF指令,则所有简化字便依次更换为规范繁体字。
关于实施输入时,人机界面上信号(语言)的设定用本方案利用副键(数字键)输入启始指令扣正键EWSD单打指令D(表示1扣的代码,不是一般数字;2扣出的是单字,3若遇重码,则在文件外,窗口显示)附件1五十音图编码ニじゆラおんず五十音
-1

注に(二),两横只取其一,以缩短码长。
み(三),视为三捺,也只取其一,也是为了缩短码长。附件2ニじゆラおんずだくおん五十音
-2

濁 音
ごじゆラおんず はな だく おん五十音
-3
鼻濁音
ニじゆラおんずはん だく おん五十音
-4
半濁音
权利要求
1.汉字二维三点取码输入法,是一种将汉字编码实现电子计算机输入的汉字输入法,其特征在于该输入法由以下几部份组成(1)将汉字概括拆分为10个单、复部件,用计算机键盘上10个数字键或10个字母键作代码代表上述10个单、复部件;(2)采用二维三点取码规则;(3)高频词语、成语、谚语、专用语串及短语另行处理;(4)外来语的编码在原则上一律还原。
2.如权利要求1所述的汉字二维三点取码输入法,其特征在于本输入法最佳实施方案为采用十个数字键作代码代表10个单、复部件,在计算机键盘的副键上完成输入,其数字键与10个单、复部件对应见表如下部件名和代码对照表表二
3.如权利要求1所述的汉字二维三点取码输入法,其特征在于汉字二维三点取码规则为(1)确定每一个汉字码节的码长上限为4码,前3码为基本码,最后一码为识别码;(2)确定取码路线为曲尺形顺时针走向,即从汉字的左上角到右上角至右下角依次取码,看角看边,沿字的最外侧取基本码;(3)确定一个造字部件只能取一次码,出现空档即空码,一概跳过不计,即码长可以是1,也可以是2或3,上限为4;(4)确定以第3码(位于汉字右下角的部件)为出发点,顺时针方向找邻近的造字部件取识别(区别)码。
4.如权利要求1、3所述的汉字二维三点取码输入法,其特征在于识别码的取法有以下两点(1)遇“独体字或竖叠字”,识别码的取法为以第3个基本码为出发点,顺时针方向向上找;(2)遇“合体字和横向并列字”,识别码的取法为以第3个基本码为出发点,顺时针方向向左找。
5.如权利要求1所述的汉字二维三点取码输入法,其特征在于对高频词语、成语、谚语、专用语串及短语的编码方法为设连打长码,取每个字第1码(左上角),最后一字取首(第1码)尾(第3码、左下角)两码,连成长码,然后前缀字母“L”。
6.如权利要求1所述的汉字二维三点取码输入法,其特征在于对非汉语名、地名、以及进入汉语使用的非汉语词汇,统称为外来词,编码时一般都采用其原形。
全文摘要
本发明涉及一种汉字输入法即汉字二维三点取码输入法,其编码原理为:将汉字拆分成10个单、复部件,用10个数字键或10个字母键作代码,按照“二维三点”顺时针走向规则取码,确定一个汉字码节的码长上限为4码。该输入法记忆量小,集易学、规范、高效于一体。本输入法中西文兼容,可适用于汉字语言系统的输入,如中文、日语系统等,也可适用于字(词)典检字、图书编目录、户口编码,盲人打字及军事文件传递的编码等领域。
文档编号G06F3/023GK1267851SQ0010508
公开日2000年9月27日 申请日期2000年4月25日 优先权日2000年4月25日
发明者郭遵天, 任平 申请人:郭遵天, 任平
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1