汉字高速输入法及其编码的制作方法

文档序号:6605976阅读:370来源:国知局
专利名称:汉字高速输入法及其编码的制作方法
技术领域
本发明采用汉字笔顺的书写规范与汉字拼音相结合,三码为标准码长对汉字进行编码;汉字单字的输入为基础,以词、词组、词条、短语的导引输入为主导的计算机汉字输入法,称之为汉字高速输入法及其编码。
汉字高速输入法及其编码,是只要懂得汉字的正确书写规范及拼音,就能方便地掌握高速地进行计算机汉字输入的方法。故本发明具有将汉字识字教育、书写规范和普通话学习相结合为一体的特点。本发明属于语文教育与计算机汉字输入领域。
目前,所有的汉字编码,其标准码长均为四码及其以上,不管从输入速度和实用上,都不及三码制的快。并且,从前的编码中,输入速度快的,其选用的部件太多、规定太多,记忆量大,只适应专业人员使用;且其拆分规则往往破坏了汉字的基本结构原则和成字规范,不能与中小学语文教育相结合。本发明的目的是,为用户提供一个易记、易学、易懂,重码极少,符合汉字自身结构特点、成字规范,快捷高速进行计算机汉字输入的编码及输入方法。
其解决的方法是1.汉字分为常用字(以《新华字典》为准)和非常用字(以《现代汉语词典》为准,除去其所含《新华字典》内容及繁体字之部份)及繁体字。非常用字及繁体字的拆分、编码以常用字的拆分、编码标准为准。非常用字及繁体字的输入,使用功能键进行常用字和非常用字及繁体字之间的转换。
2.标准部件的选择设置2.1在《辞海》之部首笔画笔形索引中,选取所有不成字的部首作为基本标准部件,作为汉字拆分的基础。
用这部分部件拆分汉字,使汉字拆分达到了标准化、规范化,使学习者易记、易懂、易掌握,并能使学校的语文教育与计算机汉字编码及输入法的学习较好地结合。
2.2在《辞海》部首笔画笔形索引中,选取部分成字部首作标准部件。
2.3据汉字的成字规律、结构特点及编码的需要,在《新华字典》中选择一部分常用字作标准部件。
3.部件的分类及编码全部部件分为读数部件和读音部件。
3.1读数部件以不成字部件为主体,按下列原则进行读数编码。
3.1.1按五行顺口溜“金木水火土,他都走草路”,对应1、2、3、4、5、6、7、8、9、0进行编码。
3.1.2按笔型笔画数读数部件按部件始笔形、笔画之奇偶数、笔画有无交叉,照横(提)、竖、撇、点、折(钩),对应1、2、3、4、5、6、7、8、9、0进行编码。
奇数无交叉笔画部件
偶数及交叉笔画部件
交叉部件,不论其笔画之奇偶数,只依其始笔形,对应归入偶数部件类进行编码。
3.2读音部件成字部件取该字读音之首字母作编码。不成字部件,以其名称首字的读音之首字母作编码。详情见附表。
3.3不成字部件中,末笔为捺()笔的部件,不论其笔画的奇偶数及始笔形,只依其笔画有无交叉,特规定如下笔画无交叉,以“N”编码。
笔画有交叉,以“A”编码。
3.4连续两横笔及三横笔,无交叉,编为“2”、“3”码,有交叉编为“4”、“6”码。
3.5成字读音部件中,编码为“S”和“Y”的部件,笔画无交叉的编码对应调整为“U”和“V”有交叉的不变。
3.6自定义部件
为有效减少重码,方便进行编码,特规定以下为部件其(qi)字头,编码为“Q”;啤(pi)字头,编码为“P”;扁(pian)字底,编码为“P”;眉(mei)字头,编码为“M”骂(Ma)字头,编码为“M”;先(xian)字头,编码为“x”至(zhi)字头,编码为“Z”; 爫(
)爱(Ai)字头(型),编码为“A”;敝(Bi)字旁,编码为“B”;
)衣(yi)字底(型),编码为“Y”;
印(Yin)字旁(型),编码为“Y”;莫(Mo)字头,编码为“M”;3.8借用部件为减少重码,对以下部件编码进行调整,称为借用部件氵原为“三(san)点水”,编码为“S”;现借用为“沤(ou)字旁”,编码为“O”;口原为“方(Fang)匡儿”,编码为“F”,现借用为“囡(Nan)字匡“,编码”N“;
原为“四(si)字头(型)”,编码“S”,现借用为“罗(Luo)字头(型)”,编码“L”;原为“竹(zhu)字头”编码“Z”,现借用为“篷(peng)字头”编码“P”;又原编码为“Y”,现调整为“C”;寸原编码为“C”,现调整为“I”;饣原为“食(shi)字旁”,编码“S”,借用为“饿(e)字旁”,编码为“E”;言原编码为“V”,现调整为“A”;扌原编码为“T”,现调整为“I”;3.9特别规定部件
(彐、
)编码为“J”;戋(
)编码为“A”;
编码为“H”;攴编码为“P”。
3.10内涵部件选定一个部件,该部件根据编码的需要,还可以拆分出其它部件,这个部件称为内涵部件,同理,也可称之为外延部件。该类部件具有广泛的不确定性,按一定的规律,在特定环境中,又具有准确性。具体的说就是编第二码的部件,再拆分,取末部件,编第三码。
如“古”这个部件。在“沽”字中,按笔顺拆分为第一部件“氵”和第二部件(也是末部件)“古”。第一部件“氵”的编码“O”就是“沽”字编码的第一码;第二部件“古”整体取码,即取其读音之首字母“G”为“沽”字编码的第二码;第二部件“古”再拆分为部件“十”和部件“口”,取其末部件“口”的编码“K”为“沽”字的第三码,则“沽”字的编码为“OGK”。这里的部件“古”就是内涵部件。
在“湖”字中,按笔顺拆分为第一部件“氵”,第二部件“古”和第三部件(末部件)“月”。第一部件“氵”的编码“O”即为“湖”字的第一码第二部件“古”的编码“G”即为“湖”字的第二码;第三部件(末部件)“月”的编码“V”即为“湖”字的第三码。则“湖”字的编码为“OGV”,这里的部件“古”就不是内涵部件。
在“古”独立成字时,可拆分为部件“十”和部件“口”。以“古”字读音的首字母“G”为第一码;第一部件“十”的编码“S”为“古”字的第二码;第二部件“口”的编码“K”为“古”字的第三码,则“古”字的编码为“GSK”,这里的部件“古”也不是内涵部件。
汉字的编码,重码率高是个很大的困难,主要是不同的汉字可具有相同的部件,要有效消除重码,就要使部件在不同的位置及排列顺序中,具有不同的编码。故在本编码中特设置内涵部件(外延部件),就起到了这个作用。
4.汉字的拆分及编码4.1汉字单字编码,以三码为限。
4.2按汉字笔划书写规范顺序及成字、多笔优先原则进行拆分、编码。
4.3在汉字拆分中,第一部件只整体取码,不作再拆分。
4.4成字部件独立成字时,以该字读音之首字母为其编码的第一码;以其拆分后第一部件编码为该字编码的第二码;以其拆分后之末部件编码为该字编码的第三码。
4.5不能拆分为多笔部件的独体字,以该字读音之首字母为其编码的第一码;以其拆分后的第一部件编码为该字编码的第二码;以其拆分后的末部件编码为该字编码的第三码。
4.6单笔独体字,以该字读音之首字母为其编码的第一码;以其单笔形部件编码为其第二码,该类字只编为两码。
4.7汉字拆分为三个及以上部件时,按顺序,以第一部件编码为其第一码;以第二部件编码为其第二码;以末部件编码为其第三码。
4.8汉字拆分为两个部件,且第二部件为非单笔部件时,以第一部件编码为其第一码;以第二部件整体取码为其第二码;以第二部件再拆分后之末部件编码为其第三码。
4.9汉字拆分为两个部件,且第二部件为单笔部件时,以该汉字读音之首字母为其第一码;第一部件编码为其第二码;第二部件编码为其第三码。
5.导引输入法及导引码在汉字词、词组、词条、短语的输入中,以前一个汉字的全编码为导码,第二个汉字编码的首码为引码,组成词、词组、词条、短语的编码,称为导引码。用这种编码进行词、词组、词条、短语输入的方法,称为词、词组、词条、短语的导引输入法,简称导引输入法。
使用导引输入法进行词、词组、词条、短语的输入时,当输入第一个汉字的全码(即导码)后,该字就会上屏显示;然后再输入第二个汉字编码的第一码(即引码),若词库内有该词或词组、词条、短语,那么所需的词或词组、词条、短语就会直接或选择上屏。若没有,则接着输入第二个汉字的后两码,成为第二个汉字的全码,同时使之成为新的导码。随后紧随的汉字编码的第一码又成为新的引码。且当一个词、词组、词条、短语输入完毕后,只要不断句,最后一个汉字的编码又自动成为新的导码。如果在词、词组、词条、短语中,有连续几个汉字均不能成词输入,则自动按常规单字输入,当在输入随后的汉字编码的第一码后,有相关词出现,则前后两字的四编码又自动成为导引码,从而减少击键次数,避免了大量繁杂的菜单式选择提高了输入速度。
如要输入“具有相当规模的企业”这句话,当输入“具”字的编码“JT6”后,“具”字自动上屏显示,其编码即为导码,接着打“有”字的第一码“2”,在编码提示窗口就会显示“JT62”,若有重码,则“具有”就会显示在候选窗口里,供选择上屏;若没有重码,则“具有”一词就会直接上屏显示;当“具有”一词上屏显示后,编码提示窗口就由计算机自动变更,显示“有”字的全码“2V2”;这时,“有”字的编码就成了导码,然后输入“相”字编码的第一码“2”,编码提示窗口就显示“2V22”,因没有“有相”这个词,继续输入“相”字的第二、三码,编码提示窗口显示“相”字的全码“2M3”,“相”字上屏显示,然后再输入“当”字的编码的第一码,编码提示窗口显示“2M3X”,候选窗口显示“相当”“相当规模”等词、词组,选择“相当规模”,则“相当规模”词组上屏显示,编码提示窗口自动显示“模”字的全编码“2MD”,再输入“的”字编码的第一码“B”,编码提示窗口显示“2MDB”,但没有“模的”一词,继续输入“的”字编码的第二、三码,编码提示窗口显示“的”的全码“BU7”,“的”字上屏显示;输入“企”字编码的第一码,编码提示窗口显示“BU76”,但没有“的企”一词,继续输入“企”字编码的第二、三码,编码提示窗口显示“企”字的全码“6Z1”,“企”字上屏显示;输入“业”字编码的第一码“Y”,编码提示窗口显示“6Z1Y”,按前述,则“企业”一词就会上屏显示,这样,最多击打18次键盘,就快速地输入了“具有相当规模的企业”这句九个字的话,而如果用四码制编码输入,则最少需击键28次以上。
导引输入法,是三码制单字编码输入基础上形成的四码制的词、词组、词条、短语的编码输入法,能够明显而有效地减少输入过程中的击键次数及大量的多重菜单式的选择,且具有自动的连续导引特性,从而达到了提高输入速度,进行汉字高速输入的目的。
6.附表说明6.1附表一为读音成字部件表。
6.2附表二为读音不成字部件表。
6.3附表三为特别部件表。
6.4附表四为读数部件6.4.1附表四(一)为按顺口溜“金木水火土,他都走草路”对应取码的读数部件表。
6.4.2附表四(二)为按笔划、笔型、奇偶数及是否交叉对应取码的读数部件表。
附表一读音成字部件
<p>附表二读音不成字部件
附表三特别部件
附表四读数部件一、按顺口溜“金木水火土,他都走草路”
二、按笔划、笔型、奇偶数及是否交叉
权利要求
汉字高速输入法及其编码1.汉字高速输入法及其编码,是以三码为标准码长编码的,单个汉字输入为基础,以词、词组、词条、短句的导引输入为主导汉字输入方法,是本发明的核心。其特征在1.1码长以三码为限进行汉字编码,减少汉字单字输入击键次数25%,使汉字输入速度提高了25%。1.2采用导引输入法,主要是在汉字输入时,以词、词组、词条、短语输入为主导,虽以单字输入为基础,但不再大量逐字输入,从而得到较高的汉字输入速度。
2.根据权利要求1,三码码长编码汉字的分类,部件的选择、分类之特征为2.1把汉字分为常用字(以《新华字典》为准)和非常用字(以《现代汉语词典》为准,除去其所含《新华字典》内容及繁体字之部分)和繁体字。在编码输入时,以常用字的拆分、编码为准,非常用字和繁体字的输入,用功能键进行常用字和非常用字及繁体字的转换。2.2读数部件按五行顺口溜“金木水火土,他都走草路”,对应1、2、3、4、5、6、7、8、9、0进行编码。
按部件始笔形、笔画之奇偶数、笔画有无交叉,照横(提)、竖、撇、点、折(钩),对应1、2、3、4、5、6、7、8、9、0进行编码。奇数无交叉笔画部件
偶数及交叉笔画部件
读数部件,详见附表四。2.3部分不成字部件,以其通常的名称首字读音的首字母为编码,作为读音部件之一。详见附表二。2.4选择部分常用的具有代表性的汉字,以其读音的首字母为编码,作为读音部件之一。详见附表一。2.5为编码之需,规定部分特别部件,详见附表三。2.6汉字拆分之末部件为不成字部件,且其末笔为捺()笔时,不论其笔画的奇偶数及始笔形,只依其笔画有无交叉,规定如下笔画无交叉,以“N”编码,笔画有交叉,以“A”编码。2.7连续两横笔、三横笔,无交叉,编为“2”、“3”码,有交叉编为“4”、“6”码。2.8内函部件选定一个多笔部件,该部件根据编码的需要,还可以拆分出其它部件,这个多笔部件称为内函部件,同理,也可称之为外延部件。内函部件,由于它在不同的位置具有不同的编码,因此内函部件是减少重码的重要方法。它只适用于汉字第一次拆分后的末部件,不能用于首部件。因此这种方法也适用于非三码标准码长的音码、型码及音型码的编码。
3.根据权利要求1,三码制编码特征为3.1单字编码码长以三码为限。3.2按汉字笔划书写规范顺序及成字、多笔优先原则,进行拆分编码。3.3汉字拆分部件在三个及其以上时,以第一部件编码为该字第一码;以第二部件编码为该字第二码;以末部件编码为该字第三码。3.4成字部件独立成字时,以该字读音之首字母为其编码的第一码;以其拆分后之第一部件编码为该字的第二码;以其拆分后之末部件编码为该字编码的第三码。3.5不能拆分为多笔部件的独体字,以该字读音之首字母为其编码的第一码;以其拆分后之第一部件编码为该字编码的第二码;以其拆分后之末部件编码为该字编码的第三码。3.6单笔独体字,以该字读音之首字母为其编码的第一码;以其单笔形部件编码为其第二码,该类字只编为两码。3.7汉字拆分为两个部件,且第二部件为非单笔部件时,以第一部件编码为其第一码;以第二部件整体取码为其第二码;以第二部件再拆分后之末部件编码为其第三码。3.8汉字拆分为两个部,且第二部件为单笔部件时,以该汉字读音之首字母为其第一码;第一部件编码为其第二码;第二部件编码为其第三码。3.9汉字拆分时,第一部件只整体取码,不作再拆分。
4.根据权利要求1,在汉字词、词组、词条及短语中,以前一个汉字的全编码为导,第二个汉字的首码为引,组成词、词组、词条及短语的编码,称为导引码。用这种编码进行词、词组、词条、短语输入的方法,称为词、词组、词条、短语的导引输入法,简称导引输入法。其特征为4.1导引输入法,是把词、词组、词条、短语的第一个汉字的编码为导码,第二个汉字编码的第一码为引码,得到词、词组、词条及短语的导引码。因此导引码是词、词组、词条及短语的一种新的编码方法。4.2导引输入法对词、词组、词条、短语的编码码长是四码,不会与单个汉字的标准码长三码相冲突,也不会与单字编码产生重码。4.3使用导引输入法进行词、词组、词条、短语的输入时,当输入第一个汉字的全码(导码)后,该字就会上屏显示,然后再输入第二个汉字的第一码(即引码),若词库内有该词、词组、词条或短语,那么所需的词、词组、词条、短语就会上屏显示。若没有,则接着输入第二个汉字的后两码,成为第二字的全码同时又是下一个词的导码。且当一个词、词组、词条、短语输入完毕后,只要不断句,其最后一个汉字的编码又自动成为新的导码。因此,具有连续导引特性。故导引输入法是高速输入法的重要核心,三码制的单字编码是高速输入法的重要核心的重要组成部分。4.4两码编码的汉字,在导引输入过程中,以添加“0”为第三码的方法,使之成为三码字。在非导引输入中,仍然使用两码。
5.根据权利要求1、4,导引输入法同样适用于音码、形码、形音码的非三码制的汉字编码及输入。
6.根据权利要求1、4,本发明原理同样适用于汉字的手写输入及其编码。
7.根据权利要求1、4,本发明原理同样适用于汉字的口语输入及其编码。
8.本发明使用两个提示窗口。一个窗口提示汉字的编码,使输入人员随时知道已经输入的编码是导码、引码或是导引码。一个窗口提供汉字、词、词组、词条、短语的候选,以便有重码时,供录入员选择。
9.本发明编码具有简单、逻辑性强,重码率低,输入速度快的特点,且严格按照汉字的结构特点和书写规范进行编码,故适用于中小学语文教育和计算机汉字的高速输入。
10.保留本发明基本原理,使用在著作、研究、教学(音像制品)及计算机光盘、软盘制作的权利。
全文摘要
本发明选用汉字偏旁部首和常用汉字作部件,严格按照书写规范顺序对汉字进行拆分,用部件读音及笔形笔划进行编码;以三码制编码的单个汉字输入为基础,以词、词组、词条、短句的导引输入为主导的汉字高速输入法及其编码。本编码与汉字读音和书写规范相结合,单字编码与词语编码相结合。汉字标准部首和常用汉字,是大家经常使用和熟悉的,易记易懂,与汉字识字教育相结合,不但适合中小学语文及计算机普及教育,更适合专业人员和成年人学习和使用。
文档编号G06F3/023GK1232208SQ99104358
公开日1999年10月20日 申请日期1999年4月14日 优先权日1999年4月14日
发明者谭吉运 申请人:谭吉运
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1