汉字音形码计算机键盘输入法的制作方法

文档序号:6416305阅读:237来源:国知局
专利名称:汉字音形码计算机键盘输入法的制作方法
技术领域
本发明属于汉字编码方法及汉字信息计算机键盘输入方法领域。
目前,常用的汉字计算机输入方法多为纯形码或纯音码。纯形码为了减少重码使拆字规则变得很多而造成难记难学,纯音码由于重码字太多需要选字而使输入速度太慢。音形码编码方法避开了上述困难,采用音形结合的方法对汉字进行编码,使拆字的规则变得非常简单,且对国标GB-2312(80)中全部汉字进行编码时无一重码。音形码既可对汉字编码,也可对汉语词组编码,还可对非汉字符号(例如希腊字母、罗马数字、特殊符号等)编码。同时其编码容量又可容纳10万条词组,能满足各方面的需要。音形码依据标准通用键盘编码。
一、汉字的编码音形码的汉字全码共四码,第一码为音码,第二、三、四码为形码。
(1)音码的编码规则音形码编码的第一个字符代表该字的读音,例如汉语拼音方案中“我、你、他、发、看、民、然、平、在、次、所”等字的声母分别是“W、N、T、F、K、M、R、P、Z、C、S”,声母是上面字母的汉字在编码时音码就取上面的字母。汉字的拼音以“A、E、O”开头的字称为“零声母”字,因为它们包含的字都很少,共有一百多个字,合并后被安排在数字键“0”上。以“Y”、“L”为声母的汉字非常多,该方法将这些字按音序排列放到相邻键“Y、U、I”及“L、;、’”上。以“Q、D、X、B”为声母的字也较多,就分别让他们的“邻居”“1、E、A、V”来共同承担任务。以卷舌音“zh、ch、sh”为声母的字分别位于数字键“2,3”、“4,5”、“6,7”上……,全部音码的排列位置见附图

在附图中可以看出,同声母较多的汉字要占据两个或三个字符键,每个字符键上标出了代表它分配汉字读音的字母组合。例如“B”字键上写着“ba-be”,代表读音是“ba、bai、ban、bang、bao、bei、ben、beng”的汉字被安排在“B”字键上;“V”字键上写着“bi-bu”,代表该键上有读音是“bi、bian、biao、bie、bin、bing、bo、bu”的汉字。再例如“2”字键上写着“zha-zhe”,代表读音是“zha、zhai、zhan、zhang、zhao、zhe、zhei、zhen、zheng”的汉字就安排在“2”字键上。
采取以上将音码匀摊搭配的方案后,大大减少了汉字的重码机会,此方案称为“音码匀配”方案。
(2)形码的编码规则汉字大多是由几个部分组成的,例如“问”字是由“门、口”两个部分组成的,“碧”字是由“王、白、石”三个部分组成的,“酸”字是由“酉、厶、八、攵”四部分组成的……。构成汉字的每一部分叫作一个部件,大部分部件本身也是一个汉字。音形码选取其中的168个部件作为构成汉字的基本元素,将它们按起笔的笔画顺序有规律的安排在40个字符键上。
音形码选取的部件及位置安排见附图。
从图可以看出横起笔的部件共有41个,在第一排从左向右排列,分别位于从“1”到“0”的十个数字键上;竖起笔的部件共有30个,在第二排从右向左排列,分别位于从“]”到“Y”的七个字符键上;撇起笔的部件共有41个,位置安排是从第二排的“T”键向左到“Q”键,再从第三排的“A”键向右拐到“F”键,共占九个键位;点起笔的部件共有30个,分布在第三排的“G”键到“’”键及第四排的“M”键上;折起笔的部件共有26个,放在“N”到“Z”键上。全部键位排列的顺序为横“W”形。
音形码的部件安排相当好记,每个键上安排的第一个部件可用下面的口诀来帮助记忆。
一二三木五厂七西寸大业止口日山曲水长人和鱼牛犬鸟豸彳门立心广方将心病医子女马弓习(注上面口诀中,“和、医”分别是“禾、乙”的谐音“牛、犬、将、病”及第二个“心”分别代表牛字旁、犬字旁、将字旁、病字旁及竖心旁。)记住了各个键上的第一个部件后,用联想的方法记忆其余部件。因为其余部件有不少是和第一个部件在形状上是很相似的,或者在其它方面有一些联系。例如“2”字键上的部件都有两横、“3”字键上的部件都有三横、“4”字键上的“豕”字与“4”字是谐音,部件“镸”又是“肆”字的一部分。还有“R”是“人”字拼音的声母,“八”字和“人”字相似,该键上有“
”,两边邻居有“丿”和“彡”。再如“’”、“;”上有“丶”、“冫”,而“氵”、“灬”和它们是邻居;“D”字像月亮,“月”字就在该键上;“O”字像太阳和眼睛,“日”字和“目”字就安排在它的上面……。
音形码在取形码时,按照汉字的书写顺序依次选取,且每次都取笔画最多的部件来编码。例如“高”字就应按“
、冂、口”的拆分方法来编码,其形码为“JYP”,它的完整编码为“GJYP”,而不能将“高”字拆为“亠、口、冂、口”。若汉字本身就是音形码所选取的部件,它只有一个形码,就对该字再重复取码两次,使它的形码成为相同的三位码。例如“可”字,该部件在“1”键上,那么它的形码就为“111”,其完整编码为“K111”。若汉字只能分为两个部件,就对它的第二个部件再重复取码一次,使它的形码也达到三位。例如“汪、们、听”三字的音形码编码分别为“WL33、MRGG、TPFF”。如果汉字是由三个以上的部件构成的,就取它的第一个、第二个和最后一个部件来进行编码,例如“彰”字是由“立、日、十、彡”构成的,其中部件“十”不编码,“彰”字的音形码编码就是“2HOE”。因为有按书写顺序每次都取笔画最多的部件的规定,“天”字应分为“二、人”,不能分为“一、大”;“主”字要分为“亠、土”,不要分为“丶、王”。
音形码输入法规定在输入“匚、口”这两个部件时,考虑到它们的完整性,不能绝对按汉字书写顺序取码,即允许“倒插笔”。在输入“必”字时,当作先写“心”再写“丿”输入“豕”时,当作先写“豕”再写“丶”。此外,所有汉字的拆分都必须严格按照正确的书写顺序进行。
考虑到初学者对某些字的拆分易出错,本输入方法设置了一些容错码。例如“办”字,它的后两笔应是两个点,但很容易当作“八”字来输入,故“办”字可用“BN””输入,也可用“BNRR”输入;“秉”拆分方法究竟是“丿、一、
、小”,还是“丿、十、
、八”?不同的笔画字典说法也不一致。音形码兼顾两种拆分方法,既可用“VT1Y”输入,也可用“VT0R”输入。
在音形码汉字输入方法中,绝大多数单字都具有简码。其中一级简码39个,二级简码1200多个,三级简码有5000多个,大多数常用汉字都有二级和三级简码。简码字多是本编码方法的明显优势。
(3)汉字偏旁的输入和“离散码”汉字偏旁的读音历来是不一致的,有的就无法读音。音形码将它们的第一键都放在字母“O”上,第二键和第三键是“PP”,代表“偏旁”,最后一键是它第一笔的形码。例如“宀”,输入“OPP’”后,所有点起笔的偏旁都显示出来,“宀”排在第9位,将它挑出来就行了。
尽管音形码汉字输入方法精心设计,将汉字进行了有效的分散,但是还有极个别的字重码,不过这仅有的60对汉字中,几乎每对都有一个是冷僻字,就将冷僻字的音码改为“O”,形码不变,这样,所有的汉字就无一重码了。音码改为“O”的汉字的编码叫’离散码”。
需用离散码输入的汉字是耷、轵、汞、聱、玫、毂、嘉、赭、砺、蓦、苜、甍、茼、霖、酶、丕、掭、贽、捃、焱、趾、赀、趿、嬲、蝥、貘、脘、皎、郫、闳、赢、屺、讧、麽、潢、黉、褡、疱、瘘、飨、瞑、暌、罟、哽、嗜、呙、犏、笙、俨、馊、钛、镛、郛、锔、蜈、螅、蛐、驽、幡、帙。其中只有汞、玫、嘉、霖、酶、趾6个字是GB-2312(80)中的一级字,需要记忆,其它字一般是用不到的,勿需记忆。
(4)查询码的使用音形码的第一码是音码,对于不认识的字,第一码可用“`”代替符号“`”叫查询码。在输入不认识的字时,只用将音码改为“`”,其形码不变。例如“亍”字的读音为“chu”,其编码为“52II”,如果不认识这个字,就按“`2II”输入,这个字就上屏了。
(5)非汉字符号的编码非汉字符号包括希腊字母、罗马数字、带圈或带点的数字及一些特殊符号。它们的编码的第一位都是“O”。
希腊字母编码的前两位是“OX”,其中“X”为“希”字的音码。后两位是该字母的读音,读音是一个汉语音节的取一个音码,读音超过一个汉语音节的取第一个和最后一个音节的音码。例如“φ”的编码为“OXF”,“α”的编码为“OX0F”。
罗马数字包括Ⅰ~Ⅻ共计12个数字,它们的编码的前两位是“O’”,其中“’”为“罗马”的罗字的音码。第三位和第四位是该罗马数字的序数,分别是从1~12的数字。例如“Ⅶ”的编码为“O’8”。
带圈数字是指“①、②…⑩”这些数字,它们的编码的前两位为“O1”,其中“1”是“圈”字的音码,后面的编码就是该数字,例如“⑨”的编码为“O19”。带点数字是指“1.、2.…20.”这些数字,它们的编码的前两位是“OE”,其中“E”是“点”字的音码,例如“18.”的编码为“OE18”。
特殊符号包括常见的数学符号、标记符号等,它们的编码的前两位为“OT”,其中“T”是“特”字的音码,后两位按它的汉语读音编码。例如“>”的编码为“OTDI”,“DI”代表“大于”;“℃”的编码为“OT6E”,其中“6E”代表“摄氏度”。三、词语的编码音形码汉字输入方法对词语进行编码时,所有词都取四码。二字词依次取其单字编码的前两码;三字词依次取每个字的第一码和第三字的第二码;四字词及四字以上的词(称为多字词)取第一、第二、第三及最后一字的第一码。例如“作文”取“作”字编码“ZRT2”的前两码“ZR”及“文”字编码“WHHH”的前两码“WH”,构成“作文”一词的编码“ZRWH”;“计算机”的编码为“JSJ4”;“改革开放”的编码为“GGKF”;“邓小平理论”的编码为“DXP’”。
在进行词语输入时,如果遇到编码为离散码的字,仍按正常码进行编码输入。
综上所述,利用音形码输入汉字,规律性强,记忆量小,学习容易,用途广泛,适合于专业人员高速盲打,也适合于非专业人员较快的学习和掌握。
权利要求
1.一种汉字音形码计算机键盘输入法,其特征在于汉字的编码信息取自汉字的读音(音码)及汉字字形的部件(形码),该音形码共用四位,第一位是汉字的读音代码,然后是汉字的第一、第二及最后一个部件代码。
2.权利要求1中音形码音码的特征为将汉字按读音比较均匀的分配在各字符键上,声母相同的汉字可以占2~3个字符键,各个汉字的音码就是它所在键的字符。
3.音形码形码的特征为将所有组成汉字的音形码部件按起笔的笔画“横、竖、撇、点、折”的顺序分配在各字符键上,键上的字符就是这些部件的代码,每个代码对应二至五个部件。
4.根据权利要求1、2、3所述的音形码,其特征在于由音形码所规定的部件组成汉字,其音形码部件的拆分规则是按照汉字书写的规范笔顺将汉字拆分成音形码部件,且每次得到的都是笔画最多的部件,不能构成规范部件时依次取笔画编码。
5.根据权利要求1、2、3、4所述的音形码,其特征在于对国标GB-2312(80)中的全部汉字编码,在遇到极个别的汉字重码(共有60对)时,将每对中的一个不常用汉字的音码改为“O”,其形码不变,使全部汉字的编码无一重码。
6.根据权利要求1、2、3、4所述的音形码,其特征在于对不认识的汉字编码时,将其音码视为“`”(此符号称查询码,在标准键盘的左上角),形码不变。
7.根据权利要求1、2、3、4所述的音形码,其特征在于给词组编码时采用二字词依次取各字的前两码,三字词依次取各字的第一码再加上第三字的第二码,多字词依次取第一、第二、第三及最后一字的第一码。
8.音形码对非汉字符号编码时,其特征在于所有非汉字符号的第一码都用“O”,希腊字母的第二码用“X”(希字的音码),罗马数字的第二码用“’”(罗字的音码),特殊符号的第二码用“T”(特字的音码)。非汉字符号的第三码和第四码是该符号的读音编码。
全文摘要
汉字音形码计算机键盘输入法,本发明属于计算机键盘汉字输入方法领域。音形码以汉字的读音和字形进行编码。编码严格遵循汉字的读音规范及书写规范,使用者只要能对汉字进行读和写,就可很快掌握这个输入方法。该方法实现了全部汉字输入无一重码,不认识的字也不影响输入,同时又可输入希腊字母、罗马数字和特殊符号。由于该方法能容纳10万条词语,所以字和词的输入速度相当快。音形码是一种易学、快速的输入方法。
文档编号G06F3/023GK1234545SQ99103918
公开日1999年11月10日 申请日期1999年3月5日 优先权日1999年3月5日
发明者刘塽, 冉流霞 申请人:刘塽
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1