声码汉字输入法的制作方法

文档序号:6569422阅读:201来源:国知局
专利名称:声码汉字输入法的制作方法
第一章声码汉字输入法概述第一节从中国人的拼字习惯说起汉字中有很多同音字。在日常生活中,中国人习惯根据汉字的偏旁组合来区分同音字,象“弓长张”、“立早章”、“白勺的”、“土也地”等等。声码汉字输入法(以下简称声码)就是根据中国人的这一拼字习惯将汉字分为本字、偏旁部首和笔划,分别根据其汉语读音用拼音声母编码组合,实现电脑汉字输入。
汉字的本字和笔划,都有其固有的汉语读音,而汉字的偏旁部首有很多就是汉字,也有固有的读音,但还有一部分不能单独成字,没有固有的读音。声码的作者对这部分没有固有读音的偏旁部首作了大量的删减,其余的参考《现代汉语词典》所列举的较为通行的偏旁部首读音,做了必要的整理和归类,形成了《声码部首和笔划编码表》(见附表)。
《声码部首和笔划编码表》B广、八(丷)P丿( )、(彡)D丶、冫(氵灬 )、刂T ( )N(ヘ )、鸟( )G亅( ㄋ 乙)、宀(冖)K口(凵冂匚 丨 )H一、J钅、己Q犭、七( )X忄、彐( )Z ( ㄑ )、 (巛)、辶(廴)
Cㄨ、艹(廾)、川( )S丨、 ( )、扌、饣、礻、纟(糸)、水( )、巳、厶、三R亻(彳)、日(曰)E阝(卩 )、儿( )、二W攵(夂)、无(旡)Y讠、衤、易( )上表主要收录声码中不能单独成为汉字的偏旁部首,大多数偏旁部首都可以单独成为汉字,有固有的汉语读音,所以除一部分需要归并的外,不在上表中收录。
从上表可以看出,声码删除了大量没有固有读音的部首,经过归并和整理后,只保留了人们熟悉的少量部首,声码使用者很快就可以掌握使用。
第二节 汉字的结构与编码汉字的结构是偏旁部首和笔划。
声码对汉字的偏旁部首进行压缩和归类的办法采取有通行读音的按读音归类,如“冫氵灬 ”、“口冂匚凵 ”、“阝卩 ”、“宀冖”等;没有通行读音的按笔划和形态进行归类,如“艹廾”、“儿 ”、“水 ”“彐 ”等。
声码对偏旁部首的大量压缩和归类使一些没有通行读音的偏旁部首归并到有通行读音的偏旁部首中去,最大的好处是声码使用者不需要专门记忆这些偏旁部首的编码,但也有一个问题是容易产生重码。不过作者发明声码的宗旨是“易学好用”,以非专业打字人士为主要使用对象,认为这样做还是值得的。
声码中使用的可以单独成字的汉字偏旁,基本上以《新华字典》中的汉字为限,对于超出此范围的过于生僻的汉字偏旁,象“彖、呙、 、 ”等,声码不再使用它们的拼音声母作为编码,而是以它们的部首或者笔划进行编码。
读者从《声码部首和笔划编码表》可以看出,声码用汉字八种基本笔划的声母编码,即“永字八法”中的“横、竖、撇、捺、折、点、提、钩”,因为这更符合中国人的书写和欣赏习惯。
使用声码,可以帮助使用者增加对汉字的理解和记忆。譬如“门市闹”、“薛子孽”、“亡目盲”、“亡心忘”、“撇去丢”、“日月明”等等,可以启发人们对汉字进行联想,提高记忆效果。
汉字中存在着多音字现象。为了对多音字实现正常输入,声码对常见的多音字采取了多重编码。譬如“重”字,无论是作为本字还是偏旁,声母用“C”或“Z”,都可以实现正常输入。但多音字作为汉字的声旁与本字声母相同时,则取与本字相同的声母作为编码。
总之,声码的设计方案试图体现以人为本的思想,一切围绕“易学好用”的原则进行创新设计,今后还将在实践中根据使用者的反馈意见不断完善。
现在,在电脑上写作的作家是越来越多了。但已有作家开始抱怨,“习惯了在电脑上敲字,一旦重新用笔写点什么,往往提笔忘字。中国人的思维习惯是以汉字的字型为基础的,而电脑消灭了对字型的感性认识,我不知道这对思维方式将会产生什么样的影响。是好是坏?我有点担心。”(摘自作家李方所著《我的电脑写作观》)不知道李方要是使用了按笔划为序和以汉字字形为基础的声码还会不会有这种感想?第二章 用声码输入汉字第一节 单字输入声码单字输入设有三个标准码,当输入标准码有重码时设有一个识别码。
一、标准码(一)、标准码的第一、第二个码1、除“一”和“乙”这两个单笔划汉字外,其它任何汉字都可看成由两个以上的结构(汉字、部首或笔划)组成,声码依次取其前两个结构的声母作为标准码的前两个码(双声母ZH、CH、SH只取Z、C、S;没有声母的取韵母的第一个字母,以下同。)。
字例“许”,各取偏旁部首“讠”和“午”的声母“Y”和“W”;字例“莫”,取“艹”和“日”的声母“C”和“R”;字例“事”,取笔划“一”和偏旁部首“口”的声母“H”和“K”;字例“案”,取“安”的韵母第一个字母“A”和“木”的声母“M”。
2、当按该汉字的结构顺序取码时,遇到几个结构可以组合成另一个汉字结构时,应取这个汉字结构的声母作为编码,这是声码的完整性。
字例“鹏”,前两个结构可组成“朋”字,编码应取“朋”和“鸟”的声母“P”和“N”;字例“测”,第一个编码为偏旁部首“氵”的声母“D”,第二个编码的后两个结构可组成“则”字,编码应取“则”的声母“Z”。
3、“一”和“乙”作为两个特殊的单笔划汉字,前两个码均取其笔划的声母。
字例“一”,两个码均为笔划“一”的声母“H”。
字例“乙”,两个码均为笔划“ ”的声母“G”。
(二)、标准码的第三个码取该字本字的拼音声母。
字例“声”,第三码取“S”。
字例“爱”,第三码取“A”。
二、识别码当在电脑上输入标准码有重码时(这时在屏幕上列有重码字。),除用数字键或空格键选择所需的字外,还可按以下方法输入识别码(一)、按声码编码规则,该汉字有三个以上编码结构的,取没编过码的最后一个编码为识别码。
字例“撤”,标准码的前两个码分别为“扌”和“育”的声母,识别码应为第三个结构“攵”的声母“W”;字例“嬴”,标准码的前两个码分别为“亡”和“口”的声母,识别码应取最后一个结构“凡”的声母“F”。
(二)、只有两个编码的汉字,取该汉字后一个编码的末尾结构(偏旁部首或笔划) 的声母作为识别码。字例“提”,后一个偏旁“是”由“日”和“正”组成,应取末尾结构“正”的声母“Z”作为识别码;字例“打”,取其后一个偏旁“丁”的末尾结构笔划“亅”的声母“G”作为识别码;字例“刀”,仍取其末尾结构笔划“丿”的声母“P”作为识别码。
三、简码字、标准码字和全码字(一)、一级简码字声码的一级简码字是根据标准码的第一个编码选出的较常用字,只键入一个码就可以按空格键输入。共有23个汉字A案、B的、C过、D为、E于、F放、G了、H和、J进、K已、L边、M本、N好、O欧、P人、Q期、R是、S有、T以、W这、X多、Y试、Z到。(二)二级简码字声码的二级简码字是当键入标准码的前两个码时可以直接按空格键输入的汉字,一般为经常使用的字。声码使用者可以在实践中逐渐掌握。
(三)三级标准码字声码的三级标准码字是键入标准码后可以按空格键输入的汉字,数量较多,声码使用者不必专门记忆,使用一段时间会自然熟悉。
(四)全码字需要完全输入标准码和识别码的就是声码的全码字。声码的全码字共有四个码,仍有重码字时会听到提示音,同时屏幕上会显示重码字,可用数字键或空格键选择输入。
第二节 词组输入(一)、二字词组输入取两个字的标准码,然后用空格键或数字键输入。
(二)、三字词组输入取第一个字的标准码和后两个字的声母,然后用空格键或数字键输入。(三)、四字以上词组取每个字的声母,然后用空格键或数字键输入。
第三节 声码的其他功能一、特殊码声码中设有三个特殊码(一)、“I”,万能码,也叫万能识别码。当不知道某个编码时,可用“I”作为代用码,但容易出现重码,这时可以用数字键选择。
(二)、“U”,常用字(一级汉字)/自然状态(一级和二级汉字)选择码。使用此键,可选择使用常用字或自然状态,减少重码字。
(三)、“V”,简化字/繁体字状态选择码。使用此键,可选择使用简化字或繁体字状态,方便海外人士使用。
二、自定义字词或短语声码可用自定义方式为不常见的字词或短语编码,并可以存入词库,方便日后输入。
三、智能声码设计有智能程序,它有两个作用(一)、对电脑上输入的字、词提示可相应衔接的字、词,输入者可根据需要选择。
(二)、对刚输入的词组和短语进行自动编码,生成新的词组和短语编码,输入者可根据需要选择存入词库。
注声码汉字输入法版本2000仅保留万能码“I”和自造词组功能,其他的智能、简繁转换以及常用字选择等功能,该版本暂时不设。
第三章 声码应用中需要注意的问题一、注意汉字偏旁结构中的生僻汉字使用声码的难点,不在声码本身,而在于人们不认识有些作为汉字偏旁的汉字。但这些字,都属于被《新华字典》收录的一二级国标汉字,而且经常出现在汉字结构里。
例如“堇、殳、亍、亥、佥、豕、敕、隹”等字。
声码使用者在汉字结构里看到这些不认识的字,可以查一查《新华字典》,或者使用万能码“i”,都能知道其声母。毕竟是一二级国标汉字,我们都应该能认识。
二、声码的完整性和兼顾性声码的完整性指的是编码的汉字结构应尽可能地完整。
例如彗星的“彗”,编码为“丰丰彗ffh”,而智慧的“慧”,编码则应是“彗心慧hxh”声码的兼顾性指的是在互相包容的汉字结构中,为了尽可能减少汉字的编码结构,需要兼顾前后两个结构的编码。
例如“容”字的结构应看做“宀谷”,而不是“穴人口”;“敢”字的左面结构应为“ 耳”,不是“ 三”。
声码的完整性体现了声码的原则性,而声码的兼顾性又表现了声码的灵活性。
三、声码不单纯以字形取码与大多数形码不同的是,声码不是单纯以字形取码,而是必须以连续的笔划形成的字形取码,否则需以部首或笔划取码。这是根据一些形码使用者反映打字久了写起字来觉得不顺畅和初学字者容易产生不按笔划顺序写字的实际情况,声码采取的特殊编码方式。
例如,“必”字按笔划书写不是“心+丿”;“可”也不是“丁+口”。因而声码对“必”的编码是“丶必dgb”;“可”的编码是“一口可hkk”,其他依次类推。
四、变体字汉字结构中存在不少变体字。“光、党、贸”中,就有人们熟悉的“小字头”、“尚字头”、“卯字头”。人们常说的“木易杨”、“羊大美”等,其实也是一种变体字。因为声码仍以这些变体字的本身读音声母编码,因而声码使用者有必要熟悉一下这些变体字。
下面是声码中用到的变体字举例(括弧内是其变体)止(走)正(是)儿(见)电(曳)四(罢)西(要)斤(丘)高(膏)鹿(麝)共(恭)兴(誉)穴(空)痂(瘸)尚(裳)卯(贸)庚(赓)屯(顿)六(商)禾(余)舌(舍)
麻(魔)樊(攀)算(纂)艮(即)毋(贯)匕(顷)己(改)莫(暮)爪(爱豸)丰(邦春) 半(判卷) 羊(羔着) 卉(奔贲)月(且目具) 小(光未步)五、多音字和多音字偏旁汉字中存在着多音字。为了对多音字实现正常输入,声码对多音字采取多重编码。譬如“重”和“长”字,无论声母用“C”或“Z”,都可以实现正常输入。
当多音字作为汉字偏旁出现时,为了不影响输入效率,声码对其采取保留熟悉读音,舍弃生僻读音的作法。
即对一部分人们熟悉的多音字作为偏旁时按其多重读音编码。这些字中有(括弧中为读音声母)系(X、J) 重(Z、C) 长(C、Z)曾(C、Z) 参(C、S) 番(F、P)辟(B、P) 会(H、K) 乐(L、Y)甫(F、P) 解(J、X) 单(D、S)而对另一部分人们不熟悉的多音字偏旁只以人们熟悉的读音编码。举例如下(括弧中为不作为编码的读音)奇(Ji) 翟(Di) 合(Ge)句(Gou)屯(Zun) 石(Dan)卒(Cu) 扁(Pian)见(Xian)且(Ju) 衰(CHuai) 万(Mo)乘(SHeng) 查(Za) 宿(Xiu)兹(Ci) 单(CHan)用多音字偏旁编码时,需要注意的一点是当多音字作为汉字的声旁与本字的声母相同时,则只取与本字相同的声母作为编码。
例如,“曾”作为“增”的声旁,应同发“Z”的音,“曾”此时的编码应为“Z”而不是“C”。
权利要求
1.将汉字结构(偏旁部首或笔划)的通行读音和汉字本身读音的拼音声母互相组合,便形成这个汉字的编码。
2.编码顺序为汉字的前两个结构的读音声母为第一、二个编码,汉字本身的读音声母为第三个编码。
3.根据笔划顺序形成的汉字结构编码,不按笔划顺序形成的汉字结构不作为编码结构。
4.当前三个编码有重码时,该汉字没有编过码的最后一个结构的读音声母为识别码;该汉字只有两个结构时,取后一个结构的最后一个偏旁部首或笔划的读音声母为识别码。
全文摘要
《声码汉字输入法》的主要功能有:一、兼有音码和形码的长处;二、以中国人的习惯方式和拼音声母编码;三、可以引导正确书写汉字。技术特点:除“一”和“乙”两个单笔划汉字外,声码将所有汉字看作两个以上结构(偏旁或笔划)组成,按中国人的拼读习惯依次以前两个读音的拼音声母和本字的声母互相组合作为汉字编码。例如:“言午许YWX”。声码对没有通行读音的部首作了压缩和归并,笔划使用“横竖撇捺折点提钩”的声母编码。
文档编号G06F3/023GK1344984SQ0011392
公开日2002年4月17日 申请日期2000年9月18日 优先权日2000年9月18日
发明者费建中 申请人:费建中
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1