新形声码汉语输入法的制作方法

文档序号:6556307阅读:334来源:国知局
专利名称:新形声码汉语输入法的制作方法
技术领域
新形声码汉语输入法是以形声码(一种具有音码属性的形码)为基础,兼容音码与形码、简体字与繁体字、字母键盘与数字键盘的汉语键盘输入方案,应用于中文信息处理;它是形声码(双向识别的汉字形声码、申请号97106847.X)适应21世纪的新发展。
背景技术
当今21世纪的汉语计算机输入技术在三大领域都达到很高的境界(1)语音输入、(2)字形输入、(3)键盘编码输入。字形输入的二种方式1)手写动态输入,与2)印刷体扫描输入,都达到完善的地步。语音输入也走向实用。作为最基本的计算机的输入方式键盘编码输入近年来亦在提高,如微软拼音,采用同音字的智能选择,很有成效。但形码方案还未见突破性的进展。这表现为至今没有一种其易学性可与拼音相比,其舒适性可与手写相比的全民可以选择的形码。

发明内容
本发明的研究目的就在于试图创建一种迎合21世纪当前与未来的满足千家万户、各行各业的全民需要的形码输入法。
本发明实现这目的的方法与原理如下汉语的语素具有字、词二个层次。音码较优于词输入,形码较优于字输入。形声码是一种具有音码属性的形码,就可以合乎逻辑地将音码与形码统一在一个输入方案里,称之为“新形声码”。词输入时,音码与形码可以趋于一致,字输入时,音码与形码可以混合输入,或从音码过渡到形码。
形声码为4位限长码,选用正体字根约170个,加变体、变形字根共约260个。字根按其读音声母取码,Ch、Sh、Zh分别占用V、I、A键,YU音占用U键,字根“木”与“十”定码于“O”,笔画一、丨、丿、丶、乙,定于H、I、P、D、A键,共26键位。详见简体字键位字根表。应用于繁体字时,将简体字部首改为繁体字部首,再加几个字根。其字根拆分采用2次分解法,连同字、词组码规则详见“新形声码编码流程图”(附图一)。
新形声码为抑制重码采用编码分区法。它将字码分为4区,1码、2码、3码、4码。1、2、3码区内没有重码,遇重码时加识别码。重码只发生在4码区内。1码字26个,当其作为部件组字时,若不是字根,亦不再拆分,而连击2次。但当字的字根码数超过4位时,改击1次。组成2字词时,亦连击2次。这次新形声码增设少量双码字根,对于简体字仅有2个麻与鹿,其字码为双码后加首、末笔画码,即m m d d与l l d a。当其组字与组词时,与1码字同样处理。
新形声码的词码亦增设词简码,2字词的简码为2位、3位,3字词的简码为3位。词简码是没有重码的,这是词码的分区管理。字码与词码,用不同的结束符 与“;”加以分隔,避免了字、词的交叉重码。
新形声码的字输入可以有全拼、形声、与形声+全拼混合三种编码方式。简体字、繁体字、与扩展汉字(前二者以外的国标扩展汉字)三种字体分设三区,用功能键切换。它将简体字与繁体字均视作基本字集。繁体字除国标繁体外,另选入部分异体、别体、旧字形字共约7500字。扩展汉字区没有词码。
新形声码同样可用于数字键盘,只不过数字键必须与字母键一一对应。用(2-9)单键表示第一排字母,用1+(2-9)双键表示第二排字母,用0+(2-9)双键表示第三排字母,用1+1连击表示字母S,用0+0连击表示字母Z。字母的数字码长平均为1.7。单手三指操作,可盲打得很快的输入速度。这为手机的字处理电脑功能的实用化,提供了条件。假如将来有一种手动滚轮式微型打印机,便组成汉字电脑笔,这是第四代汉字书写工具。


有关新形声码的字根拆分规则与字、词组码规则均已集成在一张图中,“新形声码编码流程图”(附图一)。
具体实施例方式新形声码输入法要通过编程、装入操作系统,才能供人使用。微软的Windows提供了这种方便,其功能也很完备。
作为形码,除了要有好的结构与原理外,必须创建一种与之相适应的培训方法。发明容易推广难。在96-97年培训小学三年级学生时,试验成功了“新培训法”。将编码学习化解于指法练习之中,不背字根,不记规则。这经验指明编码规则与字根设置是形码发明人思考的事。作为编码使用者,无需关注这些繁琐的规则,与众多的字根总量。通过计算机,对一码字、二码字进行扫描录入练习,自然形成“字形-部件-字根-键位”的联想,获得见字击键的条件反射。现在要创建一种正用拼音输入的成年人转用形声码的快捷、舒适的自学方法。然后,在英特网上进行推广。
后一页简体字键位字根表。
简体字键位字根表 曰→U仅用于“昌、冒、冕、汨”;大→O仅用于“戎、辩”。
权利要求
1.新形声码汉语输入法是以形声码为基础,兼容音码与形码、字母键盘与数字键盘的汉语编码输入法,其特征在于>=3字的词码由组词的字的读音首字母组成,字输入可以是全拼音、形声码、或二者的混合,二字词的词码可以是拼音码、或者是形声码,由所选的字输入状态而定。
2.如前所述的权利要求1,其特征在于形声码采用4位限长码,正体字根约170个,加变体、变形字根共约260个,全部按字根读音声母定码,Ch、Sh、Zh定位于V、I、A键,YU音定位于U键,字根“木”、“十”定码于“O”键,笔画一、丨、丿、丶、乙定位于H、I、P、D、A键,共26键位。
3.如前所述的权利要求1、2,其特征在于形声码的字根拆分采用二次分解法(1)先分解为部件,(2)抽取一个最大字根而解体。
4.如前所述的权利要求1、2,其特征在于形声码的一码字组成二字词时,连击二次,作为部件组字时,若不是字根亦不再拆分,而连击二次,但当字的字根码长超过4位时,仍击一次。
5.如前所述的权利要求1、2,其特征在于新形声码将某些部首字设为双码字根,其字码为字根双码+首、末笔画码,取2--4位,当其组成二字词、或作为部件组字时,与一码字同样处理。
6.如前所述的权利要求1,其特征在于新形声码采用编码分区管理法形声码的字码的1、2、3码区内无重码,遇重码时则加识别码(本字读音首字母或末笔画码)以消重。
7.如前所述的权利要求1、6,其特征在于新形声码增设词简码2字词、3字词由字的拼音首字母组码,2、3位,再加末字末字母组成2字词的次简码、3字词的全码,词简码无重码。
8.如前所述的权利要求1、6,其特征在于新形声码对字码与词码采用不同的结束符“ ”与“;”,以分隔字码区与词码区,消除交叉重码。
9.如前所述的权利要求1,其特征在于新形声码用于数字键盘时,用数字键为字母编码用(2--9)单键表示第一排字母,用1+(2--9)双键表示第二排字母,用0+(2--9)双键表示第三排字母,用1+1连击表示字母“S”,用0+0连击表示字母“Z”,平均码长为1.7。
全文摘要
新形声码是以形声码为基础,兼容音码与形码、简体字与繁体字、字母键盘与数字键盘的汉语键盘输入方案,应用于计算机或手机的中文信息处理。形声码是一种具有音码属性的形码,它以字根读音声母为字根码。本发明采用编码分区法,减少码长,降低重码。它创建了“不背字根、不记规则”的新培训法,可成为各行各业、一般用户选用的形码。
文档编号G06F3/023GK101078952SQ200610040529
公开日2007年11月28日 申请日期2006年5月22日 优先权日2006年5月22日
发明者嵇政 申请人:嵇政
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1