活字输入系统的制作方法

文档序号:6342910阅读:209来源:国知局
专利名称:活字输入系统的制作方法
技术领域
本发明涉及汉字编码输入系统方块汉字的输入编码,是将汉字进行分解,再逐级选取其中信息作为编码元素,而每个汉字所含信息量是巨大的,所以,汉字编码方案有很多种。现今社会上编码现状是易学难用,易用难学。究其原因,在于拆解汉字编码过份集中在汉字的某方面信息上。编码发明者为了减少码长和重码率,人为地设计或固化某些不明确或非通用难记忆的规则。俗话说江山易改,本性难移,因规则非通用性而大大影响编码的易学性和实用性。其实,因汉字信息量大,只有突破传统方法,精选几方面的信息又有针对性地辅选某方面信息进行拆解组合编码。在充分利用键盘键容量基础上,辅以少量人为调整组合拆分编码。就能达到易学易用快速输入目的。
目前的键盘输入法主要有3种音码、形码、音形码。音码以声母或以韵母为独立编码元素,重码率高,输入慢;形码以部件或笔画编码,记忆量大,较难学习;由此可见,音形码是编码研究的重点。目前音形码的一种为二笔输入法,其音码必须熟悉英文键盘。其形码所定义的某些笔画书写顺序与人们书写习惯不相符,规则混乱难记。
本发明目的在于设计一种极其简单的编码方法,使其码长很短而重码率不致过高,并且能够兼顾专业输入,能够充分发挥现有的各种编码快速输入手段。
本发明核心在于采用汉字公认明确、广泛通用的信息作为编码基础,以汉字自身特征为背景,有针对性地对这些信息进行多维分解组合编码,在充分利用键盘键位容量的基础上,进行适当调整,形成一种杂而不乱、易学易用的编码方案。
汉字拆解编码过程是汉字组字的逆过程,其组字过程如下笔画一→字部一→双部字一→多部字。字部是由一次不间断地连续写成的若干笔画复合连接交叉所形成的相对不变的结构(绝大多数都是古汉字的基本图形衍变而来的)。双部字和多部字通称为组合字。本编码采用4种汉字信息拼音、结构分部、字部、笔画。笔画采用最传统的简易分法将汉字笔画分成横、竖、撇、点、折五大类(捺笔归入撇)。这5种笔画再两两组合成25种双笔画。汉字拆分遵循“直观为主,二字先分;成字优先,大字在前;拆分在前,拆连在后;逢交不拆,上大右大。”的原则。对于组合字则依其总体结构一次性拆分为前后两大部,如上下、左右、里外结构,将其上、左、外作为一个整体,称为前部。将其下、右、里作为一个整体称为后部。对上中下、左中右结构字。如果上中、中下;左中、中右结构均不能组合构成一个较小的字。则依上大右大原则,拆分为上中、下;左、中右两大部。以上中、左为前部;下、中右为后部。
笔画含一、乙等单笔字;字部含口、目、大等单部字。对于单笔字和单部字我们不再拆分。为了明确区分单部字和组合字我们规定非末笔且分离的单笔画不再拆分。结构相当紧密的汉字为单部字,字形界线不明显的汉字也看作单部字。
由汉字构字规律可知,书写时以某些双笔画开头的汉字字部极多,且组字频率高;而以另外一些双笔画开头的汉字字部较少,为了使各个键位汉字均匀分布,减少重码率,特设适当数量的字部(大部份是偏旁部首和一些重新定义的部类码),作为比笔画优先的编码元素;并且分开定义到笔画元素及特设码对应键。以横竖开头的字部,如果先写的横笔和竖笔不相连,依此我们把它们从横竖类字部中分离出来,另称为横竖分笔,记作“—分”。例“邴”字的字部编为“—分”。以撇折开头的字部,如果该折笔含有勾笔画,依此我们把它们从撇折类字部中分离出来,另称为撇勾,记作“ノ亅”。例“勾”字的字部编为“ノ亅”。以横、“竖勾”两笔画开头的字部,依此我们把它们从横折类字部中分离出来,则称为横竖勾,记作“一亅”。例“丁”字的字部编为“一亅”。以横撇开头的字部,如果先写的横笔和撇笔相交,依此我们把它们从横撇类字部中分离出来,另称为横撇叉笔,记作“—叉”。例“龙”字的字部编为“—叉”。对“氵、艹、口”3个组字频率高的字部,当字的底线处有带钩的笔画,则称为有勾水、有勾草、有勾口,记作“氵2、艹2、口2”;没有带钩笔画的,则称为无钩水、无钩草、无钩口,记作“氵1、艹1、口1”。例“吴”字“口”字部编为“口1”;“清”字“氵”字部编为“氵2”。依此我们把它们定义到不同的键码上。这些特设字部均从含字较多的双笔画字部中选出,调配到含字较少的笔画码或特设码对应键。
以下为本发明编码实施方案。形码部分将25个双笔画组合和5个单笔画结合键位座标安排到最靠近手指的30个按键中,另定义(ノ+1)、(ノ+2)、(—+)三个特加码,+表示特加码。同时定义“九、金、木、水、火、土、氵、艹、亻……”等字部的代码,如下表。
当拆分笔画时遇到这些字部,优先按其代码对应键,不再拆分笔画。有些特设字部本身就是一个汉字,这些汉字的编码是重复按其字部码对应键。如“目”字,拆成丨丨,丨丨共两键。
单笔画字编码重复按其单笔画对应键。如“一”字编成—,—两键。
单部字、准单部字编码取头4笔笔画。头2笔笔画按双笔画组合对应键,后2笔笔画按单双笔画对应键。3笔单字全取3笔笔画。头2笔笔画按双笔画组合对应键,第3笔画按单笔画对应键。2笔单字先取2笔笔画按双笔画组合对应键,取第2笔画按单笔画对应键。如“不”字,拆成—ノ,丨丶,共两键。“大”字,拆成—叉,丶共两键。
双部字编码各部取其头2笔笔画按其双笔画对应键。如“耷”字,拆成—叉,—丨共2键。
多部字编码以“直观为主;2字先分,成字优先,大字更优;拆分在前,拆连后边;逢交不拆,上大右大。”拆分原则先拆分为前后两部。取各部的最前字部作编码单元,取其两个编码单元的头2笔笔画按双笔画组合对应键。如“解”字,拆成ノ,ノ共2键。“辩”字拆成(立),丶两键。
拼音码分标准版和方言版。
标准版拼音码采用双重标准设制,拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码。同时增设模糊码。
(1)将含字较多的l声母,以a、o、e、u为首的单韵母或复韵母归为一类,组合成l1声韵复合码;以首韵母为i的单韵母或复韵母为另一类,组合成l2声韵复合码。拼音声母为j的汉字,以单韵母i或以ia为首的复韵母为一类,组合成j1声韵复合码;其它韵母为另一类,组合成j2声韵复合码。声母为y的汉字,以a、o、e为首的单韵母或复韵母归为一类,组合成y1声韵复合码;以i、u、u为首的单韵母或复韵母为另一类,组合成y2声韵复合码。
(2)取含字较少的p、m、f、t、n、g、k、r、z、c、s、w、zh、ch、b、d、h、q、x、sh共18个声母为单声母码。含字较多的l、y、j共3个声母,仍然保留单声母码。
(3)首字母为“a、o、e”的无声母汉字,我们定义其声母为“0”。
(4)以z、zh为首字母的汉字,还可以共用一个模糊码 以c、ch为首字母的汉字,还可以共用一个模糊码 以s、sh为首字母的汉字,还可以共用一个模糊码 (5)拼音码分为8区。一区b、p、m、f。二区d、t、n、l。三区g、k、h。四区zh、ch、sh。五区z、c、s。六区j、q、x。七区 八区l1、l2、j1、j2、y、y1、y2、0、r、w。其中一~七区为顺音。八区为散音区。
方言版在中国不同的地方有不同的方言。而在不同的方言对标准普通话的某些拼音声母较难区分。容易混淆。针对此情。我们设计一种合声分韵技术方案。即把容易混淆的几个声母归并为一个共同的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;本人操粤语。先说粤语版拼音码采用多重标准设制,拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码。容易混淆的声母先归并为一特定的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;(1)将含字较多的l声母,以a、o、e、u为首的单韵母或复韵母归为一类,组合成l1声韵复合码;以i为首的单韵母或复韵母为另一类,组合成l2声韵复合码。声母为y的汉字,以a、o、e为首的单韵母或复韵母归为一类,组合成y1声韵复合码;以i、u、u为首的单韵母或复韵母为另一类,组合成y2声韵复合码。
(2)取含字较少的p、m、f、t、n、g、k、r、w、b、d、h、共12个声母为单声母码。含字较多的l、y共2个声母,仍然保留单声母码。
(3)首字母为“a、o、e”的无声母汉字,我们定义其声母为“r”,即无声母汉字和“r”声母汉字共用一键。
(4)声母j、z、zh我们统一把它们定义为声母j。以a、o、e为首的单韵母或复韵母归为一类,组合成j1声韵复混码;以单韵母为i为一类,组合成j2声韵复混码;以首韵母为i的复韵母为一类,组合成j3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成j4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成j5声韵复混码;属于j5声韵复混码的汉字均为一字多码。
(5)声母q、c、ch我们统一把它们定义为声母q。以a、o、e为首的单韵母或复韵母归为一类,组合成q1声韵复混码;以单韵母为i为一类,组合成q2声韵复混码;以首韵母为i的复韵母为一类,组合成q3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成q4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成q5声韵复混码;属于q5声韵复混码的汉字均为一字多码。
(6)声母x、s、sh我们统一把它们定义为声母x。以a、o、e为首的单韵母或复韵母归为一类,组合成x1声韵复混码;以单韵母为i为一类,组合成x2声韵复混码;以首韵母为i的复韵母为一类,组合成x3声韵复混码;以首韵母为u的单韵母或复韵母为一类,组合成x4声韵复混码;特设以a、ia为首的单韵母或复韵母归为一类,组合成x5声韵复混码;属于x5声韵复混码的汉字均为一字多码。
(7)拼音码分为8区。一区b、p、m、f。二区d、t、n、l。三区g、k、h。四区j1、j2、j3、j4、j5。五区q1、q2、q3、q4、q5、。六区x1、x2、x3、x4、x5。七区l1、l2、y、y1、y2、r、w。其中一~六区为顺音。七区为散音区。
特设字部的代码、各笔画及特加码、各拼音在键盘定义如下标准版 粤语版 编码方案如下一、形音活码单字取三码一、二码为形码,三码为音码,取码规则见上。词组取四码。二字词组取码顺序取第一字的一、二码,第二字的一、二码。三字词组取码顺序取第一字的一、二码,第二字的第一码,第三字的第一码。四字词组取码顺序顺取各字的第一码。多字词组取码顺序取第一、二、三、末字的第一码。
二、音形活码单字取三码首码为汉字的拼音码,次码,三码为形码,取码规则见上。词组取四码。二字词组取码顺序取第一字的一、二码,第二字的一、二码。三字词组取码顺序取第一字的一、二码,第二字的第一码,第三字的第一码。四字词组取码顺序顺取各字的第一码。多字词组取码顺序取第一、二、三、末字的第一码。
标准版和方言版。字、词取码顺序均同理。
本发明的优点是拼音编码和字形编码均采用双重设制,本方案码长极短、简单明确、歧义少、反应快,所以相当方便有效。它以汉字最明确的、广泛认知的信息为拆解编码元素。其输入按键直接与坐标位置对应,输入者无须熟悉英文键盘,即可快速输入汉字。由于本方案采用的汉字规则信息完全是大众所熟知的汉字信息,和人们日常交流中对汉字拆分解释说法完全一致。它没有人为编造出某些的与人们所熟知通用的汉字规则信息相悖的规则。所以学习很容易。由于码长短,拆字编码无歧义,而输入按键又直接与坐标位置对应。所以输入速度极快。它适于听打和看打。
实施实例编码表例字 标准版 粤语版例字 编 码 分 解 音形码 形音码音形码形音码汉h 氵1丶SDXDXS SDX DXS字z i 宀 VCQCQV JCQ CQJ编b  、EZQZQE EZQ ZQE码m —ノ WKZKZW WKZ KZW输sh u — ノ丶B;O ;OB Z;O ;OZ入r ノ丶 丶 ‘OSOS‘ ‘OSOS‘速s u —丨 辶 XJ‘ J‘X ZJ‘ J‘Z度d 广 丶UEXEXU UEX EXU
权利要求
一种汉字声形码输入系统,利用经过重新定义的英文标准键盘和移动电话键盘进行汉字输入,其特征包括(1)本方案拼音编码和字形编码均采用多重设制;
(2)形码采用多重标准设制一定数量的字部以整体作为取码元素,不再拆分笔画;其它字部以首写笔画本身或首写笔画为主,辅以其它特征作编码元素;
(3)取汉字笔画的传统分法将汉字笔画分成横、竖、撇、点(包含捺)、折5大类,这5种单笔画再两两组合成25种双笔画;为了充分利用键盘键位容量,另增设几个特加码;将单笔画与双笔画及特加码分开定义在键盘上;25种双笔画按起笔笔画分成5个双笔画区,5种单笔画组成一个单笔画区,几个特别加设码组成特加码区;
(4)汉字拆分遵循“直观为主,二字先分;成字优先,大字在前;拆分在前,拆连在后;逢交不拆,上大右大;”的原则,将组合字一次性拆分为前后两大部;取两大部的最先前字部或字部笔画作编码元素;
(5)某些首写双笔画含字部较多,且组字频率高,则以这些字部的其它特征或以含有这些字部的汉字的其它特征作为编码辅助元素,把它们分为不同的部类码,拆编到不同的键码上;一些组字频率极高的字部;以含有这些字部的汉字的其它特征作为编码辅助元素,把它们拆编到不同的键码上;
(6)由汉字构字规律可知,书写时以某些双笔画开头的汉字字部较多,且组字频率高,而以另外一些双笔画开头的汉字字部较少;为了使各个键位汉字均匀分布,减少重码率,特设适当数量的字部(其中包含按权利要求5所述而分拆出来的特殊字部),作为比笔画优先的编码元素;并且分开定义到笔画元素及特加码对应键位中;这些特设调整字部均从含字较多的双笔画字部中选出,调配到含字较少的笔画码及特加码对应键;
(7)拼音码采用多重标准设制拥有汉字较少的声母则单独以声母为编码元素;拥有汉字较多的声母则以声母为主,以韵母为辅组成声韵复合码;容易混淆的声母先归并为一特定的大声母然后以韵母为辅助元素,拆编成不同的声韵复混码;
(8)拼音码分为顺音码区和散音区;各顺音码区内的声母以习惯顺序按英文字母在键盘中的几何坐标位置按从左到右或从右到左或从上到下的顺序有规律线性排列;
(9)取码顺序为先二形码后音码的形音码设制;
全文摘要
本方案采用的汉字规则信息完全是大众所熟知的汉字信息,和人们日常交流中对汉字拆分解释说法完全一致。它没有人为编造出某些的与人们所熟知通用的汉字规则信息相悖的规则。所以学习很容易。由于码长短,拆字编码无歧义,而输入按键又直接与坐标位置对应。所以输入速度极快。
文档编号G06F3/023GK1677327SQ20041003307
公开日2005年10月5日 申请日期2004年3月29日 优先权日2004年3月29日
发明者林声闯 申请人:林声闯
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1