口算编码法及其键盘的制作方法

文档序号:6409221阅读:391来源:国知局
专利名称:口算编码法及其键盘的制作方法
当前流行的音码、形码、音形码都有它们的长处和不足。音码在普通话讲得比较好的北方地区,有着较好的群众基础,但中国幅员辽阔,有五十六个民族上百种方盲,同一个字不同地区读音不同,多音字在二千个常用汉字中约占据10%,且中国汉字数量很多,康熙字典收集了47035个,一般人只能读得出其中极少部分的字,就是在国标“GB2312-80”中收集的6763个汉字,绝大多致人只能读出其中的2000多个汉字;对于“字符型形码”来说,拆字有群众基础,但通常字根多,记忆因子少,不易掌握;音形码则集中了二者的优缺点。因此,计算机汉字输入法要在国内普及,在国外被人们普遍接受,另辟一种易学易记且能跨越不同发音壁雷,对古今中外所有汉字都能输入的“数值型形码”是十分必要的。本着这个宗旨,经潜心研究发明了口算编码法及其键盘。
任何事物,只有抓住“万变不离其宗”的“宗”字,加以深入的研究,复杂的问题才会迎刃而解。“口算编码法”抓住了汉字的笔划、块元、笔间关系、字型及其组合五大信息,抓住了“数值型形码”的“宗”,寻求这五种信息的规律是解决易学易记,国内、国外都能接受的汉字计算机输入法的钥匙。若能把这把钥匙的使用方法与人们已经熟练掌握的26个英文字母的序号、“1到10”与“一到十”数目字、十位以内的加减法结合起来,那么,这把钥匙才能便捷地打开全汉字计算机输入这把锁。
要研究汉字的字型特征,就要研究组成汉字的块元;要研究汉字的块元,就要研究组成块元的基本笔划之演变过程。远古时期,人类把数与事物联系在一起,她(他)们用月亮表示“1”,用乌的翅膀表示“2”,用一个手的手指表示“5”,后来,人们结绳记事,而后又在树木和兽皮上刻划记事,数目符号就逐渐产生了。公元前一千年左右,文王周公在所作的《易系辞》里说“上古结绳而治,后世圣人易之以书契”,契,锲也。这里的“锲”就是刻划记事。考古学家在陶器刻符中也发现了结绳的记载。如;丨、丨丨(用几根绳子表示),+、×、 、(用绳子交叉表示),这些符号最早是用来表示数与事物的,后来逐渐演变成了一到十的数码符号。我们知道汉字经过甲骨文(股商时代)→两周金文(东周、西周)→小篆→隶书→草书→楷书→行书的发展过程。让我们追根溯源看一看股周甲骨文的1-10吧“-、=、≡、 、∧ 、+、 、 、丨”。难道我们不能从甲骨文的数码符号中找到组合成今天成千上万汉字的“横、竖、撇、捺、拐、弯”等最基本的笔划的雏形吗!古人的数码符号还是今天汉字基本笔划的祖先呢。能否将笔划看作数值型的值符,由值符组成值块,由值块组成汉字呢?发明提出的“值符组块,值块组字,算术值定码”的新型汉字输入法,终于在计算机上得到了实现。
口算编码法是将块元作为组字的基本单位的。全世界都把中国字称为“方块汉字”,汉字不仅整体上是一个块,而且局部也是形态各异的块,局部的块以不同的形式组合成整体的块。如“汉”是由“氵”与“又”两块组成。块结构如同一个美丽的建筑物,它们由单笔块元和复笔块元和谐地组合起来,块元的笔划种类、笔间关系、类型都有自身的特征。“口算编码法”就是抓住了块元的笔划种类、笔间关系、字(块)类型,将构成汉字块元的38种基本笔划及其典型的组合赋以数值,变为值符,从而转义为“汉字由值块元组成,值块元由值符组成”。只要严格按照口算编码法的拆块原则将汉字分解成单义的值块,就可按公式用简单的加减法算出码值来,并可按码值与英文字母序号对应的原则,在计算机的通用键盘上找到26个英文字母的对应健位。如“高”,由“亠”、“口”、“冂”、“口”组成。依椐公式口算出对应的码值是“9、18、17、18”,可在键盘上找到对应的“IRQR”四个码健。只要在键盘上按“irqr”,屏幕上就出现了“高”字。这样,就将成千上万个二维空间图形结构的汉字转换成了计算机能够接受的字母码了。
现将口算编码法进一步说明如下一、汉字的十一种单笔笔划从数以万计的汉字中分解出38个单笔笔划。为便于形象记忆,根据象形的原则,将它们分成十一种单笔笔划(图1),即横1、竖2、单笔象形2、单笔象形3、撇4、单笔象形4、单笔象形5、拐6、弯7、点捺8、单笔象形9。
二、值符值符就是单笔划及单笔划的典型组合;值符经赋值后便成了有值符号。值符分单笔值符(图1)、复笔值符(图2)、中文数目值符(图3),值符可以按规定进行算术运算。
现在,全世界各个国家几乎都采用阿拉伯数字,所以,采用与阿拉伯数字象形的方法对值符赋值是符合中国乃至世界各国人民传统记忆习惯的;部分值符采用与中文数字象形的原则,也是有深厚的群众基础的。通常的编码法记忆因子少是难学难记的主要原因,口算编码法中的值符无须记忆,只要连读二遍,知道便可,十分简单,如“4”的起笔象撇,所以一撇为4;又如“八”的第二笔为捺,所以,点、捺为8;复笔值符是精选哪些“神似”致目字的符号,如2( 、己、 ),3(了),11( 、刂),13(阝),17(冂、卩)等,至于中文数目字值符,那便是人人皆知的数字了。
三、汉字结构型值表依椐汉字块元的结构与形状,将所有汉字分成26型(图4),并依次赋予数值1到26;26个字型给出26个图标。包围型的字中,二面围、三面围、四面围是从宏观的包围面多少来划分的如“者、斤、盾、房、君、眉、寿、赵、这”等,均划归于二面围,“区、尽、同、禹、戚”等,划归于三面围,“耳、自、国、皿”等,划归于四面围。
汉字结构型值表一是用于区分字(块)的类、型,以确定分解的方法和分解的程度,二是用于计算系型值。
四、汉字的三个层次口算编码法中汉字的三个层次是“汉字→值块元→值符”。
值块元是依据拆块取码原则从单字中拆分出来的基本单位。如“员”字,可拆成“口”、“冂”、“人”三个块元,因为这些块元可以分解成值符算出块元值,所以叫“值块元”,“口”的值为17+1=18,“冂”的值为17,“人”的值为8;值符是汉字的38种笔划及其典型组合经赋值后形成的有值符号。
五、汉字的五类组合根据成千上万个汉字块元的形状及其组合特征的分析,本发明将所有汉字分成五大类,(图4)。
(一)左右类字是指至少可用一条假想的竖直线(定义为母线)穿过可分离点或可分离缝隙,将单字分成左右两部分。“排、法、椴、馥”等都是左右类字。左右类字有五个字型,即1型、2型、3型、4型、25型,其中1-4型为不足四型块的字,25型是至少为四型块的字。
(二)上下类字是指至少可用一条假想的横直线(母线),穿过可分离点或可分离缝隙,将单字分成上下两部分,“息、笑、禀、霖”等,都是上下类字。上下类字有五个字型,即5型、6型、7型、8型、26型,其中5-8型为不足四型块的字,26型是至少为四型块的字。
(三)包围类字是指整体包围、被围的字,不是指局部包围、被围的字,如“司、同、国”等字是包围类字,“跳、略、恩”等字,虽局部有包围、被围部分,但不划归于包围类。根据包围面的多少可分为二面围、三面围、四面围;根据包围特征分有互围(至少各有二个面包围着对方的一部分)、夹围(两旁较小的块元夹着中间较大的块元)。包围类字有5种11个字型,即二面围(9型、10型、11型、12型)、三面围(13型、14型、15型、16型)、四面围(17型)、互围(18型)、夹围(19型)。为防止拆分过细,影响整体信息,对笔划数目作如下要求二面围、三面围、四面围的被围部分至少为两笔,如“习、区、囫”等划归包围类字,而“刀、勺、闩、日”等不划归于包围类而划归于杂合类字。同理,对互围型字,要求至少有一围为二笔划或两笔划以上;夹围两旁的块元至少有一旁是两笔划及两笔划以上、“互、瓦、乌”等属互围型字;“隶、坐、裁”等属夹围型字。
(四)帽鞋类字是指有特定形状部首的字,共有三型,即侧帽型(20型)、正帽型(21型)、鞋型(22型)。侧帽型字是指左偏旁为“亻、彳”及部首为“、 、乛、 ”的字。如“伴、侧、待、龟、农、虿、负”等字划归侧帽型字。正帽型字是指部首为“艹、几、冂、冖、人、八”及其变体不变内方、内尖特征,而部首盖得较浅的字。如“分、奉、各、官、罕、夯、杀、苏、杂、朵、贝、”等字。块元较浅插入“ㄩ、臼、廾”即为鞋型字,如“击、卉、函、出”等字。要求“穿鞋戴帽”块元至少为二笔划,才划归帽鞋类。“个、山”等字不划归帽鞋类而划归独杂类。
(五)独杂类字是指独体字型和杂合字型的统称,它们是除了左右、上下、帽鞋、包围以外的字。独杂类字中,笔划间关系只有“垂、连、交”的字,称为独体字;笔间关系有“单、散”的字,称为杂合型字。如“凹、本、大、果、里、曲”等字为独体字,“八、三、办、叉、半、勺、”等字为杂合型字。
块元划分类型的原则与单字一致。
六、单字、块元书写顺序为确保拆字取码的单义性,对笔顺作了明确的规定。
1、先左后右。如“鹊”(昔、鹊)。
2、先上后下。如“亘”(一、日、一)。
3、先外后内。如“同”(冂、一、口)。
4、先外后内再封口。如“田”,(冂、冂、田)。
5、先中间后两旁。如“巫”(工、人、人)。
6、交笔结构横起笔先写。如“未”(二小)。
7、角结构左笔划先写。如“口”(丨、冂、口),“巳”(、巳)。
七、键盘设计(一)、将码值的分布位置设计成与标准键盘26个英文字母的序号一致,分布位置一致(图5),就把原装键盘改造成了实用的中文输入键盘。将码值设计成与原装键盘上的26个英文字母序号一一对应的技术处理符合世界人民已有的记忆习惯;将值码分布位置设计成与原装键盘上26个英文字母分布位置一致的技术处理符合世界各国人民已有的打字习惯。
(二)、把1到26个数字按与英文字母序号相等的原则贴在对应的英文键下方,就把计算机的原装键盘制作成了中文输入键盘。这种制作中文键盘的方法,世界各国人民都能轻而易举的做到。
(三)、根据关联记忆易于记住的原理,从国家公布的高频字表中选出24个高频字、一个常用字组成了一篇短文,(图6),每一个字的第一个块值或字值对应着一个键盘上的字母码键位,所以,只要记住了25字的短文,就记住了25个一级简码。短文如下(括号中注明每个字第一个块值或字值及其字母键)是(19S)的(23W)我(4D)们(8F)和(22V)于(2B)法(24X)民(14N)、革(21U)部(7G)结(8H)对(15O)出(17Q)发(16P)去(11K)高(9I)技(20T)电(25Y)大(1A)学(12L)说(10J)了(3C)口(18R)算(13M)码(5E)输入时只要击一下所在键加一个空格键即可。
这样处理一级简码的方法,经上机侧定,50岁以上的学员只要5分钟即可熟记并可上机输入一级简码,克服了通常的码要苦苦地背出100多个字根后再去背无记忆因子的20多个一级简码的弊端。
八、字(块)分解方法(一)、值符分解法独杂类字(块)用值符分解法分解成值块。
1、值符分解法中的块元①、复笔值符单字只能拆成单笔值符。如“三”,拆成“一、一、一”。
②、复笔值符以外的单字,用“依椐笔顺,多笔优先”原则,可拆成多笔值符或单笔值符。如“大”,拆成“一、人”两个值符。
2、块元排列次序依据值符首笔划的书写顺序排列。如“王”拆成“三、丨”,“三”的第一笔比“丨”先写,所以“三”排在“丨”的前面。
(二)、两围分离法包围类字(块)用两围分离法分离成值块。
1、两围分离法中的块元包围部分为一块元,被围部分为一块元。
紧挨包围块元外的点,与包围块元划为一块不可再分解的块元。如“广、户、广、辶”。
2、块元排列次序二面围、三面围、四面围包围块元在前,被围块元在后(“辶、廴”仍按传统习惯后写);互围两块元按书写顺序排列;夹围,中间块元在前,两旁块元在后。
(三)、脱帽鞋分离法鞋帽类字(块)用脱帽鞋分离法分解成值块。
1、脱帽鞋分离法中的块元“戴帽”为一块,“帽”为一块;“穿鞋”为一块,“鞋”为一块。
帽上的单点与帽结构划为一不再分离的块元。如“宀”。
2、块元排列次序“帽”块元在前,“戴帽”块元在后,“穿鞋”块元在前,“鞋”块元在后。
(四)、三线划块法三线是用来对左右类、上下类字(块)划块用的假想的分界线,它穿过可分离点或可分离缝隙,假想块元以三线为准,按原左右上下关系分开,变成能看清整体字型的结构。
1、三线划块法中的块元(1)独杂类块元。
①、不可三线再分的单笔或复笔块元。如“旦”中的“日、一”;②、连续书写的单笔块元或单散笔块元。如“讠、小、心、忄”等;③、连续书写的散笔块元。如“灬、氵、冫、二、三”等;(2)、包围类块元。
如“沤”中的“区”,“码”中的“石”、“马”等;(3)帽鞋类块元。
如“岭”中的“令”,“模”中的“莫”等;2、块元排列次序依椐块元首笔划的笔顺。
3、三线三线是指假想的母线、子线、子子线。母线是指穿过可分离缝隙或可分离点,贯穿于整字的横的或竖的分解块元的分隔线。左右类字母线是竖直线、上下类字母线是横直线。子线、子子线是分解局部块元的分隔线。三线互相垂直,且可滑动。字(块)用三线中任一线或多线可分,就说成是三线可分。例 4、点分离原则①、必须是笔划直线部分上的单个或多个连、垂点;②、欲分离的块元必须是相对于连点或垂点呈左右或上下关系;③、一次分离出尽可能多笔但又不可再分的至少为二笔的一个或多个块元;
④、不可因三线划块而增加新的单笔块元;⑤三线只能沿着横的或竖的笔划部分穿过连、垂点。满足上述条件的连、垂点,称为可分离点。例 5、缝隙分离原则呈左右或上下关系的块元之间的缝隙为可分离缝隙。例 九、型块、值块型块是指用来判断字型的块元。独杂类、包围类、帽鞋类字,本身就是一个型块;左右类、上下类字的型块是指三线划出的块元。值块元是指用来算值换码用的块元。经三线划块法划出的块元,若少于四块元,又不可再分解的,既属于型块又属于值块,如“型”字的三块元“开、刂、土”,既属于型块又属于值块;若还可再分解的,只属于型块,如“捆”中的“困”只属于型块;四块及四块以上的块元,既属于型块又属于值块。如“操”字的五个块元“扌、口、口、口、木”,既属于型块又属于值块。
十、值块取值原则原则一三个值符及三个以下值符,先分解,后取值,再相加成块值。
如“日”,分解成“冂、二”,取值17+2=19。
原则二多于三个值符的值块,只取首值符。
如“我”取第一个值符单笔象形4“丿”其值为4;又如“母”,取第一个值符横“一”(交笔结构横起笔先),其值为1。原则二使得越复杂的值块取块值越容易。
原则三依据笔顺,多笔优先,取完移去。
依次按笔顺取出第一个笔划,取出该笔划在该值块中组成的最多笔划的值符,假想移去,如此,直到按规定取完应取的值符。如“未”,第一笔“一”可组成值符“”,第二个值符为“八”。
十一、尾笔笔间关系、字型特征码(系型码)尾笔笔间关系、字型特征码(简称系型码)是为了减少重码而设立的。
(一)、尾笔为确保尾笔取法的单义性,特作如下规定1、以单字的右下角笔划为尾笔划。如“止”,一横“一”为尾笔划;2、若单字右下角无笔划,则取靠近右下角的大值笔划为尾笔划。如“辛”,一竖“丨”为尾笔划。
(二)、尾笔笔间关系独杂类字是指尾笔与其所在单字中与其它有关笔划之间的关系。其它各类均指尾笔与其所在值块中与之有关的其它笔划之间的关系。尾笔笔间关系简称尾系。尾系共有五种“单、散、垂、连、交”。
1、单—一是指独立的单笔本身。如“一、丨、丿、丶”等;二是指连续书写的不同种分离的笔划之间关系。如“八、讠、儿”等;三是指单点与其它非点笔划组合的关系。
2、散—指连续书写的同种分离的笔划之间的关系。如“灬、氵、彡、二”等。
3、垂—横笔与坚笔或两笔划直线部分互相垂直,形成两个90度直角,其笔间关系叫“垂”,两垂笔相接触的点叫垂点。如“上、工、皿、重”,其尾笔笔间关系为“垂”。
4、连—一个笔划的一端与另一个笔划的一端相连接或一个笔划与另一个笔划成非90度的连接,其笔间关系叫连。如“口、亻”,其尾笔笔间关系为“连”。
5、交—两笔划相交叉,其笔间关系叫“交”。如“扌、聿”,其尾笔笔间关系为“交”(三)、尾笔笔间关系赋值单=1;散=2;垂=3;连=4;交=5。
(四)、尾笔笔间关系的算法计算尾笔与尾笔所在值块中与之有关的其它笔划之间关系的种类值之和(简称尾系),如“尾”的尾系为一交一连,尾系值为“5+4=9”。
(五)、尾笔笔间关系、字型特征码尾笔笔间关系、字型特征码(简称系型码),其取码公式为系型码值=尾系值+字型值。
系型码取了单字的“尾系”与“字型”两个特征,有较强的区分能力。例如“巳”与“己”、“已”。“巳”的尾系为一垂一连,值为7(3+4),“己”的尾系为连,值为4,“已”的尾系为垂,值为3,它们的字型值都是23,三个字的系型码分别为“D、A、Z”,系型码各不一样,又如“刀”与“力”“刀”的尾系为连,值为4;“力”的尾系为交,值为5。它们的字型都是23型,两字的系型码分别为“A、B”,均不一样。
十二、值块笔间关系值的算法值块笔间关系值是指值块中笔间关系种类值之和,(简称块系)。块系也分“单、散、垂、连、交”五种,并分别赋以1到5数值。值块间笔间关系值用于包围类、帽鞋类、左右类、上下类。如“木”,有连、交关系,其块系值为4+5=9;又如“口”,只有连的关系,其块系值为4。“木”与“口”其块值都是18,加上块系值,一个为27,另一个为22,其块值系码分别为“a”与“v”,这样两者就区别开来了。
十三、值码转换盘字值、值符值、尾笔值、系型值、块值系值、承上值、启下值、块值型值、块值都要转换成对应的字值码、值符码、尾笔码、系型码、块值系码、承上码、启下码、块值型码、块值码。值码转换原理是若码值在1—26之间,按照英文字母的对应序号,可找到一个对应的字母码(图7);若码值大于26,则整除26取余,该运算称之为“码值MOD(取余)”运算,例如29 MOD 26=3;32 MOD 26=6。本发明将以上关系制成值码转换盘(图8),指针制成不动,转盘可动,真正做到了“值码转换,一目了然”。
十四、值码表示方法为使初学者看清算值取码的来龙去脉,对字码的表示方法作如下规定①码值之间用空格隔开。②、同一个码之间的不同值用逗号隔开。如系型码中尾系值与字型值之间应用逗号隔开;块值系码中,块值与块系值用逗号隔开;块值上码中,块值与上值用逗号隔开。若只有一个值的码为整齐见,逗号旁以0代。码值等于逗号两旁的值相加。③、值与码之间用“→”隔开。如“认”字,取码公式为“块值系码+块值系码+尾笔码+系型码”,码值表示方法为认(10,1 8,4 8,0 4,1→KLHE)。
十五、承上码、启下码用于包围类、帽鞋类、左右类、上下类且多于四值快的字。承上,即将末2块值加上末3块末单笔值符值;启下,即第1块值加上第2块首单笔值符值。第二块首单笔值符值简称“下值”,第末3块末单笔值符值简称“上值”。多于四值块字取码公式中的前二码就是承上码与启下码,也可说成“第一块值下码与第末2块值上码”。其作用是为了减少因局部块元拆分过细而引起的重码。
十六、拆块取码流程图从拆块取码流程图(图9)上可清楚地看到,任何一个字取码都要经过三个过程一是拆块,二是算值,三是换码。
(一)、拆块1、独杂类用值符分解法。例1(值符)九→乙、丿,例2(非值符)凹→ 、冂、一。
2、包围类用二围分离法。例1(二面围)这→文、辶,例二(三面围)匹→匚、儿,例三(四面围);国→口、玉,例四(互围)包→勹、巳,例五(夹围)巫→工、人、人。
3、帽鞋类用脱帽鞋分离法。例1(侧帽型)倒→亻、到,例2(正帽型)众→人、从,例三(鞋型)击→、ㄩ 。
4、左右类、上下类用三线划块法例1(左右类)讹→讠、化,例2(上下类)贺→力、口、贝。
(二)、算值根椐值符赋值表、汉字结构型值表、笔系、值块、取值原则算值。方法上可用“速算法”使简单的加减法更简单。例①、凑整数法。如“钅”块值先算一撇加一拐,4+6=10剩下三横为3,块值13;②、负数代入法。算系型值时,大值字型值可用用负数代入,如“术”属杂合型,尾系是4,型值为24(可看成-2),系型值为4-2=2;③、减30加4法。因为30-26=4,所以,可以4代30。如“棵”字的值块“果”,可分解成“冂、丰、八”三个值符,其块值为17+30+8可速算成17+4+8=29;④、以乘法代加法。如“幻“中的值块“幺”,可分解成“レ、レ、丶”,其值为4+4+8=16,可速算成二四得八,二八十六。
本发明克服了计算机进入了千万个家庭后,任何计算都要依赖机器的不足。用该码对提高青少年的口算能力有很大的帮助;对中老年延缓脑功能衰退不无裨益。
(三)、取码根椐不同代码公式算出码值后再用值码转换原理或值码转换盘换码。全码一律等长四码;简码分为一、二、三级,分别输入一码、二码、三码加一空格键。
独杂类单字用作值符的汉字其输入全码公式的实质是取其字值码、第一个单笔值符码、第二个单笔值符码和第末个单笔值符码,若缺二个单笔值符码,以尾笔码、系型码补在其后,若缺一个单笔值符码,以系型码补在其后。如四(4,0 2,0 7,0 1→DBGA)、二(2,0 1,0 1,0 2,24→BAAZ)。
非值符的独杂类汉字其输入全码公式的实质是首3尾1,即取最前三个值符码与最后一个值符码,若缺二个值符码,以尾笔码、系型码补在其后,若缺一个值符码,以系型码补在其后。如丹(1,0 4,0 7,0 8,0→ADGH)、卜(2,0 8,0 8,0 1,24→BHHY)。
包围类、帽鞋类、左右型、上下类字全码公式的实质是首一尾三,即取第一个块值系码与最后三个块值系码,若单字只有二值块,其后补尾笔码、系型码,若单字只有三值块,其后补系型码,多于四值块的字以启下码、承上码、第末块值型码分别替代公式中的第一、二、末码。
全码公式具体用法如下(公式中的“+”号为连接号,“块值系码”即块值加块系值形成的码,“块值型码”即块值加字型值形成的码。)二值块字第一块值系码+第末块值系码+尾笔码+系型码。例江(24,2 4,3 1,03,1→ZGAD)。
三值块字第一块值系码+第末1块值系码+第末块值系码+系型码。例帮(7,513,4 19,9 9,7→LQBP)四值块字第一块值系码+第末2块值系码+第末1块值系码+第末块值系码。例算(13,5 13,5 20,7 14,5→RRAS)。
多于四值块的字第一块值下码+第末2块值上码+第末1块值系码+第末块值型码。例嘉(11,2 9,1 11,5 18,0→MJPR),“嘉”的型值为26,26可以0代。
本发明用首一尾三的取块方法,克服了多块元字首易产生重码的弊端,如以“鱼、骨、虫、竹”等作字首的字,采用首一尾三的方法后,以与之组字的块元多少来决定“鱼、骨、虫、竹”等所取的块元信息。
十七、口算通用码“口算通用码”是“口算码”的初级码,它适用于非专业人员与专业人员,其特点是一学就会,十分简便。“口算码”是“口算通用码的“升级码”,其特点是重码率很低,可作为专业人员和已经掌握“初级码”的非专业人员使用。“初级码”与“升级码”在输入公式上的唯一区别是对非独杂类字“初级码”的全码输入公式是取第一个与最后三个块值码,若只有二个块值码,其后依次补尾笔码、系型码,若只有三个块值码,其后补系型码。块值码就是根椐值块取值原则取值后转换成的码。
十八、词汇码所有词汇一律等长四码。词汇码由单字码组成,为提高输入速度,包围类、帽鞋类、左右类、上下类字只取块值码,独杂类字取码方法同上。
(一)、两字词每字各取第一、第二码,共四码。
例中国(17 10 18 13→QJRM)文字(08 11 23 04→HKWD)(二)、三字词前二字各取第一码,第三字取第一、第二码,共四码。
例自动化(22 01 06 07→VAFG)计算机(10 13 18 06→JMRF)(三)、多字词前一字取第一码,最后三字各取第一码(首一尾三),共四码。
例企业管理 (08 11 13 05→HKME)艰苦奋斗 (15 20 09 10→OTIJ)中国科学院(17 22 12 13→QVLM)中华人民共和国(17 21 22 18→QUVR)


图1单笔值符赋值表。
图2复笔值符赋值表。
图3中文数目值符赋值表。
图4汉字结构型值表。
图5码值与键盘键码分布图。
图6一级简码键盘分布图。
图7码值与键位序号对照表。
图8值码转换盘。
图9汉字拆块取码流程图。
权利要求
1.一种口算编码法,其特征是依椐汉字块元结构的组合特征,将所有汉字分成五大类26型,根椐汉字拆块取码的原则,对不同的字类采用不同的拆块方法,将汉字分解成型块、值块,根椐不同的字型,值块数依椐取码公式确定值符值(包括尾笔值、上值、下值)、尾笔笔间关系值、值块笔间关系值和型值,然后口算成码值,换成字值码、值符码、尾笔码、系型码、块值码、块值系码、承上码、启下码、块值型码的一种编码体系。
2.根椐权利要求1所述的编码体系,其特征在于用口算法计算字值、块值、值符值、上值、下值、尾笔值,其依椐是值符赋值表,即图1、图2、图3。
3.根椐权利要求1所述的编码体系,其特征在于将所有汉字归纳为“汉字结构型值表”中的26型,依次用26个图标表示,对应赋于1~26数值,即图4。
4.根椐权利要求1所述的编码体系,其特征在于将所有汉字归纳为独杂类、包围类、帽鞋类、左右类、上下类五大类,每类有若干字型。
5.根椐权利要求1所述的编码体系,其特征在于26个码值与计算机通用键盘上26个英文字母序号相等的方法,将计算机通用键盘上的26个英文字母健改造成了汉字输入所需要的值码键,即图5。
6.根椐权利要求1所述的编码体系,其特征在于选出24个高频字,一个常用字,以短文的形式组成一级简码,其首块值或字值就是码值,即图6。
7.根据权利要求1所述的编码体系,其特征在于若码值在1~26之间,按照英文字母的对应序号可找到一个对应的字母码,即图7 ;若码值大于26,整除26取余,其辅助工具是“值码转换盘”,即图8。
8.根椐权利要求1所述的编码体系,其特征在于将汉字分解成型块、值块,算值换码方法步骤的依椐是“汉字拆块取码流程图”,即图9。
9.根椐权利要求8的方法,其特征在于汉字用四种方法分解,即值符分解法、两围分离法、脱帽鞋分离法、三线划块法。
10.根椐权利要求2、3、8的方法,其特征在于独杂类值符作单字输入只能分解成单笔值符,独杂类非值符单字分解成值符,它们都用用值符分解法分解。
11.根椐权利要求3、8方法,其特征在于包围类字用两围分离法分解。
12.根椐权利要求3、8的方法,其特征在于帽鞋类字用脱帽鞋分离法分解。
13.根椐权利要求3、8的方法,其特征在于左右类、上下类字用三线划块法分解。
14.根椐权利要求3、7、8的方法,其特征在于系型码是由汉字的尾笔笔划与其所在值块中其它笔划之间关系的种类值之和加上字型值,以值转码所形成的一种具有识别能力的附加代码。
15.根据权利要求14方法,其特征在于汉字的尾笔划是汉字右下角的一个笔划,如右下角无笔划,取靠近右下角的大值笔划为尾笔划。
16.根椐权利要求2、3、7、8的方法,其特征在于承上码即将末2块值加上末3块末单笔值符值形成的码;启下码即第1块值加上第2块首单笔值符所形成的码。
17.根椐权利要求2、3、7、8的方法,其特征在于块值系码即将块值加上值块笔间关系值所形成的码。
18.根椐权利要求14、17的方法,其特征在于汉字值块笔间关系或尾笔与尾笔所在值块中其它笔划之间的关系分为单、散、垂、连、交五种,并依次赋值1、2、3、4、5。
19.根椐权利要求2、3、7、14、15的方法,其特征在于独杂类单字用作值符的汉字,其输入全码公式为字值码+第1单笔值符码+第2单笔值符码+第末单笔值符码,若单笔值符码取不足,其后以尾笔码、系型码补足四码。
20.根椐权利要求2、3、7、14、15的方法,其特征在于独杂类非值符单字,其输入全码公式为第1值符码+第2值符码+第3值符码+第末值符码,若值符码取不足,其后以尾笔码、系型码补足四码。
21.根据权利要求2、3、7、14、15、16、17的方法,其特征在于包围类、帽鞋类、左右类、上下类单字,在“口算码”中其输入全码公式为第1块值系码+第末2块值系码+第末1块值系码+第末块值系码,若单字不足四值块,其后以尾笔码、系型码补足四码,若单字超过四值块以启下码替代第1块值系码,以承上码替代第末2块值系码,以第末块值型码替代第末块值系码。
22.根椐权利要求2、3、7、14、15的方法,其特征在于包围类、帽鞋类、左右类、上下类单字在“口算通用码”中的全码取码公式是前一末三块值码,若块值码取不足,其后以尾笔码、系型码补足四码。
23.根椐权利要求7、8的方法,其特征在于对两个及两个以上汉字词组,一律等长四码。两字词每字各取前二码。三字词前二字各取第一码,第三字取第一、第二码。多字词前一字取第一码,最后三字各取第一码(前一末三)。
全文摘要
本发明首创了以汉字自然结构为基础的值符分解法、两围分离法、脱帽鞋分离法和三线划块法分解汉字,并以口算法算值换码,从根本上克服了字根难记的弊端。发明提出的块值系码及系型码降低了重码率,码值与键盘英文字母序号相对应的技术将计算机通用键盘改造成了中文输入键盘。26个码键可对字词编码,码长不超过四位。该码实现了“见字知码”,输入速度快,重码率低,能处理古今中外一切汉字,且能跨越不同的发音壁雷,可广泛用于各类中文信息处理系统。
文档编号G06F3/023GK1119303SQ95111638
公开日1996年3月27日 申请日期1995年5月23日 优先权日1995年5月23日
发明者孙柱章 申请人:孙柱章
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1