汉字数字字母混合码的制作方法

文档序号:6602710阅读:2323来源:国知局
专利名称:汉字数字字母混合码的制作方法
技术领域
本发明是一种汉字编码,适应于电脑输入与查询。
迄今汉字编码已有数百种,各有所长,也各有所短。拼2码、首尾码易学,但重码太多,不便盲打;电报码、区位码可以盲打,但记忆困难;五笔字型重码较少,但字根太多,难以记忆,更加上末笔识别码,增加了输入难度;认知码易学,但重码太多,且也需要掌握一定的拼音知识。
本发明的目的是提供一种字基少、码长短、规则简单、重码少、便于普及的新的汉字编码方案,以为电脑输入和查询之用。
本发明将汉字基本结构分为83类,其中地类为固定字基,33类为可变字基,按照一定的规则和规律将它们分置于1、2、……0和a、b、……z共36个键位上,根据汉字笔顺及其它规则将汉字和词语编码。键名汉字连击该键四次;独基字取键名加首、末笔码加空格键;二基字属上下结构的加末笔码两次自然终止,其它结构的二基字一律加末笔码再加空格键;三基字属上下结构的加末笔码,基余依次记码加空格键终止;四基以上汉字取首两码、末两码。词语一律编成四码,即两字词,取每字前两码;三字词,取前二字各第一码,第三字前两码;四字以上词语,取第一、二、三、末字各前一码。
一、字基含义
本方案将汉字基本结构(简称字基)分为83类,它们同通用键盘的对应关系如下(每键第一字为键名汉字,其中黑体字为可变字基)
83类字基中,50类形态固定或基本固定,叫做固定字基;33类形态不固定,但每一类有共同特性,它们叫做可变字基。兹分述如下
(一)固定字基分列如下(括号内为字例,下同)一(天刁) 山(岭癌) 耳(聆辑) 儿(元)寸(寺)口(吃舌) 丁(宁行) 十(古斗) 王(玲旺) 勹(勾)月(肥然) 丨(旧)土(地堂) 雨(霖漏) 丿(白乒)又(难叉) 鱼(渔衡) 讠(讲)口(国目) 爱(嗳)上(卡戚) 纟(织)大(存天) 犭(狗)手(搿看)工(贡江) 弓(张)止(齿足) 卜(仆敲) 黑(墨黛)丶(户夫) 金(针鉴) 斤(欣听) 广(庆)厂(历)了(函)乃(仍)中(央衷) 专(转)竹(笠)西(酉晒) 夕(多罗) 虫(蚁虽) 重(锺)本(笨)匕(颖)疒(病)女(东要)鸟(鸡)木(查禾)
(二)可变字基分列如下(字基后面括号内为字例)
二 包括二冫亠(云壮文) 两线(点)从上到下相离排列。
三 包括三氵(叁汉)三线(点)从上到下相离排列。不含彡。
四 包括四皿臼(罚盆舅)形状相似。
力 包括力七九乜
(另皂旭乜发)含折单交。有一交点。
巾 包括巾屮
(币逆虐)巾的旋转体。(注慧中的彐作コ一,应予区别)
人 包括人入亻

(合氽仁良页惠)一线端点接另一线中间,或一点沾在一线的末端。有一接点。(注卜在G键,应予区别)
几 包括几冂冖凵卩阝
コ(风同琛凶匠巨却卷阵)三面包围,有两个明显的角,成筐的形状。(注卫的上面
不是卩,
作刀,应予区别)
八 包括八丷
(分关临齐)两笔从左到右相离排列。不包括ㄍ。(注儿在2键,刂在D键,应予区别)
也 包括也艹廾
(池花弄衰两鹿)横双交。两交点横排。规定匆中的
作也。
曲 包括曲

事毋(澧典律隶庸事毋)连续四交或四交以上。根据规定没有脱出的笔划。
豕 包括豕
(家毅象)豕或其一部分结构。
日 包括日曰

(旺冒良爸声临)口或已尸中含一线。
已 包括已(已经的已)巳(巳时的巳)尸
(户追民)带尾巴的口。
衣 包括衣衤礻
(裔初礼表畏)衣或其变体或相似,或其中一部分结构。
之 包括之辶(乏这)形态相似。
申 包括申电
(伸埯果)形态相似。
片 包括片爿(牌戕鼎)形态相似。
小 包括小忄

(示怕堂学夼荒)三笔从左到右相离排列。不含巛。
门 包括门宀(问安)形态相似。(注冖在7键,应予区别)
心 包括心
(忠恭)心及其变种。(注忄(怕)在P键,应予区别)
水 包括水
(泉永录暴脊隶)水及其变种。
厶 包括厶マ(公予)厶及其旋转体。
刀 包括刀刃
刂(召忍象到)刀及其变种。(注意刃作刀,不作刀、)
包括扌
丸(译打毛热)纵双交。两交点纵排。注
(东)从女(固定字基),
(央)从中(固定字基),应予区别。
火 包括火
灬(灯业照)火及其变种。
甲 包括甲由(厣鬼寅)甲及其倒置体。
乙 包括乙
亅(飞司玄扬丁)折笔的多种形态。注意亅(丁)不作丨。
立 包括立产
(位颜旁商)形态相似。
子 包括子孑孓廴(李“孑孓”建)形态相似。
乂 包括乂ナ(父右辣)两线斜交,有一交点。
韦 包括韦丰卅车尹
申(违峰卅辆君母禹囊)连续三交,有三交点。(注申电
亦为三交,但在O键,应予区别)
贝 包括贝见(员现)形态相似。
内 包括内
(丙离)形态相似。
二 笔划之间的位置关系
基本笔划有一丨丿丶乙五种(分别位于1.R.Y.H.K键),前四种为最简单的固定字基,乙是最简单的可变字基。由于它们相离、相接、相交构成了各种字基乃至千姿百态的汉字。
1.相离笔划有机地排列且有间隔,叫做相离,这样组成的字基叫做相离字基。相离可分为纵离(二、三)和横离(八、小)两类。火的变种
灬也属横离。有时相离部分可被它笔隔开,如办力八48,母
v2。
如果相离笔划中某一部分同它笔相接构成另一字基,则相离字基不存在。如亍,上面二看似相离,但下面的一同亅构成丁(m键),故上面的“二”不是相离字基,亍记作lm。又如主记作丶王hw,不是亠土2t。但如果虽相接而不构成新字基,则相离字基仍存在。如亏,中间“一”同
虽相接,但丂不是字基,故亏记作2k,同理,云作2s,隹作亻亠
一62f1等。
但是规定如果相离各部分同旁端点共接一线,则相离不受影响。如非作三
三383,乍规定为人丨二6r2。故相离字基接线原则是“全或无”式的。
如果相离笔划中某一部分同它笔相交,则被交部分脱离了相离字基,如二是相离字基,如果下面一同一竖相交,成“干”,则相离不存在,干作10,不作2r(见一切随交)
2.相接笔划相接,有一接点如人、丁、勹等,叫做相接字基。如果相接的某一部分被它笔穿过,则相接不存在,如相接,但“干”中因有下面的“一”同丨相交,故干中无相接字基,干作10(一切随交)。如果相接的某部分同它笔构成了固定字基,则相接不存在,如万中丆似相接,但丿与
构成了固定字基
,故万作1w。又如寅中的
上面看似相接,但下面的“由”是“甲”的倒置体,属相交字基,故
上边不是相接。寅作宀一由八alj8。
3.相交笔划穿插而过,是为相交,这样构成的字基叫相交字基。根据交点个数及横排、纵排,分类如下
(1)单交线直交(十)位于0键。
线斜交(乂ナ)位于X键。
含折单交(力巾乜)位于4键。
(2)双交横双交(也艹廾
位于9键。
纵双交(
扌毛丸)位于F键。
(3)三交(韦丰卅尹车
等)位于V键。而电申
位于O健,应予区别。
(4)四交或四交以上,位于Q键。其形态虽多样,但有连续的四个以上交点,是其特点。见“可变字基曲”节。
三取基原则
(一)取基宜大应尽可能先取固定字基和大字基。如“虽”作口虫,虫不能拆分成中
。嗳作口爱。元作二儿,方作二
(儿
都是固定字基)。
(二)同等优先如言作亠二口,不作丶三口;追作丿
コ之yt7i。
(三)独笔随离如三作3,不能看作三个独笔划;亡作2k,不作01k。
(四)相离随接如亍作1m,主作hw。但如果相离的某笔同它笔虽相接而不构成新字基,则相离仍在,如前所述亏作2k;相离各部分同旁端点共接一线,则相离仍在,如韭三
三一3831。
(五)一切随交凡笔划相交,则不能拆。如“孝”的上边虽有“土”,但土的下面一横被斜线穿过,则土解体。孝记作十ナ子0xz。但是,规定斥作斤丶,豖作豕丶(啄),戢作口耳丶
身作丿
二丿yt2y,臾作臼人46,叟作臼丨又4ru,是为例外,应予熟记。
四记码顺序
基本上同汉字笔顺,部分有特殊规定,概述如下
(一)从左到右如及yz 轧vk 兆二儿二222 制丿
刂yvd 州888。
(二)从上到下如歹1x 出47 包wt 己コ
7k长
y4h方2w 具月二八e28 录

k2s 且月一el 可丁口m5 乐规定为km。
(三)由外到内如田口十o0。图囗丿又二oyu2面

二6o82
(四)先中间后两边如办48函了
凵ls7。
(五)先两边后中间如脊s6e 拳8fhf,也都有从上到下趋势。
(六)辶廴在字尾,如这2xi建qz
(七)右上角独点记在右下角字基之前,如龙ナ丶七xh4,甫丶
hq求
4hs。规定式作、七工h4g。栽的顺序为十丶
木。
(八)相交字基按笔顺或交点位置记码,未参与相交的部分脱出另记,如义hx 叉hu 丹h9 母v2 夹f8h 来f88 柬v88 肃q88 毛yf 各yu5等。规定厂、几、口只要有一部分被穿过,则其余部分都不脱出,如
作f,不作丿
。免中的
作4,免作d4k。曲作q,删作qd,但典作q18,这是因为下面的长横并不是口的一部分,未被交入,故脱出另记。
五 汉字编码
(一)键名汉字将该键连击四次,如
一 llll 曲 qqqq 衣 yyyy 中 zzzz
(二)独基字键名+首笔码+末笔码+空格键(空格键记略,下同)如
弗 qkr 竹 zyk 入 6yh 雨 ylh
独基是单笔的,规定在本键及右边邻键上各击两次,如
一 1122 丨rrtt 丿yyuu 丶 hhjj 乙 kkll
为了鉴别和减少重码字,特别规定聿的末笔为一,冉韦的末笔为乙,斤的编码为jyy(末笔应看成y),应予熟记。
(三)二基字属上下结构的依次记码后加末笔码2次自然终止。如
午 60rr 只 58hh 旨 br11 军 7v11 名 x511
其他的二基字依次记码后加末笔码再加空格键终止,如
用 7fr 叭 58h扩 fky 右 x51 闲 amh
规定辶廴结构的末笔在它们前面的那个字基上,如
近 jiy 建 qzl迪 jil 连 vil 违 vik
(四)三基字属上下结构的加末笔码,其余依次记码并加空格键终止,如劳974y 究a84k拖f69呢5tb温3r4 发4hu
(五)四基以上汉字。取首两码+末两码,如
鬼 丿甲乙厶yjks 镌 钅亻一乃j61l
隹 亻亠
一62f1鹿 广
匕匕 k9bb
福 礻一口十y1o0 藏 艹
コ丨9p7r
(六)规定
彳乂亍 结构的汉字依次取四码,如
辫 立ナ纟立lxsl街 丿亻土土y6tt
(七)简码为减少重码和码长,可以规定36字为一级简码,分布于36个键位上。一级简码的取码方法是键名+空格键。二级简码的取码方法是取前两码+空格键。本方案暂未列入一级简码字和二级简码字。
六词语编码
(一)两字词,取每字前两码,如
劳动 艹冖二厶972s也许 也也讠人99i6
(二)三字词,取前两字各第一码,第三字前两码,如
地质学 土丿冖typ7 白内障 丿内阝立yn71
(三)四字以上词,取第一、二、三、末字各前一码,如意气风发立人几
l674中国共产党中口艹zo9p
权利要求
1.一种汉字编码方法,根据汉字的结构和笔顺编码。其特征在于该方法包括汉字基本结构及其分类;基本笔划的相离、相接、相交规律和规则;取基原则;记码顺序;字、词编码。
2.根据权利要求1所述的方法,其特征是,将汉字基本结构分为83类,其中50类为固定字基,33类为可变字基,并按一定规律和规则将它们分置于1,2,……0和A,B……Z共36个键位上。
3.根据权利要求1所述的方法,其特征是,50类固定字基形态固定或基本固定,它们是一山耳儿寸口十王勹月丨土雨丿又鱼讠口爱上纟大犭手工弓止卜黑、金斤广厂了乃中专竹西夕虫重本匕疒女
鸟木丁;33类可变字基形态不固定,但每一类都各有共性或相似,或是旋转体,或是变体,或是具有相离、相接、相交的某一方面的共性,它们是(括号内为其变体)二(冫亠)三(氵)四(皿臼)力(
七九乜)巾(屮
)人(入亻

)几(冂冖匚コ凵卩阝
)八(丷
)也(艹廾
)曲(井册事

弗冉)豕(
)日(曰

)己(巳尸)衣(衤礻
)之(辶)申(电
)片(爿)小(忄川
)心
门(宀)水
厶(マ)刀(刃
刂)
(扌
丸)火(
灬)甲(由)乙
亅)立(产
子(孑孓廴)乂(ナ)韦(丰车尹
卅)贝(见)内
4.根据权利要求1所述的方法,其特征是基本笔划之间具有相离、相接、相交规律和规则。相离包括纵离和横离;相接的如人、丁、勹等;相交根据交点个数、交点的横排、纵排而分别有力、巾、十、乂、也、
韦、曲等。笔划相离、相接、相交构成了固定字基和可变字基乃至千姿百态的汉字。汉字编码时,取基原则是先尽可能地取固定字基或较大字基,同等情况下取前面的一个;如果单笔是相离字基的一个组成部分时,则服从相离字基;相离的某一部分同它笔构成字基(相接或相交)。则服从相接字基或相交字基;相离字基接线原则遵循“全或无”式的原则;各种形态被它笔穿过,则服从相交字基。
5.根据权利要求1所述的方法,其特征是记码顺序基本上按汉字笔顺,即从左到右、从上到下、由外到内、先中间后两边、先两边后中间,右上角独点记在右下角字基前面,相交字基按笔顺或交点位置记码等。
6.根据权利要求1所述的方法,其特征是汉字编码方法是键名汉字连击该键四次。独基字取键名加首笔码、未笔码。再加空格键。二基字中属上下结构的依次记码加末笔码二次自然终止,其他结构的二基字记码后一律加末笔码再加空格键;三基字属上下结构的加末笔码,其余依次记码加空格键;四基以上汉字取首2码末2码。基本笔划特殊编码。
7.为了减少重码和码长,可以规定一级简码36字,分布于36个键位上。一级简码字的编码方法是键名加空格键。也可以规定一些二级简码和三级简码。
8.词语编码方法是两字词,取每字前两码;三字词,取前两字各第一码,第三字前两码。四字以上词,取第一、二、三、末字各前一码。
全文摘要
一种汉字编码。根据汉字基本结构和笔顺编码。其特征是将汉字基本结构分成83类,其中50类为固定字基,33类为可变字基,按一定规则将它们分置于1,2……0和A,B……Z共36个键位上,根据笔顺和基本结构将汉字、词语编码。字基辨别原则是遵循汉字基本笔划之间的相离、相接和相交规律及规则;取基宜大;同等优先;独笔随离;相离随接;一切随交。本方案融字、词编码于一体,字基少,规则简单,码长短,重码极少,易于普及,适用于电脑输入和查询之用。
文档编号G06F3/023GK1167939SQ9611813
公开日1997年12月17日 申请日期1996年4月26日 优先权日1996年4月26日
发明者李善成 申请人:李善成
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1