四笔汉字码的制作方法

文档序号:6411965阅读:541来源:国知局
专利名称:四笔汉字码的制作方法
技术领域
本发明属于计算机汉字输入方法及键盘,国际专利分类号G06F3/023。
发明专利公报1996年5月29日公开了一种汉字形音四码编码方法及其键盘,公告号CN1123425,其特点是按字形和拼音编码,构成形码、音码、音形和形音码四种输入方法,字形码包括汉字结构模式代码、左上角和右下角笔形代码,结构模式和笔形被归纳分类并用数码表示,音码包括声母和韵母代码,本发明的键盘,将声母代码按音序排列,韵母代码按坐标式韵头韵脚对应关系排列,与26个英文字母键对应并用可表示形码的双数码表示。其缺点是编码复杂,记忆量大,平均码长较长。
本发明的目的是提供一种编码简单、易学易记、平均码长1-3码、重码率低的音形四笔汉字码。
本发明的目的是这样实现的一种四笔汉字码,对每个汉字和汉语词进行音形结合的编码,其特征在于它以汉字的横、竖、点、撇四划为标帜,界分出音码和形码,凡在汉字的起笔部位有四划中任何一划,则定为音码,按汉字字音的声母作为编码码元;凡在汉字的起笔部位出现某一字根,以字根代号作为形码编码码元;其键位代码与字根的对应关系为A厂米石B疒髟DクE讠页雨F口G刂弓艮广HI阝艹J隹N扌牜O冖宀门凵P氵Q又犭欠R亻UX尸
Vㄥ厶彳W攵
衤X忄穴Z子,笔形定义一H;丨I;丶D;丿P;在字形首笔出现其中某一笔形,用字音声母标号,在字形的中下部出现用笔形名称编码;编码方式依照汉字书写顺序,从上到下或从左至右依照汉字的四种类型拆分字形组件,每一个汉字用1-3码,编码规则a确认四种类型(1)上下重叠型先上后下将字拆分取前面两个编码码元+末笔码元拆;(2)左右并列型从左到右将字拆分,左侧先取一码+右侧上下各一码;(3)外围型先外后内将字拆分;(4)笔划交叉型先注字音,后注笔形;b重码或错字出现,可在末位代号后面增加一字音码,也可将字拆分成四个组件码;c定义字(1)“女”字本音为N,规定“女”出现在字形首码时,应用“L”为码元;(2)人盖头字形拆分时,不得将“人”字作第一位码,取该字字音声母为第一位码;(3)笔画不超过四画的汉字字声母码+末笔码;
(4)字根中所用单字在组合体字型中只作一码,独立使用时仍按常规编码方法编码;(5)高频汉字20个每字一码B不S是T他D的E二J九H和Z在W为L了R人M民C常N年Y有G国F发K可Q全X行;(6)繁体汉字,按上述规则拆为四码;d词组的编码规则如下A二字词组第一字首笔码+第一字末笔码+第二字首笔码+第二字末笔码,B、三字词组第一字首笔码+第二字首笔码+第三字首笔码+第三字末笔码;C、四字词组第一字首笔码+第二字首笔码+第三字首笔码+第四字末笔码;D、五字以上的词组第一字首笔码+第二字首笔码+第三字首笔码+最末字的末笔码。
由于本发明采用音形结合的编码方式,用汉字笔划横、竖、点、撇四划为龙头,标帜辨认出汉字的音形界分点,汉字的首笔有四划中任何一笔划出现则用声母字标号,字形起首部位有字根出现即为字根代号,字形码的字根数45个,具有音形互补字根数少,易学易记,平均码长短,每个单字为1-3码,词组平均4码等特点。
下面结合附图和实施例对本发明作进一步描述。


图1是本发明的字根与键盘对应表,黑点表示记忆形符对应,无黑点字根为形符自然对应。
图2是词组取码字意图,黑点为取码部位。
四笔汉字码是采用音、形结合编码方式,它以汉字的横、竖、点、撇四划为标帜,介分出音码或形码,凡在汉字的起笔部位有四划中任何一划均为音码,按字音声母字标号,例立L 日R 十S 土T 大D 小X。
形码是以字根为标帜,界分出音码或形码,凡在汉字的起笔部位呈现某一字根,即以字根代号标码。
单字的界分点在字头,汉字的组合部件,识别码仍然在组合字头。例“天”TD呈KW尖XDR。
汉字的组合形态多样,拆形编码的方法要按照汉字的书写顺序、由上到下、从左至右,并依照汉字的四种类型拆分字形件,每一个汉字用1-3码。
汉字结构四种类型及取码实例(1)上下重叠型先上后下,(前二末一顺序拆分)首笔码+第二码+末笔码。
“吕”口口“音”立日“台”厶口K K L R V K“覃”西日十 “苔”艹厶口 “晶”日日日X R S I V K R R R“暮”艹日大日“寞”宀艹日大“叠”又又且
I R RO I D Q Q Q(2)左右并列型(左一右二、三拆分)。“明”日 月 “故”古 攵“戏”又 戈R Y G W Q G“捌”扌另刂 “倒”亻至刂“湖”氵古 月N L G R Z G P G Y(3)外围形先外后内拆分“因”囗 大 “团”囗 才“圆”囗口 贝F D F C F K B(4)笔划交型先注字音、后注笔形。
七 Q V 大 D R 夫 F R规则(1)重码或错字出现,可在末位代号后面增加一字音码。亦可将字拆分成四个组件码。
(2)“女”字本音为N,规定凡在字形首码时,应用“L”为代号。“好”LZH奸LGJ 婪MMN 婴BBN。
(3)人盖头字形拆分时,不得将“人”字作第一位码,例“全”QWQ 仝TGT 会HEV 个GI。
(4)四笔以下的汉字只用两码,例天TD 见JV 斤JI 文WU。
(5)列入字根的汉字,单独取码时,应照常规拆形编码。高频汉字(6)设有20个高濒字,为一字一码(也可以照常规法将每字编成1-3码使用)。不是他的二九和在为了人民长年有国发可全行BSTDEJHZWLRMCNYGFKBX(7)繁体汉字(指简化字相对应的繁体字)用常规法,以四码分解字形。例(粝)(爄)AAIY(车)(車)CSYS(见)(見)FEEV(间)(間)ORJJ(确)(確)AOJQ(岂)(豈)SDHQ例料ADS 答AHK 餐BQG 辊CRV 甸DTS 衣EWE 瞳FLL高GKK 互HH 燕IKH 舅JTL 哪KUI 婚LSR 权MQQ批NVV 宵OXY 淡PHH 妻QNQ 晨RAL 肆SWN 累TVX敢UWE 继VVA 离WOL 小XD 邮YIY 曾ZFR 孤ZGV词组码依照词条的字数区分为四类双字词 三字组合 四字组合 五字以上的组合每条词组码位,平均四码,各类词组取形的部位,依照图2所示的四点标记所在部位识别代号。例汉 语PQEK 前程万里QHWT北 京BVJX 四季如春FHLR湖 北PYBV 实事求是OSQS共和国IHFW 中华人民共和国ZRRW怡和圆XHFY 北京市人民政府BJSC词组的容量和内容随不同用户的需求照上述方式录入备用。
自测统计数据汉字数GB一、二集字数(1601-8794),词组数12000条以上,码元数27键(含空格键),码长1-3码,词组平均四键,重码数单字重码组2个,字根数45个,其中34个字根用15个键名匹配,11个字根的字音同键名对应,错码、重码、疑难字用用校正方法,重码了加一盲打键正位,错码、疑难字可用校正码排除。
权利要求
1.一种四笔汉字码,对每个汉字和汉语词进行音形结合的编码,其特征在于它以汉字的横、竖、点、撇四划为标帜,界分出音码和形码,凡在汉字的起笔部位有四划中任何一划,则定为音码,按汉字字音的声母作为编码码元;凡在汉字的起笔部位出现某一字根,以字根代号作为形码编码码元;其键位代码与字根的对应关系为A厂米石B疒髟DクE讠页雨F口G刂弓艮广HI阝艹J隹N扌牜O冖宀门凵 P氵Q又犭欠R亻U乂尸
Vㄥ厶彳W攵
衤X忄穴Z子,笔形定义一H;丨I;丶D;丿P;在字形首笔出现其中某一笔形,用字音声母标号,在字形的中下部出现用笔形名称编码;编码方式依照汉字书写顺序,从上到下或从左至右依照汉字的四种类型拆分字形组件,每一个汉字用1-3码,编码规则a确认四种类型(1)上下重叠型先上后下将字拆分,取前面两个编码码元+末笔码元;(2)左右并列型从左到右将字拆分,左侧先取一码+右侧上下各一码;(3)外围型先外后内将字拆分;(4)笔划交叉型先注字音,后注笔形;b重码或错字出现,可在末位代号后面增加一字音码,也可将字拆分成四个组件码;c定义字(1)“女”字本音为N,规定“女”出现在字形首码时,应用“L”为码元;(2)人盖头字形拆分时,不得将“人”字作第一位码,取该字字音声母为第一位码;(3)笔画不超过四画的汉字字声母码+末笔码;(4)字根中所用单字在组合体字型中只作一码,独立使用时仍按常规编码方法编码;(5)繁体汉字,按上述规则拆为四码;d词组的编码规则如下A二字词组第一字首笔码+第一字末笔码+第二字首笔码十第二字末笔码,B、三字词组第一字首笔码+第二字首笔码+第三字首笔码+第三字末笔码;C、四字词组第一字首笔码+第二字首笔码+第三字首笔码+第四字末笔码;D、五字以上的词组第一字首笔码+第二字首笔码+第三字首笔码+最末字的末笔码。
全文摘要
一种四笔汉字码,对每个汉字和汉语词进行音形结合的编码,其特征在于它以汉字的横、竖、点、撇四划为标帜,界分出音码和形码,凡在汉字的起笔部位有四划中任何一划,则定为音码,按汉字字音的声母作为编码码元;凡在汉字的起笔部位出现某一字根,以字根代号作为形码编码码元;字形码的字根数45个,具有音形互补字根数少,易学易记,平均码长短,每个单字为1-3码,词组平均4码等特点。
文档编号G06F3/023GK1167296SQ97109138
公开日1997年12月10日 申请日期1997年6月11日 优先权日1997年6月11日
发明者汪洋 申请人:汪洋
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1