北极星汉字输入法的制作方法

文档序号:6331766阅读:387来源:国知局
专利名称:北极星汉字输入法的制作方法
专利说明北极星汉字输入法 本发明属于计算机中文信息处理领域。
随着信息技术的快速发展,数字化已成当今世界潮流。中文输入数字化也是大势所趋。目前数字设备上输入汉字有拼音、笔画两种方法。笔画输入很方便,但输入速度慢。汉字是拼形文字,大多以部首开头,要输入3-5个部首笔画后,才能区分,这样在一定长度内是重码,增加了区分汉字的码长,输入速度也就慢了。本发明针对数字设备上输入汉字速度上存在的不足,提供一种输入速度有些改进的汉字输入方案。
汉字的造字历史延续了几千年,经历了从甲骨文到仿宋体的演变;繁体字到简化字的演变;有篆、隶、草、行、楷等多种书体;说明汉字也有一个不断发展完善的过程。构成汉字的笔画有几十种,而且是有规律的。在楷书中,笔画分为八种基本类型点、横、竖、撇、捺、钩、折、提(挑),每个基本类型又分出许多变化形态。如“点”就有“左点、右点、长点、短点”等。国家语委制定的笔画规范规定汉字有“横、竖、撇、点、折”五种基本笔画,其中规定“提”放“横(一)”中;“竖钩(亅)”放“竖(丨)”中;“捺”放“点(丶)”中;横向钩、右向的各种钩归于“折”中。
“一、二、三、四、五、六、七、八、九、十”十个数字,是最常用的汉字,也可能是先祖最先造的汉字。其中以横起笔的就有六个,对《新华字典》中的汉字进行分析,也是以横起笔汉字最多。说明在汉字中笔画的运用不均衡,有的笔画用的多,有的就少。一般的汉字,以横、竖、撇起笔的多,折笔的变化多。为了部件间的相互协调,字形美观,有些部件的笔形会随所处的位置不同而发生变化。如“土”字在右边构字时,最后一笔为“横”,在左边构字时,最后一笔为“提”。
北极星输入法是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,对汉字的笔画、笔画的组合、偏旁部首进行分类,把它们分成七类进行编码。点和折各归为一组,以横、竖、撇起笔的各归纳成两组;其中以“撇和竖”起笔的半包围组合放在一起归为一类。
一、分类情况 1992年重版的《新华字典》的《检字表》共有189部,包括基本笔画、部首(冫、氵、忄、宀……)、部首字(广、文、毛、舟……)和一些笔画组合(亠、冖、ク、勹、冂……)。说明构成汉字的不是纯粹的部首和笔画,还应有“笔画组合”。故部件应包括部首、部首字、基本笔画和笔画组合。有些笔画组合字库中没有,汉字组字时用到,可以用文字描述其结构特征。例如“一”+“丨”可以组成多种笔画组合“十


……”,这些组合可以用一句话概括,即“第一笔为横(一),第二笔为竖(丨)且这两笔相连或相交的笔画组合”。
北极星输入法以起笔笔画的类型及笔画组合分类,记住每组的特征和附注内的说明就能对汉字拆分和编码。
简化字的分类表键位 特征偏旁和部首附注4一一二亍土士王耳西雨(扌覀)提、一横、二横,横比较多的偏旁部首5十木车石歹廿(艹廾★髟)第一笔为“一”第二笔为“丨、丿、し、 、乚”的笔画相连的组合和部首6丶立衣广方火(丶冫丷▲氵ッ灬忄亠讠冖宀礻衤)点、捺,以点起笔的偏旁和部首7折了又女马弓尸(纟阝)各种折笔,以折起笔的偏旁和部首8丿八人金毛气舟臼(丿亻钅攵)撇,撇加“横、竖、撇、点(捺)”的偏旁和部首9丨九九几月鱼山(犭ク勹冂丨亅虍)竖、竖钩,竖或撇加折笔的半包围组合0口口田虫日曰目(罒)有全包围框的偏旁和部首 ★是第一笔为“一”,第二笔为“丨、丿、し、

乚”的笔画相连或相交的笔画组合(十


厂丆ナ七……),▲为连续写的两点,“凹、凸”算全包围框。编码为数字“0”。
二、汉字的拆分和编码 在汉字集中,笔画、笔顺一样,下笔的位置、长短不同,会产生字形、字义不同的字。如“九几,人入八乂,太犬……”,要使汉字无重码,就要增加许多规定。北极星输入法不回避重码,用7个数字对汉字进行编码,一般用3个数字对重码进行选择。
汉字是由多种笔画组合而成的方块形式,对于同一汉字,各人的书写习惯和理解不同,拆分方法也会不同。为了减少码长,减少歧义,本输入法对汉字的拆分和编码作如下规定1)、按照国家规范规定的笔形标准和笔顺拆分和编码。
如与→一

一→474 万→一

丿→478 义→丶丿捺→686 比→一し丿乚→587(1、2笔一与し笔画相连) 2)、汉字的编码长度为1-5个,分类表中部件一般不拆分,码长为1个;当汉字拆分的部件数为2-5个时,编码按顺序有多少,取多少;当汉字的拆分部件数多于5个时,前4码按顺序取、第5个码取最后一个部件的编码。
如本→木一→54 按→扌宀女→467 板→木丿丿又→5887 隹→亻亠二丨一→86494 焦→亻亠二丨一灬→86496 愉→忄人一月丨亅→68499 3)、有的偏旁和部首在书写时不是连续笔画,如“匚、可中的丁、囗…”。汉字有“先外后里再封口”的书写规范,除全包围框(囗)不拆,其它的不是连续笔画的部件都要拆分。
如丁→一亅→49 可→一口亅→409 叵→一口→407 虐→虍匚一→954 国→冂王丶一→囗王丶→046最后一笔“一”与“冂”构成全包围框 4)、“甲申由曲”是有全包围框的汉字,字形相似,笔顺不一样,拆分和编码也不同。
如甲→曰丨→09 由→冂十一→囗十→05 申→曰丨→09 曲→冂艹一→囗艹→05 “甲申”是先封口,再写竖;“由曲”先写“冂”,再写中间的“十艹”,最后封口。
典→冂艹一八→9548 电→曰乚→07 曳→曰乚丿→078 里→曰丨二→094 “典”虽然也是最后封口,但封口的“一”伸出框外,不能算全包围框。
5)、除“亻”外,其它的前两笔为“丿丨”,且粘连有其它笔画的,规定它们的首部件拆分为单笔画“丿”。有“延、丘、血、奥、身、向、白、囱……” 如延→丿折捺→89776段→丿二几又→89497 丘→丿丨一→8994 阜→丿丨一一十→89745 血→丿冂丨丨一→89994身→丿丨

二一丿→895 “身”的第2-5笔与“青”下的“月”笔画、笔顺一样,只是

比“丨”长一些,规定它取“月”的编码“9”,第6、7笔笔划相连编码为“5”。
向→丿冂口→890 自→丿目→80 囟→丿囗丿丶→8086 粤→丿囗丷木一ㄅ→80657 6)、许多字有几种拆分的方法,有的字取笔画少的部件,就有少的部件数。规定“开”拆成“一廾”、“未”拆成“一木”,与“开未”字形相似,下面有“廾、木”的比照拆分。
如开→一廾→45 未→一木→45 井→一廾→45 末→一木→45 耒→二木→45 朱→丿一木→845 7)、有的字取笔画少的部件,重码就少。规定“式”拆成“一

提乚丶”,“夂”拆成“丿又”,“豕”拆分“一勹丿丿丿捺”,字形相似的比照拆分。
式→一

提乚丶→45476 条→丿又木→875 处→丿又丨丶→8796 豕→一勹丿丿丿捺→49886 8)、除上面5、6、7例举的几种情况的部件外,其余的汉字按笔顺遵循“有多不取少”的拆分原则,即有笔画多的部件,就不用笔画少的部件。
如比→一し丿乚→5871、2笔一与し笔画相连 瓦→一し乙丶→5761、2笔一与し笔画相连 己已巳→一乚→75 2、3笔一与乚笔画相连 民→一し一乚→755 2、3笔一与し笔画相连,4、5笔一与乚笔画相交 巨→一一→4753、4笔一与笔画相连 等等 下面例举的一些汉字的拆分和编码,就不拆成单笔画,而是尽量写出部件。
如及→丿折捺→876 干→二丨→49 寸→一亅丶→496 于→二亅→49 才→一亅丿→498 示→亍八→48 平→一丷十→465 无→二丿乚→487 曹→一囗艹日→4050 赤→土丿亅八→4898 臣→



→5757 韦→二

丨→479 青→二丨一月→4949 麦→二丨丆又→4957 春→二ナ捺日→4560 表→二丨丆し丿捺→49576 工→

一→54 甘→艹二→54 下→

丶→56 大→ナ捺→56 亚→

丨丷一→5964 业→丨丨丷一→9964 疒→广冫→66 之→丶フ捺→676 亡→亠→67 心→丶乚两点→676 羊→丷二十→645 子→了一→74 尹→二丿→748 聿→二二丨→7449 彳→丿亻→88 手→丿二亅→849 千→丿十→85 牛→丿二丨→849 禾→丿木→85 牜→丿十提→854 豸→丿二点勹丿丿→86988 垂→丿十艹二→8554 饣→クし→97 光→丨丷丆乚→9657 夕→ク丶→96 巾→冂丨→99 贝→冂人→98 见→冂丿乚→987 貝→目八→08 見→目丿乚→087 黑→囗丷丨二灬→06946足→口人→098 其→艹二一八→5448 6、7笔一与丿笔画不连 基→艹二丆捺土→54564 6、7笔一与丿笔画相连 牙→一亅丿→4798 1、2笔一与笔画不相连 东→一亅八→598 1、2笔一与笔画相交, 等等 上面例举的是按数字键盘对应的编码。北极星输入法还可在PC键盘上,找七个字母与这七组分类相对应进行编码。
北极星输入法可以对《新华字典)》中所有的字编码,对于更大的汉字集一样能够编码,只是增加了一些重码。北极星输入法还可以对词组进行编码。
对《新华字典》中所有的简化字进行编码和排版,90%的编码重码不超过3个。下面几页是以编码“4”开头的汉字的编码和排版情况。
附注 一般情况分类表中的部件不拆分,有些编码长度为1--3的重码很多,当重码多于6个时,可以考虑把最后一个部件在原来组内拆分;重码尽量不超过8个。如编码“65”的重码很多,可以考虑把“木、车”往下拆,“木”拆成“58”、“车”拆成“55”。原来的编码及字调整后的编码及字 65 汇计斗汁宕柘辛军库米床宋沐亲 65 汇计斗汁辛宕柘 655 麻淋柒 655 军库麻淋柒 658 敉 658 米床宋沐亲敉 繁体字的分类表键位 特征偏旁和部首附注4一一二亍土士王馬耳西雨(扌覀)提、一横、二横,横比较多的偏旁部首5十木车石歹廿(艹廾★髟)第一笔为“一”第二笔为“丨、丿、し、、”的笔画相连的组合和部首6丶立衣广方言火(丶冫丷▲氵ツ灬忄亠冖宀衤)点、捺,以点起笔的偏旁和部首7折了又女弓尸(糹阝)各种折笔,以折起笔的偏旁和部首8丿八人金毛气舟臼(丿亻攵飠)撇,撇加“横、竖、撇、点(捺)”的偏旁和部首9丨九九几月魚山門(犭ク勹冂丨亅虍)竖、竖钩,竖或撇加折笔的半包围组合0口口田虫日曰目(罒)有全包围框的偏旁和部首 4一土士西雨耳亍 440域拮擂44二三王圭酉珥 4垣酲聝 444挂封珪堙垚 5撷醴醍(7醌) 7酝 6揀 8酵摽 7堰揠 9持酊酐(6酎酾酺9犎) 8醒埂 0醽 9坷珂攮 445抹捧醋 45开井弄丰未末 4酣拭454式扛坩 6揍酞琫(6琎7醃)4捱撕墈(7堪8琪) 7楔甄 5耕彗慧(7酆) 8琵醛 7振震耘(6甙) 9酽擩 8拱珙 0酤醢醐9寿焘撒(4耩8霰) 446珏酬醉0措撼瑊(6堿8璜) 5坪抨挟(5醾6醚) 455琳霖砉 7瑟酿恚(4醯)4耨 8酖酡醨 6耢塨 0醇醅 9

剨 447匡揶邽鄄雩圬 0匿慝 4玙捷醁 456进奏垮 5拒配 4奉墙琦(7挎8捺撅9埼掎) 6坛珐抟弍弎(4垤搕7酸8醪9捯) 5耧耱 7摄劻

(7醊) 6撩垯挞(6耪) 8酦 7捞琏塃 9玮琶玡(7扽琊9醑) 8秦舂 448扶票酕 9泰 4拷酶酷(5撵酴6醺7酰)0掩春蠢(6耲7埯) 5酥酢 457技戒载栽邦邢 6酗抠琴(4攉6醮酹) 4捂耔 7玩抚酪(8酚0酯) 5堞 8堎瓢 6扰拔 9款飘掭(9剽)7城扼 0堵 8拣拢戎坜雳(6珑契恝8絜9挈0耞) 449打球玎耵圩玕 9帮耙 4酮瑇醵 458耗耒栗 6卦寺酌(6挝0酩) 4塔搭耠 8贰琢醄 5搽挠嫠(6漦9犛) 9捕搏刲(6埔醭) 6找 7批玭揩(0堦) 468控挤斑耿圹 8形 4班璇 0塬 5探琛挓垞 459需刑型 6坟雯抆(4搉霪6璃9垴霁) 4填埴耡 7挖耽拕坨(0揢) 5瑛 8捽瑢 6坏环抔(4垭挜坯0耥) 9掖摈 7艳匦耜 0撺 8耖顼 469壳坑抗 9颥抪 6抃擦琬(6悫) 450拓描霜 7扪琯搁 4揸瑾 8挱 5摸霸擀 9壶撇 9耦瑚鹴 0掂 0瓘 460培掊揞46灭扩拉垃玉坊雱 5掸璋 464拄壹幸 6聪壕 4拦撙 7墩撴埻 5拼垟搓(0墡搳) 8境 7琺搠搛 9增搞掠(4撞6瓌7霭8琼0塙) 8联掷琮(7垸捲) 0擅壤攘(4壇6瓖) 9拧拌聍(4盩6塚9觳9霈) 47亏要取耶扎玛 0瑄霅揎(6懿) 474与扫扭雪 465平来抖挥珲 4挦 5慭 6埽 6夹颊摭(7郏)7握垠 7搂擞 8挪撖捃(0珺) 8粟霂 9择妻郪(6埭8欤) 9壶赉璘 475巨圮圯玘 466摘琰掞 4霞瑕 6搒 5抿珉搌 9搅墒 6块抉块 467护接按垵霎 7撰 4塘搪琅(6埌7瑯9墉0瑭) 0据琚 5捩 476去云专弌 6志撤迺(6忒7琉) 4至到致(5摒臻7郅) 7摔搐 5拚掺 8裁垓 6运 9掮匾 7却动劫(4擢5揉6叇搦8璆9抒) 8拟挨埃(6魂7叆8揆)4推援携(4堆霍6捋埒7瑗) 9捅盍 5播璠摋 0抬搔朅 6授瑗 477聂娶掼 7拎聆捻挼(6鸥6珧埝瓯7殴8欧) 4掾 8爽摇瑶(6擒) 5毐颞 9霾 6拇坳拗 487无元扮 7掇拶瑙(5搡) 4孝教埠(8堠) 8拯 5顽抵扺(6坻) 9掘 6圾远 478万扔夷 7抢跄雾(9抑) 6迈摊戋(4盏9刬) 8芬雰玢(5棻9聊) 7拨坭劢(6炁) 0指珞挌(7鼋) 8扬场聚(7鄹)488匠老誓 9坡披拂(7玻) 4挫垢珩 0招珈虿(8趸) 5拆折圻(6坼逝8掀踅0哲蜇) 479韦地牙 7抡扳霓坂(4耋8耄鋬0耆) 5把声韨(5磬9罄0謦馨) 8珍撬覆 6违墀 9抓玠搋 7报屯顿(6韧迍7匜邨) 489圳赤亓 8迓邪雅(4鸦8韬9壻)4塅 9拙 6墺忝 0韫 7搜搬 470擗霹 8规揿赦(7郝赧8赫赪0赯赭螫)48天夫示扒玫 0垧 484医考拴 480吞蚕者拍珀垍 5珠 5碧攥奭 6捡逵 6煮 7拖挺圪(6霉霆珽) 7都翥 8替祘攒(4鹥毉5辇6翳8瓒繄) 8瑰捭埤 9瑜揄拊(6坿) 9瑀 0拾匼壎 0擤 485托扦插 49丁干于击玥玑 4拃坵 494青责素 5捶埵 4排匪琲(4霏) 6揪挢玳 7毒敖熬(4聱6遨獒7骜8鏊赘纛9嶅 7诱 鳌0螯
0括聒 9静靓珮(6璩8靛) 486区挑零玲 0垌 495表麦垛9捍埘 4捵0喆擐 7麸麴405抽捆覃車 9顶瑞揣(8顸) 4提堤聘(4堽6戴) 496寸扑执均玖坍 6摁 4垫璿 7墼 5掬8琨 6过热撑9颉 7挡迂势(4珰6摅霡8絷9捣)0曹遭堌 8求救鋆(6逑裘9挚)406喜彭塄 9盐捎霄(4鹂鸷6丽逦7郦8琐贽)4豆逗鼓(4豇鼟5鼙6熹甏鼕7豌豉0 0蛰嘉瞽嚭) 497投邗垆7揌 4坞挣

9柬 5抱雹垲0璟 8抛掳407事画叵 498才走丙坎坝掐 6塌 4掏赶趣7郾摞 5越趔 8拽拐捌(6哉) 6贾摧璀(8趑) 408更职袁 7现起邴(4趯9赳0超) 6吏 8两抄赵逐(4趖6豕燹胾7豭8趱趁豮 7露璐撂9豨) 409可押捐坤珅抻 9赴趋趟(4趄7撄璎) 4歌理埋(6惠7匮8聩9哥) 0鼒6鬲融囊(5橐6鬴翮0蠹) 499拥再武琥堋8束捉损埙埚(4整6速7揭8赖敕埸9 4扯址耻珊聃(4鹉5斠

6遘7觏9掯)剌) 5换9揾 6甫逋敷(5璨6璞) 400副逼瑁 7匝7墁 8枣刺珎(7揽8棘僰) 8攫 9刊塴埆(4盂墟) 0操璪酃 490拘拈坫玷坰珣 5掉 8挽搀堍40扣吉雷垇 404亘坦担捏揖埕 6掴 7或惑撮(6摆彧)
权利要求
1、北极星汉字输入法是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成七类。
第一组以“一”为特征。提、一横、二横,一些横比较多的偏旁和部首放在这组。用数字“4”编码。
第二组以“十”为特征。第一笔为“一”,第二笔为“丨、丿、
、乚”且这两笔相连或相交的笔画组合和部首放在这组。用数字“5”编码。
第三组以“丶”为特征。点、捺,以点起笔的偏旁和部首。用数字“6”编码。
第四组以“折”为特征。各种折笔,以折起笔的偏旁和部首。用数字“7”编码。
第五组以“丿”为特征。撇,撇加“横、竖、撇、点(捺)”的偏旁和部首。用数字“8”编码。
第六组以“丨九”为特征。主要为半包围组合。竖、竖钩,竖或撇加折笔的半包围组合。用数字“9”编码。
第七组以“口”为特征。有全包围框的偏旁和部首,用数字“0”编码。
汉字的编码长度为1-5个,分类表中部件一般不拆分,码长为1个;当汉字拆分的部件数为2-5个时,编码按顺序有多少,取多少;当汉字的拆分部件数多于5个时,前4码按顺序取、第5个码取最后一个部件的编码。
2、权力要求(1)所述的北极星汉字输入法,按照国家规范规定的笔形标准和笔顺拆分和编码。还可在PC键盘上找七个字母与这七组分类相对应进行编码。
3、权力要求(1)所述的北极星汉字输入法,除几种特殊情况的部件外,其余的部件按笔顺遵循“有多不取少”的拆分原则。
4、北极星输入法可以对《新华字典》中所有的字编码,对于更大的汉字集一样能够编码。
全文摘要
北极星汉字输入法是一种字形码,以国家规定的五种基本笔画为基础,根据汉字部件中起笔笔画分布不均匀,笔形是动态变化的特点,把汉字的笔画、笔画组合、偏旁部首分成七类。记住每组的特征和定义就能对汉字拆分和编码。
文档编号G06F3/023GK1584812SQ200410048218
公开日2005年2月23日 申请日期2004年6月15日 优先权日2004年6月15日
发明者高永贤 申请人:高永贤
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1