一种笔形代码输入法的制作方法

文档序号:6341768阅读:392来源:国知局
专利名称:一种笔形代码输入法的制作方法
技术领域
本发明涉及一种汉字输入编码方法,具体地说是一种笔形代码输入法。
背景技术
现有的汉字输入法多采用英文字母编码,常用于带有大型键盘的计算器上,双手操作,而其在分数录入器或手机上应用时,汉字的输入过程就极为繁锁,应用大为不便;传统的四角号码检字法由于其重码率过高,其并不适用于现有的仪器设施中的汉字输入过程。

发明内容
本发明的目的在于提供一种编码字符少、重码率低的笔形代码输入法。
为实现上述目的,本发明采用的技术方案为利用汉字的方块型有四个角的特点,来编制笔形代码,将汉字拆分成若干不同笔形,并将它们与0~9十个数码对应;并按照数字的编码输入,它们的对应关系如下0亠,冂;1一,口内一长横, 2丨,丿, 亅;3短一,丶, 宀,了,凵;4十,ナ, 5丰,扌,艹, 6口,囗,匚;7;8八,人,丷,;9小,忄, 个, ;使用上述单字笔形代码编码规则是单字编码是五位数,前四码编码规则以方块形四个角的笔形为编码基准顺序,左上角笔形为①码;右上角笔形为②码;左下角笔形为③码;右下角笔形为④码;有角不取中,一笔形一码,有复不取单,先外后内;第⑤码为中码,是每个字的中间笔形中取一个笔形,取码规则是先中,②下,②左,②无改①,不足五码,以“0或复笔码”补足。
本发明具有如下优点1.重码率较低。本发明利用汉字的方块型特点,均衡笔形与0~9十个数码的对应关系,减少其重码率。
2.易学。技术简单,编码字符少,自学就能学会。
3.完整。本发明适当安排数码与简码字、单字和词组的关系,充分利用其数码,组成一套比较完整的输入法,编入汉字词典的全部文字和绝大部分词组(另外还有词典中没有的个别词组)。
4.操作简单。单、双手操作均可。
5.操作时直观性强。
6.适用广泛。既适用于大小键盘,也适用于手机。
具体实施例方式
本发明的编码和取码规则如下A.笔形和代码参见附表1;注口内一横,有长横和短横之别,长横仍视同“1”,短横视同“3”;口内一长横仅附表内15个字,其余口内一横均视同短横“3”。
笔形代码口诀横一垂是二,短一捺点山(同时也是3的谐音),叉4串穿5,方框横槽6,7角八是8,九钩躺槽小,倒槽是个0,点横也是0。
B.单字笔形代码编码程序一、单字编码是五位数,前四码编码规则汉字是方块形,它的笔形分布方块形的每个角落和上、下、左、右。每个角落上、下、左、右的笔形中,又有内外之别。其编码规则有角不取中,一笔形一码,有复不取单,先外后内。
(一)有角不取中。
汉字的笔形检字法的编码顺序,以四个角的笔形为编码基准顺序,其他上下顺序和左右顺序,均以四角顺序派生的顺序。
四角编码顺序左上角笔形为①码;右上角笔形为②码;左下角笔形为③码;右下角笔形为④码;所谓“有角不取中”,就是汉字的四个角有笔形时,必须取四个角上的笔形,为笔形代码。不取中间的笔形为笔形代码。例

(二)一笔形一码一笔形一码,就是一个笔形一个代码,每个笔形用过后,一般不再充它码笔形。不足四码,可用“0”补足。
但被一笔纵穿或横穿已作“5”的笔形码中,允许被穿的笔形,再充其本身的笔形代码。冂、、匚、凵笔形与它笔相交已作“4”的笔形代码,也允许再充其本身的笔形代码。反行之也行。即已作本身的笔形代码,也可再充为“5”和“4”的笔形代码。例

另外一笔下来有两个以上的笔形,或一笔的上、下两段笔形和它笔构成两种笔形时,均应分段取码。例

(三)有复不取单笔形中分单笔形和复笔形,所谓复笔形是由两个单笔形以上组成的笔形。
两个单笔形出现在一个笔形码位子时,如能组成一个复笔形,取笔形码时均应按复笔形取码,不能按单笔形取码。例

(四)先外后内字中的笔形,有时一个笔形复盖两个角,此时的取码方法仍按四角编码方法①②③④的顺序,前角笔形码可取外层的笔形为笔形码;后面的只能取内层的笔形为笔形码。取内层的笔形码时,必须以最靠近前一笔形码和顺序方向来取笔形码;但取内层笔形时,在前进的顺序中碰到单独的“点”,仍算是靠近前一笔形码。
顺序方向是②笔形码是在①笔形码最右侧,④码是在③码最右侧,③码是左下角,④码是右下角。例

(五)特殊规定1.以“氵”、“彳”作偏旁的字,只采用第一笔形为笔形代码,其余不作笔形代码。例

2.以“酉、鱼、疒”作偏旁的字,其第③码笔形往上移一格,“酉”的③码为“5”,鱼的③码为“6”,疒的③码为“3”。例

3.“扌、于”往左钩的笔形,可作笔形代码“7”,其余往左钩不作笔形代码。例

4.“门、門、

”字笔形码,只取①、②笔形码,其余笔形码均在门内。例;

5.“几”前笔形“几”为“0”。后段“几”为“9”。例

6.“牜,

”不属笔形“扌”。
注有时一个字只有一个笔形,就取一个笔形码,有两个笔形就取两个笔形码,中间无笔形者,就按顺序通过。最后不足四码时,以“0”补足四码。例一1000二1100了3000土4100士4300二、第⑤笔形代码(简称⑤码)编码程序⑤码应该说是“中码”,它是每个字的中间笔形中取一个代码。按此思路来取⑤码。
其编码规则是先中,②下,②左,②无改①,不足五码,以“0或复笔码”充之。
(一)先中,就是一个字,若是由左、中、右三部分笔形组成,或字的上半部分笔形也是由左、中、右三部分笔形组成时,以中间部分笔形的左上角笔形为⑤码。例翃45715 揿57788 跳62193 條27292 壮34112 澈38040盥77101

77130 鬻99029 學77474 舉77582

77614

(二)②下,②左。就是一个字,若不是由左、中、右三部分笔形组成,就取②码下最左侧或②码左侧的笔形为⑤码;例亲08941 壹41183 摄51742 葬51592 宿31262 雳14227婆37474 派32237 岷39247 浚33471 孢15492 甡25112例②码下最左侧为⑤码。


注同一字中,既具备②下,同时也具备②左的条件,二个数码均可录用。
注下列笔形“广、厂、户、尸”第⑤码一般取在上述笔形下的左角笔形为⑤码;例房为39250;漏为39201;扉为39211;属为79202;涯为31214;

为31288(三)②无改①,就是当②码下,无笔形可作⑤时,则可在①码的右上角或①码下的最右侧的笔形取为⑤码。


73223 戏73457 邪73221 刻02822 到12122 却45721


(四)不足五码,以“0”或“复笔码”充之。就是不足五个笔形时,可用“0”充⑤码,或前四码中有复笔码“×、宀、囗……”可作本身的代码充⑤码;冂、凵、匚、若充⑤码时,其代码均为“7”(十不能充“4”码)。

注一个字同时有两个以上复笔时,则以前头的笔形为⑤码。
(五)特殊规定1.遇到“戈”笔形的字,均以“戈”的左下角笔形为⑤码,左下角笔形若已被它码占用,则以它码上层笔形为⑤码。
注左下角是指“戈”的左下角,不是“字”的左下角。

2.字的右侧是“页、鸟”,其⑤码均以①码下的右侧笔形为⑤码。例

3.遇到

笔形,其⑤码均以该笔形的“口”下的中间笔形为⑤码。

4.“及、乃”的①码为“1”;“马、牙”的①码为“7”;5.当整个字是一笔纵穿两笔或两笔以上的字,其取码方法第①码为“5”,被纵穿的最上层的笔形为第②码,最底层的笔形为第③码,次底层的笔形为第④码,②码下笔形为第⑤码。例申56100 束51960 事51956 史56300 曳56210 来51919当一笔纵穿二笔或二笔以上的笔形中,“口、冂、、凵、艹”需要时,可以再作笔形码。口为6,冂为0, 为9,凵为3,艹为5。
中56000 吨65793 華51550 枣51330 肃59229 垂25150注被纵穿的笔形,其笔形码均以原笔形码不作相交的4码。例;“曳”的笔形码是56210,不作“56440”。
6.凡遇到“匕、几”笔形作②码时,其第⑤码一般都取其下角的钩“9”。例骰00049 70339 般20049 楷42969 皆22619 些221197.笔形“ ”作为②码时,其第⑤码 为“7”, 为“1”。例肓02017 盲02637 忘02337 育02011 亥02821 充022918.“先外后内”对⑤码同样适用;角的两端不作“7”。
9.“雨,竹”作为字头时,其第⑤码均以二字头下的笔形中取第⑤码。
其它几点说明(1)凡遇到 笔形其第②码为“7”时,其第⑤码一般采 笔形下的笔形的第⑤码。例狰47259 57476 蟾57167晚67396 跪67197 喙67231(2)右侧半个字只有三个笔形,或整个字只有五个笔形,此时右侧的第三笔形和整个字的第五笔形,也可作为第⑤码笔形。
(3)其笔形(口、冂、凵、匚、)具有框架子和框内也有笔形,取笔形时,它处的位子为具有两个笔形码位子,第一码为框架子,第二码为框内笔形。它处的位子只有一个笔形码位子,则只取框架子为笔形码。若具有多个笔形码位子,则按先外后内和取码顺序取其笔形码。例是63811 暑63634 署62634 岚32094 灵91890 明60311国61134 匾63207 烟96884 黟67322 嗅66842 野67123与“必”组合的字,“必”上侧和右侧没有覆盖着其他笔形,其第②码为“4”。例必34733 泌34333 珌14133 宓33343取码时应注意之点(指前四码)1.在取前四码时,字的左右笔形,如果独立或平行之笔,则不问高低,概以最左最右笔形为笔形码。例非1111 班1111 鬴1300 代2324 卡2123 忐21332.如遇到多笔形时,则首先是有角不取中,就是角上有笔形先取角上的笔形为笔形码,不取中间笔形。另外左侧笔形取较高的,右则取最右的笔形为笔形码。例(前二字是有角不取中)成7325 黼3300 力4720 夬5780 挚5752 披5774但在右侧为遇到一笔穿插多笔的5笔形时,仍以5的笔形为右侧是笔形码,不以被穿插的笔形为笔形码。如,神的笔形码是05961,不是06951;曲的笔形码是55650,不是56550。
3.斜撇为他笔所承,取码时则取他笔为下角。
如,衣的笔形码为0273;碓的笔形码为1061。
4.一个笔形,在延伸过程中,方向变了,变成另一个笔形,或一个笔形在延伸过程中与它笔组成另一种笔形,此时应分段取码。这个分段取码如何取法汉字是方块形的字,它是由若干不同笔形分布在方块形的每个角落,每个角落中又有内层外层之别。笔形码为了有次序的取码,则规定左上角为①码,右上角为②码,左下角为③码,右下角为④码;

可是汉字的笔形排列,不完全是这一个模式,因此产生其他排列顺序,但其他的排列顺序均以此为基准码。其它排列顺序有




因为字的笔形,有时一个笔形覆盖两个或三个笔形码的方位。此时的取码的顺序,若是独立笔形,可按先外后内原则取码,在前头的笔形码可取外层的笔形为笔形码,后头的笔形码可取内层的笔形为笔形码。如“寞”字,①码为“宀”取码为3;②码只好取“宀”下层的“艹”,取码为5;③码为“八”取码为8;④码只好取“八”的上层“十”取码为4。可是由于一个笔形覆盖两个笔形或三个笔形码的方位时,在覆盖过程中前个笔形与后个笔形是两个不同笔形。此时即产生分段取码了。如“以”字的左侧笔形

起笔是在①码位子上,其笔形是“丨”,其笔形码为2;右侧笔形“人”起笔是在②码的位子上,其笔形也是“丨”,其笔形码也为2;③码笔形是“角”,可是它是由①码笔形延伸过来的笔形,笔形码为7;④码的笔形是

可是它是由②码笔形延伸过来的笔形,它的笔形码为8;所以“以”字的前四个笔形码为2278。
可是“似”字的笔形码是2228。“似”字同样有

的笔形,由于

笔形不在笔形码的方位上,则

笔形在“似”的前四位笔形码中不起作用。所以延伸的笔形方向变了,变成另外一个笔形时,或延伸后与它笔组成新的笔形,该新笔形是否在笔形码的方位上,这是分段取码的必要条件。这也就是分段取码的原则。
又如“阵”字,①码是由 与“丨”组合成角,则①码为7,①码笔形往下延伸是“丨”,则③码为2。②码是4,②码往下延伸方向往右拐,变成“角”,可是这个角的笔形不在前四码的方位上,所以该笔形没有分段取码这一说。“阵”的前四码是7425。“阝”在“阵”有分段取码这一说。可是放在“都”就不存在延伸的问题。也就不存在分段取码的问题。
又如“厂”字,①码为7,②码是由①码延伸过去的,可是②码的方位笔形是“一”,所以②码是1。③码是由①码往下延伸过来的,它的笔形是“撇”,故③码是2。
厂的前四笔形码是7120。
又如“斤”字①码是由二个撇组成的一个角形,①码为7,①码笔形往右延伸是撇,则②码是2,①码往下延伸仍是撇,则③码也是2。则“斤”的四码是“7222”。
总之一个笔形延伸后变成另外一个笔形,或延伸后与它笔组成新笔形,是否需要分段取码,关键是新笔形是否在笔形码的方位上。如在笔形码方位上,则可按新笔形取码。为不在笔形码方位上就没有分段取码这一说。这就是分段取码的规则。
另外一个笔形延伸后的笔形与上笔形是同一笔形,它虽占着两位笔形码的方位,这个笔形不能分段取码。它只能先外层笔形后内层笔形方法来取笔形码。为川字的前四笔形码是2220。
5.娄、米、婁、中、申、未、末、来、事、串……等字笔形是属排列顺序的行列。则这些字的取码方法是应该按上述顺序分段取码。
娄94479 米94900 中56000 申56100 末51930未53910 来51919 事51956 串56600附则1.笔形以《印刷通用汉字字形表》的规定为准。
2.取代码笔形时应注意①独立或平行之笔,不问高低,概以最左、最右的笔形为代码笔形。
②在取角码时,在左上角应取较高之笔;在右上角取较右之笔,在下角应取较低之笔。
三、单字的简码单字简码共分三类(一)一位数的简码,是两个字“2”为“的”,“6”为“是”;(二)二位数的简码,共100个字编制方法每个字的①码和①码对角码;(三)三位数的简码,共917个字
编制方法每个字的①码②码③码。
所说对角码为注①码的对角码,不一定是④码,因为④码有时被③码覆盖,有时被②码覆盖,因此只能称为①码的对角码(即第四角最外层笔形)。
采用二位数的简码的文字,组编一篇短文(省会中的渔村)。
采用三位数的简码的文字,组成一篇短文(自改革开放后的新中国)。
这两篇短文,由于采用文字有限,其文理可能不通。其主要目的是通过它便于记忆。这些文字是简码文字,在运用上可发挥其简码的作用。
C.词组和代码词组共分三个类型一、四位数代码词组(约五千余条)四位代码词组是四个字组成。编制方法是采用每个字的①码为编码依据。例

二、六位数代码词组(约三万四千余条)1.两个字的词组。编制方法采用每个字的①码②码③码。例

2.三个字的词组。编制方法采用每个字的①码和①码的对角码。例

3.五个字的词组。编制方法采用每个字的①码,再加上最后的那个字①码的对角码。


4.六个字的词组。编制方法采用每个字的①码。例

5.国名、地名、市、县词组
(1)国名和地名词组。编制方法与词组编制方法相同。例

(2)市、县词组两个字的市县词组。编制方法是采用每个字的①码②码③码。例

三个字的市县词组。编制方法每一个字采用①码②码③码;第二个字采用①码和①码对角码;第三个字采用④码(市为0,县为3)。


三、七位数代码的词组(不足300条)(一)七个字的词组。编制方法采用每个字的①码。


(二)七个字以上的词组。编制方法采用前四个字和后三个字的每个字的①码。


繁体字、异体字、不常用字笔形编码表该编码表的编码方法与常用字编码方法相同(约3194个字)。
D.标点符号和代码


代码788(+、-、×、÷、>、<、=、≠=8个符号自选。
下列的单字编码不十分合理,为了减少重码列表如下

笔形与代码字例月01100 一10000 仁21210 宗31910 军37574 古46000且01110 北12192 顺21282 山32000 入38000 力47200病01304 沓12619 占21600 州32233 空38121 皮47247言01610 下13200 外23227 岸32247 良39731 女47400语01764 于14700 我23550 幽32731 有40110 九47790福01966 天14800 千24000 崑32796 培40168 木49000之02300 雪14910 手25000 冶33161 内40800 央50810亡02710 西15600 鸟25153 辽33370 土41000 期50811衣02732 酉15610 句25600 治33612 坛41131 青51011
则02820 司17621 包25797 出34307 去41732 丰51110部03628 录17991 白26100 造34361 士43003 本51190凡03900 组20111 人28000 达34380 弋43004 奉51580风04900 舟20353 了30000 将37142 都43624 春51638主04100 组20911 宝31134 峰37254 猪44264 表51731初05222 上21100 宇31740 字37410 车45700 共51800末51930 曰61000 晴65301 羊81500 授52749 朂61124照65332 分85200 未53910 国61134 贯65807 年85300花54297 最61441 另67420 铁85782 曲55650 曼61476四68006 笑88842 扶55780 冒61633 医68840 光91292英55800 曷61752 眼69331 兴91800 罪62111 所72227灵91890 中56000 兄62297 瓜72232 引92500 申56100臣62290 兵72811 张92534 曳56210 日63000 成73255快97850 电56790 目63300 阳76233 当99100 贵56801是63811 屈79233 带57043 田64006 眉79262 書57611区64007 金81194 芬58250 甲65000 怎81332
附表1
权利要求
1.一种笔形代码输入法,其特征在于利用汉字型具有四个角的特点,将汉字笔形拆分开来,并将它们与0、1、2、3、4、5、6、7、8、9这十个数字相对应,并按照数字的编码输入,它们的对应关系如下0亠,冂;1一,口内一长横, 2丨,丿, ,亅;3短一,丶, 宀,了,凵;4十, ,ナ, 5丰,扌,艹, ,, 6口,囗,匚;7,乛;8八,人,丷,;9小,忄,, 小, 使用上述单字笔形代码编码规则是单字编码是五位数,前四码编码规则以方块形四个角的笔形为编码基准顺序,左上角笔形为①码;右上角笔形为②码;左下角笔形为③码;右下角笔形为④码;有角不取中,一笔形一码,有复不取单,先外后内;第⑤码为中码,是每个字的中间笔形中取一个笔形,取码规则是先中,②下,②左,②无改①,不足五码,以“0或复笔码”补足。
2.按照权利要求1所述的笔形代码输入法,其特征在于汉字取码的限定规则为,(1)以“氵”、“彳”作偏旁的字,只采用第一笔形为笔形代码,其余不作笔形代码;(2)以“酉、鱼、疒”作偏旁的字,其第③码笔形往上移一格,“酉”的③码为“5”,鱼的③码为“6”,疒的③码为“3”;(3)“扌、于”往左钩的笔形,可作笔形代码“7”,其余往左钩不作笔形代码;(4)“门、門、鬥”字笔形码,只取①、②笔形码,其余笔形码均在门内;(5)“几”前笔形“几”为“0”,后段“几”为“9”;(6)“辶”走旁左上角的点,仍按点的笔形码为“3”,不作为“点下一横”的笔形码;有时一个字只有一个笔形,就取一个笔形码,有两个笔形就取两个笔形码,中间无笔形者,就按顺序通过;最后不足四码时,以“0”补足四码。
3.按照权利要求1所述的笔形代码输入法,其特征在于当整个字是一笔纵穿两笔或两笔以上的字,其取码方法第①码为“5”,被纵穿的最上层的笔形为第②码,最底层的笔形为第③码,次底层的笔形为第④码,②码下笔形为第⑤码;当一笔纵穿二笔或二笔以上的笔形中,“口、冂、 、凵、艹”需要时,可以再作笔形码;口为6,冂为0, 为9,凵为3,艹为5;被纵穿的笔形,其笔形码均以原笔形码不作相交的4码。
4.按照权利要求1所述的笔形代码输入法,其特征在于第⑤码的取码限定规则为,(1)遇到“戈”笔形的字,均以“戈”的左下角笔形为⑤码,左下角笔形若已被它码占用,则以它码上层笔形为⑤码;(2)字的右侧是“页、鸟”,其⑤码均以①码下的右侧笔形为⑤码;(3)遇到“ ”笔形,其⑤码均以该笔形的“口”下的中间笔形为⑤码;(4)“及、乃”的①码为“1”;“马、牙”的①码为“7”;(5)凡遇到“匕、几”笔形作②码时,其第⑤码一般都取其下角的钩“9”为⑤码;(6)笔形“ ”作为②码时,其第⑤码“ ”为“7”,“ ”为“1”。;(7)“先外后内”对⑤码同样适用;角的两端不作“7”;(8)“雨,竹”作为字头时,其第⑤码均以二字头下的笔形中取第⑤码。
5.按照权利要求1所述的笔形代码输入法,其特征在于词组取码的限定规则为(1)四个字组成的词组采用每个字的①码依次为编码基础编制,编制成四位代码输入;(2)两个字组成的词组采用每个字的①码②码③码依次为编码基础编制,编制成六位代码输入;(3)三个字组成的词组采用每个字的①码和①码的对角码依次为编码基础编制,编制成六位代码输入;(4)五个字组成的词组采用每个字的①码依次为编码基础编制,再加上最后的那个字①码的对角码,编制成六位代码输入;(5)六个字组成的词组采用每个字的①依次为编码基础编制,编制成六位代码输入;(6)七个字组成的词组采用每个字的①依次为编码基础编制,七个字以上的词组采用前四个字和后三个字的每个字的①码依次为编码基础编制,编制成七位代码输入。
全文摘要
本发明涉及一种汉字输入编码方法,具体地说是一种笔形代码输入法,利用汉字的方块型有四个角的特点,来编制笔形代码,将汉字拆分成若干不同笔形,并将它们与0~9十个数码对应,并按照数字的编码输入;单字编码是五位数,前四码编码规则以方块形四个角的笔形为编码基准顺序,左上角笔形为①码;右上角笔形为②码;左下角笔形为③码;右下角笔形为④码;有角不取中,一笔形一码,有复不取单,先外后内;第⑤码为中码,是每个字的中间笔形中取一个笔形,取码规则是先中,②下,②左,②无改①,不足五码,以“0或复笔码”补足。本发明优点为重码率较低,易学,完整,操作简单,操作时直观性强,适用广泛。
文档编号G06F3/023GK1614538SQ20031010504
公开日2005年5月11日 申请日期2003年11月7日 优先权日2003年11月7日
发明者包子辉 申请人:包子辉
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1