汉字检索与输入笔画编码的制作方法

文档序号:6330390阅读:662来源:国知局

专利名称::汉字检索与输入笔画编码的制作方法
技术领域
:汉字分类处理与汉字信息处理。现有同类技术及缺点本发明“汉字检索与输入笔画编码”可以分为“汉字检索笔画编码”“与汉字输入笔画编码”两类。用于汉字检索的现有同类技术“四角号码”,其编码技术采用单笔与复笔混合编码,既使用单笔画(横1垂2,3点捺),义使用复笔画(叉4插5方框6,7角8八9是小)的复合取笔方法,相对于纯笔画的编码,取笔较难;复笔画的设定常常截断汉字笔画,不符合国家语委发布的《汉字部件规范》。用于汉字输入的现有同类技术“五笔画”码,只取1-5共五个号码,等于五进位,即使五位数编码,其取码基数也只有3125个(55=3125)。因此,其重码率不可避免地偏高。五位数编码较之四位数编码输入速度明显较慢。设计本编码的目的应用于汉字检索与汉字输入。汉字检索与输入笔画编码方法(一)、笔画和号码30字编码要诀笔画横竖撇捺折,号码12345,叉笔98760,直点6,直撇7,须注意。(二)、取角顺序每字按①左上角、②右上角、③左下角、④右下角的次序取四个角笔画的号码。例(三)、取角方法1、一个笔画只用一次,前角已经用过,后角作为0。例2、下角笔画偏在一角的,按实际位置取号,缺角作0。例3、外围是“口”、“门”的字,两下角改取里面的笔画。例但上下左右有其他笔画的字不在此列。例(四)、取笔方法1、笔顺原则(一般原则)。一角有多笔可取的,依笔顺一、二、三角取先笔,第四角取后笔。例2、长胜短原则。两笔交叉有通长笔的,取长笔。例3、多胜少原则。多笔交叉,多笔是相同笔画的,取多笔。例4、小笔优先原则。点、撇、提等小笔画优先取号,一笔占两角的,后角补0。例(五)、附号(用于检索码)同码字较多时,再取一个未用过的笔画作附号。取号的先后次序为1、与第四角笔画有叉笔的,取叉笔。有多笔可取的,取末笔。2、与第四角笔画有连笔的,取连笔。有多笔可取的,取末笔。3、与第四角笔画没有叉笔和连笔可取的,取上方靠近的笔画。有多笔可取的,取末笔。无笔画可取的,则作0。例(六)、取角注意的问题1、当中起笔的撇,下角有其他笔画的,取其他笔画作下角。例但左边起笔的撇,取撇笔作角。例本编码的优点本编码是单笔画(横竖撇捺折)编码,取笔的笔顺原则遵从国家语委公布的汉字笔顺规范,有利于促进汉字应用和汉字信息处理的规范化。由五个单笔画衍变成有叉笔的十个笔画,仍是单笔画特征,相对于复笔画编码,取码方法简单容易。十个单笔画取0-9共十个号码,四位数编码,取码基数为10000个(104=10000),相对于只取五个单笔画的编码,重码率大幅度降低;较之五位数编码,输入速度明显较快。从编码的实际效果看,本编码的高重码率要低于“四角号码”。重码30字以上情况的对比情况如下表</tables>实现本编码的最好方式1、检索。①作为与通常使用的拼音、部首、笔画等检索方法之一种,应用于各类辞书、工具书中(当辞书、工具书正文以拼音、部首或笔画排序时)。②将辞书、工具书的正文以本编码的次序排序,可实现见字识码、一步到位的最佳效果。③辞海、辞源、百科全书以及其他大型古籍辞书的检索方法单一,较难查找,可使用本编码制作单行检字索引,作为辅助检索工具。2、输入。①用于计算机的汉字输入。方法有二。方法一用标准英文键盘输入,可设计为,G、H、T、Y、N代表横、竖、撇、捺、折,编号为1、2、3、4、5;F、J、R、U、B代表叉横、叉竖、叉撇(直撇)、叉捺(直点)、叉折,编号为9、8、7、6、0。将周围的E、I、D、K、V、M设定为功能键,当屏幕显示重码字时,按住功能键,各输入键的号码为选择号码。见下图7346ERTYUI9128DFGHJK05VBNM方法二用大键盘的数字键盘输入。只用右手即可完成号码输入。在大键盘上设一功能键,由左手控制,切换输入和重码选择。这两种方法都可以做到手不离键,连续操作,可实现盲打或半盲打,有利于提高输入速度。②用于移动电话、电子记事本等电子、通讯器材的汉字输入,输入方法原则上同上述方法二。权利要求本发明“汉字检索与输入笔画编码”可以分成“汉字检索笔画编码”与“汉字输入笔画编码”两类。“汉字检索笔画编码”与“四角号码”都是四位数的数字编码;“汉字输入笔画编码”与“五笔画”码都是纯笔画的编码,其特征是汉字中的横、竖、撇、捺、折五个单笔画是取码的根据,将其一分为二,翻成包括叉横、叉竖、叉撇(直撇)、叉捺(直点)、叉折五个笔画共计十个笔画时,仍具有横、竖、撇、捺、折的单笔画特征;本编码取0-9共十个号码,取汉字四个角的笔画四位数编码,取码基数为10000个(104=10000)。全文摘要“汉字检索与输入笔画编码”属汉字分类处理与汉字信息处理
技术领域
。其特征:只用“横竖撇捺折”五个单笔画编码,衍变为有叉笔的“横竖撇捺折”等共十个笔画,仍是单笔画特征。用途:汉字检索笔画编码应用于汉语辞书等书籍的汉字检索;汉字输入笔画编码应用于计算机、移动电话等电讯产品的汉字输入。文档编号G06F3/023GK1263296SQ00102159公开日2000年8月16日申请日期2000年3月2日优先权日2000年3月2日发明者李平申请人:李平
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1