一种基于字根拆分的常用汉字编码体系的制作方法

文档序号:6502486阅读:188来源:国知局
一种基于字根拆分的常用汉字编码体系的制作方法
【专利摘要】本发明属于汉字编码【技术领域】,具体涉及一种基于字根拆分的常用汉字编码体系。本发明选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;每个汉字用至少两个至多三个字根进行表示。在93个基本字根中有5个基本笔画——“一、丨、丿、丶、乙”作为具有相同字根表示的汉字间的识别码,它们一般位于汉字的字根组合的最后一位。本发明的编码的结果为使用率较高的汉字用2个码元进行表示,使用率次之的汉字用3三个码元进行表示。本发明极大地减少了基础字根的使用数量,提高了单个字根的使用率。同时5个基本笔画作为汉字之间的识别码被放在某些汉字的最后一个码元位置上,能够高效地从一段连续码字中判断出断点。
【专利说明】一种基于字根拆分的常用汉字编码体系
【技术领域】
[0001]本发明属于汉字编码【技术领域】,具体涉及一种基于字根拆分的常用汉字编码体系O
【背景技术】
[0002]汉字编码(Chinese character encoding )是为汉字设计的一种便于输入计算机的代码。目前较通用的方法是通过汉字编码方法使汉字进入计算机。汉字编码因其数量庞大,字形复杂,存在大量一音多字和一字多音现象而造成了编码的困难。
[0003]据统计,现有400多种编码方案。其中,五笔字型输入法由王永民于1983年发明。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。将汉字进行分解,分解出一种基本的字型单位叫做“字根”,五笔字型即是基于字根对汉字进行分解输入。将100多个字根大致平均地分布在键盘的25个字母键上,并依照笔画顺序键入字根所对应的字母键以实现汉字输入。与拼音输入法相比较,五笔字型输入法具有低重码率的特点,熟练后可快速输入汉字。
[0004]但现有的字根分解方法存在冗余。为了最大限度的消除冗余,使得每个字根的利用率最大化,本发明出一种新的字根拆分方法。将具有相似字形的字根进行合并,将在常用汉字中出现次数不多的字根用其它字根替代来表示,以此将用于表示其它汉字的字根压缩为93个,且所选用的字根本身都尽量是一个完整的汉字。

【发明内容】

[0005]本发明的目的在于提供一种操作方便,重码率较低,输入速度快的基于字根拆分的常用汉字编码体系。
[0006]本发明提供的基于字根拆分的常用汉字编码体系,选取93个最常用的字根作为基本字根,对其它常用汉字进行表示。每个汉字用至少两个至多三个字根进行表示。在93个基本字根中有五个基本笔画一“一、丨、)、、、乙”作为具有相同字根表示的汉字间的识别码,它们一般位于汉字的字根组合的最后一位。
[0007]本发明在拆分字根的基础上对3000多个常用汉字进行了自定义分类,进而依据字根进行编码。基本字根表如表I所示。
[0008]表I基本字根表
【权利要求】
1.一种基于字根拆分的常用汉字编码体系,其特征在于:选取93个最常用的字根作为基本字根,对其它常用汉字进行表示;所述93个基本字根如下表所示:
【文档编号】G06F3/023GK103440044SQ201310164733
【公开日】2013年12月11日 申请日期:2013年5月7日 优先权日:2013年5月7日
【发明者】黄书锦, 沈一帆 申请人:复旦大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1