一种笔画动态组字的汉字输入方法

文档序号:8512326阅读:626来源:国知局
一种笔画动态组字的汉字输入方法
【技术领域】
[0001] 本发明涉及一种信息处理用汉字输入方法,尤其涉及一种笔画动态组字的汉字输 入方法。
【背景技术】
[0002] (一)汉字输入技术发展简述
[0003] 自电子计算机技术问世以来,汉字输入技术经历了多次革新。
[0004] 【1】汉字编码输入方法
[0005] 所谓汉字编码,就是为汉字设计的一种便于输入计算机的代码,一般使用编码规 则来描述,并具体反映为键盘布局和码表(汉字和汉字编码的对应表)。汉字编码输入方 法,就是使用该键盘布局对码表进行检字并输入汉字的方法。
[0006] 汉字编码分为形码、音码、形音码、音形码等。形码的代表有:
[0007] 1)仓颉码:由朱邦复先生于1976年发明,后成为繁体字区域的主流形码;
[0008] 2)王码(五笔字型):由王永民先生于1983年发明,后成为简体字主流形码,传播 极为广泛;
[0009] 3)郑码:由郑易里先生于1989年发明,也得到广泛应用;
[0010] 4)王林快码:由王林先生于1997年发明,也兼做音形码或形音码,现仍有爱好者 使用。
[0011] 5)笔画输入法:由美国特捷通讯(Tegic Communications)于1999年提出,最早 为用于手机的T9输入法,使用5种笔画,传播极为广泛(以下简称普通五笔画编码)。另有 中文规范输入法,由李铁先生于2006年发明,使用26种笔画;六码笔画输入法,由香港布礼 文先生于2007年发明,使用5种笔画,编码固定为首3末3共6码。
[0012] 注:按照1997年国家语委发布的《信息处理用GB13000. 1字符集汉字部件规范》 (以下简称"部件规范"),笔画定义为:构成楷书汉字字形的最小连笔单位。另外定义了笔 形的概念:笔形是笔画的具体形状,楷书汉字的笔形依据笔势和走向可以分为数十种,但其 最基本的类别为一、丨、j、、、ι等五类。本说明书所述笔画,兼有"部件规范"所定义的笔 画和笔形的概念。
[0013] 音码与形码几乎同一时期出现,代表有:
[0014] 1)拼音码:又包括全拼、简拼、双拼等方案,主要用于简体字区域;
[0015] 2)注音码:主要用于繁体字区域。
[0016] 在上述汉字编码出现的同一时期,还有大量的其他各式各样的汉字编码或软件层 出不穷,形成一种"万码奔腾"的局面。然而随着计算机和手机等设备的普及,五笔、拼音、 笔画这几种编码方法逐渐成为主流,其中尤以拼音为广泛。
[0017] 【2】汉卡和动态组字、字库技术
[0018] 在计算机技术问世之初,由于计算机存储空间、运算能力的限制,汉字输入技术向 两个不同的方向发展:
[0019] 1)汉卡技术:汉卡是一种将汉字输入方法、汉字字库及其驱动程序固化为一个只 读存储器的计算机扩展卡。最早的汉卡为联想公司于1986年开发的联想汉卡。1995年以 后,随着计算机能力的提升,UCDOS和Windows操作系统等技术使汉卡逐渐退出历史舞台。
[0020] 2)动态组字技术:是一种汉字在计算机等领域的编码理论及技术,不依赖于占用 很大空间的字库,只需要少量的部件,采用程序控制以递归的方式做即时的"二维组字",显 示到显示器上。"动态组字"技术的实例包括:朱邦复先生的"仓颉系统"、Unicode IDS语言、 美国文林公司的⑶L字形描述语言、张时钊先生的"动态组字"理论等。随着字库的扩展, 暂时、部分地解决了汉字字形不足的困难,但是动态组字技术仍有其存在的价值和意义。动 态组字技术的特点是:即时地形成汉字的二维图形,因此是超越一般汉字编码输入方法的 技术,而后者本质上是汉字的检索。
[0021] 字库是一个由一定数量、字形互异的汉字组成的集合,信息处理用字库经历了多 次扩充,一般地主要有以下几个层次:
[0022] l)GB2312-80信息交换用汉字编码字符集?基本集:收录6763个汉字(其中一级 汉字3755个,二级汉字3008个)(以下简称6763汉字集)。
[0023] 2) GB 13000. 1-93信息技术通用多八位编码字符集(UCS)第一部分:体系结构与 基本多文种平面:收录20902个汉字(含GB2312)(以下简称20902汉字集)。
[0024] 3) GB 18030-2005信息技术?中文编码字符集:收录70244个汉字(含GB 13000. 1、扩展A6582字、扩展B42711字、扩展C)(以下简称70244汉字集)。
[0025] 【3】其他新技术
[0026] 近年以来,随着计算机技术的发展,出现了一些先进的汉字输入技术,比如:
[0027] 1)手写输入:是指由计算机将在手写设备上书写时产生的有序轨迹信息转化为 汉字内码的技术;
[0028] 2)语音输入:是指由计算机把用户的讲话识别成汉字的输入技术(又称声控输 入
[0029] 这些新技术一般仅在特定的场合下才具有优势,因而不及汉字编码输入方法应用 广泛。还有一些新技术,例如云存储技术、搜索技术、整句输入技术等,增强了汉字编码输入 方法的易用性。
[0030] 【4】小结与展望
[0031] 通览汉字输入技术的发展,汉字编码输入方法具有其他技术不可比拟的优点,从 一开始就占据了主导地位。但是即便是成为主流的汉字编码也都还存在一些不尽人意之 处,如拼音有重码率高、会导致提笔忘字、地域差别明显(如粵语、吴语)等缺点;而五笔、笔 画等形码要么效率高难记忆,要么好记忆效率低。
[0032] 由于汉字是承载了数千年文明历史的表意文字,为了延续这种传统,避免汉字被 拼音文字取代,人们开发以形码为基础的更为易学高效的编码方法的努力迄今仍未停止。
[0033] (二)汉字编码输入方法的基本原理
[0034] 如图1所示,汉字编码输入方法的通用原理归纳如下:
[0035] 1)汉字编码输入方法的构成要素:
[0036] a)编码规则:定义码元和取码方式,并具体反映为键盘布局和汉字编码表;
[0037] b)人机界面:包括键盘、候选字区域、文本区域(一般地,键盘和文本区域是独立 存在的,不属于汉字编码输入方法,但却是必要的外部环境);
[0038] c)检字算法:其输入为按键序列,对汉字编码表进行查询,输出为候选字列表。
[0039] 2)汉字编码输入方法的一般流程如下:
[0040] a)用户对键盘进行按键操作,生成按键序列;
[0041] b)检字算法在汉字编码表中查询按键序列,得出候选字列表,并显示在候选字区 域;
[0042] c)用户再次对候选字列表进行检索,确定期望汉字并使其显示在文本区域;
[0043] d)用户得到文本区域的视觉反馈,完成期望汉字的输入。
[0044] 不同的汉字编码输入方法,一般只在编码规则、键盘布局、汉字编码表上相区别, 其他则大同小异。在具体实现为软件时,有的汉字编码输入方法会在文本区域即时显示拼 写文本(包括编码序列或匹配字),即图1中虚线部分。
[0045] (三)现有形码存在的不足之处
[0046] 前已述及,由于以拼音为代表的音码在传承汉字书写传统方面天然的缺陷,易学 高效的形码是汉字编码的主要目标。所谓高效,一是指单位时间内输入汉字数量多,二是指 可以实现盲打(一般多指一直不看键盘,而通过从文本区域获得的视觉反馈来指导按键操 作),然而对于形码来说,易学和高效是一对难以调和的矛盾。
[0047] 现有的形码存在以下不足之处:
[0048] 【1】码元多,难记忆
[0049] 形
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1