一种方块苗文的音形结合快速输入编码及其优化方法

文档序号:9432012阅读:614来源:国知局
一种方块苗文的音形结合快速输入编码及其优化方法
【技术领域】
[0001] 本发明设及一种方块苗文的音形结合快速输入编码及其优化方法,属于我国少数 民族文字键盘输入编码技术领域。
【背景技术】
[0002] W汉字为代表的方块文字键盘输入主要采用基于本身字音属性或字形属性的音 码或形码输入编码方法。汉字输入编码方法研究起步于上世纪80年代,先后经历了单字、 词语及整句输入编码方法研究几个阶段,目前已进入面向Windows、Linux、An化oid等操作 系统,W重码字和词的智能识别、候选字的智能选定上屏、缩短平均码长且促进编码简单化 和规范化为目标的字、词、句输入的智能处理时代,各类智能输入法软件纷纷出现。与汉字 相比,我国少数民族方块文字的输入编码方法研究起步较晚。2006年至今期间,与此相关研 究报道主要有:董芳等提出的基本笔画与部件相结合的水书文字形码输入编码方法;杨撼 岳等研制的基于7种基本笔画细分所得的21类笔形的水书文字=角形码输入编码方法的 输入法软件;郭海等研究的基于音标转写的纳西象形文字音码输入编码方法;柳长青等提 出的由文字本身4个角的笔形数码决定的西夏文四角号码形码输入编码方法;宁威林等设 计的基于有无曲线、有无封闭、有无点等字形特点分类的彝文输入形码编码方法;吴馳等提 出的结构类型和书写笔顺相结合的彝文形码输入编码方法;黄勇等设计和开发的基于规范 拼音音码及本身字形五笔形码的古壮文输入法编辑器。上述少数民族方块文字的输入编码 方法主要基于纯形码,编码设计方法不够简便,输入法的易学易用性及快捷高效性有待提 局。
[0003] 方块苗文是一种仿汉字结构的方块文字,其信息处理技术研究刚刚起步。方块苗 文主要包括=套:老寨苗文、古丈苗文和板塘苗文。它们造字原理完全相同,都创造性地运 用了形声、会意、假借、象形等手段,直接取一些含义明确、结构或笔画较简单且日常使用频 率较高的汉字或偏旁,W及极个别无音无义的纯粹符号(如"~"、"X")作为义符、声符或形 符构件,采用一字一音节的方法来标记一个语素或词。方块苗文基本上都是合体字,其结构 类型大致分为左右结构、上下结构、侧围结构和内外结构4种。图1给出4种不同结构的方 块苗文字例及其汉义示意图。
[0004] 理论上,仿汉字结构的方块苗文可采用类似于汉字的音码或形码输入方法实现输 入。然而,会拼读方块苗文的人极少,使得基于本身字音属性的方块苗文音码输入编码方法 不可行。通常,方块苗文均可视为二或=构件型合体字,其构件笔形拆分繁琐,如果采用纯 形码输入编码方法,不利于用户记忆。 阳〇化]考虑到方块苗文的构件除个别是纯粹符号外,其余都是简单汉字(或偏旁)运一 事实,可W尝试利用构件的字音属性取代文字本身字音属性的思路来设计其输入编码方 法。前期,为了解决方块苗文的输入问题,莫礼平等根据此思路先后研究并实现了基于构件 汉语全拼的音码输入和基于构件拼音同文字结构类型相结合的音形码输入编码方法。前一 方法中,一个方块苗文的输入编码序列由其所包含的2至3个构件的全部汉语拼音字母构 成,码元与键盘26个字符键位一一对应。后一方法中,将方块苗文输入编码统一为"3个音 码+1个形码"的4码形式。其中,二构件型方块苗文的音码由第一个构件拼音首字母和第 二个构件拼音的首字母和次字母决定,=构件型方块苗文的音码由3个构件拼音的首字母 决定;形码由其结构类型决定;音码码元与键盘相应字符键位一一对应,左右结构、上下结 构形码分别映射至键盘数字键位"4"和"5";考虑到方块苗文中,内外结构的极少,侧围结 构的也不多,运两种结构形码均映射至数字键位"6"。
[0006] 上述两种方法的实现,证明了利用构件的字音属性代替文字本身字音属性来设计 方块苗文输入编码方法运一思路的正确性和可行性。然而,前述第一种方法存在码长过大, 重码情况严重等缺陷,基本上没考虑效率;第二种方法虽然有效地降低了码长和重码率,但 没有考虑用户思维习惯和击键习惯,效率依然不甚理想。

【发明内容】

[0007] 本发明的目的在于提供一种方块苗文的音形结合快速输入编码及其优化方法,W 便能提供一种符合用户思维习惯和击键习惯的、码长短、重码率低、能够有效保障用户输入 速度和正确率的方块苗文音形结合快速输入编码方法,有效解决从方块苗文字库中快速调 出所需字形的问题。
[0008] 为了实现上述目的,本发明的技术方案如下。
[0009] 一种方块苗文的音形结合快速输入编码方法,其基本思想是:由方块苗文的构件 汉语拼音的声母(或韵母)决定音码,由本身的笔顺笔画和结构类型决定形码。由于构件 汉语拼音的声母(或韵母)数目远多于基本笔画种数,基本笔画种数又多于结构类型种数, 为了增加区分度,将方块苗文输入编码统一设计为"首构件音码+末构件音码+文字笔顺形 码+文字结构类型形码"的4码形式。通常,文字的首笔和末笔是最易提取的笔画,考虑到 方块苗文中,首构件相同者远多于末构件相同者,末笔笔画比首笔笔画的区分性更好,故由 文字末笔笔画决定笔顺形码,该方法中方块苗文输入编码的具体形式为"首构件音码+末 构件音码+文字末笔笔画形码+文字结构类型形码"。
[0010] 上述方法中,音码设计的方法为,按照从上至下、从左到右、从外到内的顺序对方 块苗文进行构件拆分后,选取首构件和末构件的汉语拼音首字母作为音码码元;取出的第 一个构件为首构件,最后一个构件为末构件;成字构件选取其拼音首字母作为音码码元,若 无声母,则取韵母首字母;纯粹符号对应的不成字构件,统一选用一个非拼音首字母的字母 作为音码码元。
[0011] 上述方法中,形码设计的方法为,采用最简易直观的方法:选取横、竖、撇、掠、点、 折6种基本笔画名称的汉语拼音首字母作为笔顺形码码元;选取左右、上下、侧围、内外4种 结构类型名称的汉语拼音首字母作为结构类型形码码元。
[0012] 上述方法中,W通用键盘为标准,将码元与键盘键位之间建立如下映射关系:(1) 成字构件音码码元直接映射至其拼音首字母对应的字符键位,不成字构件音码码元统一映 射至非拼音首字母i对应的I键位;
[0013] (2)笔顺笔画及结构类型形码码元直接映射至对应其名称汉语拼音首字母的字 符键位,即:横化)一H、竖(S) -S、撇(P)-P、掠(n)-N、点(d)-D、折(Z) -Z,左右结构 (z)-Z、上下结构(s)-S、侧围结构(c)-C、内外结构(n)-N。
[0014] 基于上述方块苗文的音形结合快速输入编码的优化方法,所述方法W键位码元 负荷分析和相关击键时间当量分析为基础进行了优化:采用"避重就轻"的原则均衡码元负 荷,尽可能将负荷大的键位上的码元分散到负荷较小的键位上去;同时,根据键位有效使用 原则,调整形码映射方式,W提高连续击键速度;上述方法中,Z、S、C运=个映射键位因码 元负荷大而被过度使用,而码元负荷小、比Z、S、C键位更适合高频使用的U、V、I=个键位 却没得到充分利用;根据优化的基本思想,将形码码元的Z用U替代,S用V替代,C用i替 代;运样,左右结构形码和折笔形码被映射至键位U,上下结构形码和
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1