东巴文图元输入法及键盘的制作方法

文档序号：6330573阅读：1633来源：国知局

专利名称：东巴文图元输入法及键盘的制作方法
技术领域：
本发明属于少数民族文字信息处理领域。
背景技术：
东巴文字属于藏缅语系彝语支纳西语，拥有2120个象形文字，是世界古文字中唯一流传下来，且至今还活着的一种文字，对于研究世界文字发展历史有着重要的参考价值。国内外对于东巴文的研究始于上个世纪初，现在美国、日本、欧洲很多高校及研究机构都对东巴文进行了深入的研究。传统的东巴文信息处理技术采用手工绘制、扫描、制版等手工方式，由于东巴文字型极其复杂，
例如东巴文的"《"、"f、 "'—"、 "E3"、等文字存在多种书写方式，掌
握2120个常用字的书写，至少需要IO年的时间。这种手工的处理效率低下，不适合现代文字信息处理的需要，需要一种能够准确的输出东巴文的方法。我们开发了东巴文拼音输入法，按音输出东巴文需要使用者掌握东巴文的读音，这对于不懂读音的人来说是无法进行计算机录入的。针对这种情况，本发明设计了东巴文图元输入法及键盘。

发明内容
东巴文常见的结构有独体结构、上下结构、左右结构、包围结构这四种
主要结构。其中独体结构如"夭"、"悉"、"会"、"f ，、 "^";上下结构如"^"、
"Y"、 "1"、 T，、"吞"、"忒"等；左右结构如"，餘"、"/纷"、"f，、等；包围结构" "、 " "、"錢"、"W"、 " ，，等。
首先我们对东巴文结构进行编码，独体结构的编为d，上下结构的编写为 s,左右结构的编写为z，包围结构的编写为b，这样就对东巴文进行了一级粗编码，接下来要对东巴文四种结构进行二级细编码。东巴文是一种图形文字，与汉字不同在于它没有偏旁部首的概念，本发明提出东巴文图元表示。
常见用来描述图形的基本元素也就是图元，有点、直线、圆、圆曲线、左斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形这几种基本图元。对这几种图元进行编码，详细编码如表l东巴文图元编码表所示。
东巴文由于是一种图形文字很多文字的结构中含有数字，这个汉字以及其
他少数民族文字有着截然不同的区别。如骰子"G3"中点的数量、燃烧
竖曲线的数量、宝物"⑥"圆的数量等，这些都需要进行数量的编码。对图元
的重复出现数量进行了相应的编码，y(—)、 e (二)、 s (三)、f (四)、w (五)、 1 (六)、q (七)、b (八)、j (九)、d (多)。
表1东巴文二级编码表
图元点直线圆圆曲线左斜线
编码力《
图元右斜线竖线竖曲线椭圆曲线矩形
编码力7
对于东巴文我们采取从上到下、从左到右、从外到内的编码顺序，依照本发明中论述的编码规则进行编码制作码表。部分东巴文图形编码如下-
々dfgcs * sfadcf々dfgcg.
下面将通过实例对发明作进一步详细说明，但下述的实例仅仅是本发明其中的例子而已，并不代表本发明所限定的权利保护范围。本发明的权利保护范围以权利要求书为准。
具体实施方式
实例i独体结构编码实例
使用图元输入法对东巴文进行取码，首先对独体结构取码进行解释说明。
i)例如"d^"天字属于独体结构，确定首编码为d，然后分析其图元，
其图元为圆曲线，则变为f，最后东巴文"々"被编码为df。
2) 例如东巴文"^ "字，首先分析结构，这个字是独体结构，确定首
编码为d，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆曲线(f)、左斜线(g)、圆(c)三种，且圆的数量为三个(s)，那么按照图元部分编码为fgcs。
3) 例如东巴文"^""字，首先分析结构，这个字是独体结构，确定首
编码为d，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆曲线(f)、左斜线(g)、圆(c)、左斜线((g)，那么该文字最终编码为dfgcg。
4) 例如东巴文"<^>"字，首先分析结构，这个字是独体结构，确定首编码为d，然后分析其图元构成，按照从上到下、从左到右、从外到内
的分析顺序分别得到其图元为圆曲线(f)、点(a)，那么该文字最终编码为dfa。
5)例如东巴文"#"字，首先分析结构，这个字是独体结构，确定首
编码为d，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为直线(b)两条(e)、竖线(i)两条(e)，那么该文字最终编码为dbeie。实例2上下结构编码实例
1) 例如东巴文"^ "字，首先分析结构，这个字是上下结构，确定首
编码为s，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆曲线(f)、点(a)多个(d)、圆(c)四个(f)，那么该文字最终编码为sfadcf。
2) 例如东巴文"~~"字，首先分析结构，这个字是上下结构，确定首
编码为s，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为直线(b)、圆(c)、直线(b)、两个(e)，那么该文字最终编码为sbcbe。实例3左右结构编码实例
1)例如东巴文"/々；"字，首先分析结构，这个字是左右结构，确定首编码为z，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为右斜线(h)四条(f)，那么该文字最终编码
为zhf。
2)例如东巴文"T^"字，首先分析结构，这个字是左右结构，确定首
编码为Z;然后分析其图元构成，先对左边结构"夭"按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆(C)、直线(b)、 '右斜线(h)、左斜线(g);对右边边结构按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为右斜线(h)三条(S)、矩形(1)、
点(a)五个(w);那么该文字最终编码为zcbhghslaw。实例4包围结构编码实例
1) 例如东巴文" "字，首先分析结构，这个字是包围结构，确定首编
码为b，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆(c)六条(1)，那么该文字最终编码为bcl。
2) 例如东巴文字，首先分析结构，这个字是包围结构，确定首
编码为b，然后分析其图元构成，按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为圆(c)、点(a)七条(q)，那么该文字最终编码为bcaq。
权利要求
1、一种东巴文的图元输入方法及键盘，其特征在于把东巴文先按结构分为四种，分别对其进行编码，然后对每种结构进行二级细编码；二级细编码中将每种结构拆分为点、直线、圆、圆曲线、左斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形分别进行编码；粗编码和二级编码顺序组合构成东巴文的图元输入方法及键盘。
2、按照权利要求1中要求1所述的东巴文图元输入方法及键盘，其特征在于在二级细编码过程中，如果图元出现连续多次重复，需要对图元的出现次数进行编码。
全文摘要
本发明涉及一种东巴文字的图元输入方法及键盘，属计算机文字信息处理领域。该输入方法先对东巴文字的独体结构、上下结构、左右结构、包围结构这四种主要结构进行粗编码，将其分别编码d、s、z、b。然后将东巴文字分解为点、直线、圆、圆曲线、左斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形这几种图元，进行二次编码，同时要对图元出现的次数进行编码。将每个字的粗编码和二级编码顺序组合就是东巴文图元输入法。本发明经测试，键码率远远低于东巴文拼音输入法。本发明具有简单、易学的特点，即使不会读写东巴文字的人员也能在计算机上输入东巴文字，有利于东巴文字的推广和传播。
文档编号G06F3/023GK101477408SQ20091000329
公开日2009年7月8日申请日期2009年1月26日优先权日2009年1月26日
发明者赵晶莹, 海郭申请人:大连民族学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郭海;赵晶莹
技术所有人：大连民族学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。