东巴文图元输入法及键盘的制作方法

文档序号:6330573阅读:1596来源:国知局
专利名称:东巴文图元输入法及键盘的制作方法
技术领域
本发明属于少数民族文字信息处理领域。
背景技术
东巴文字属于藏缅语系彝语支纳西语,拥有2120个象形文字,是世界古文 字中唯一流传下来,且至今还活着的一种文字,对于研究世界文字发展历史有 着重要的参考价值。国内外对于东巴文的研究始于上个世纪初,现在美国、日 本、欧洲很多高校及研究机构都对东巴文进行了深入的研究。传统的东巴文信 息处理技术采用手工绘制、扫描、制版等手工方式,由于东巴文字型极其复杂,
例如东巴文的"《"、"f、 "'—"、 "E3"、 等文字存在多种书写方式,掌
握2120个常用字的书写,至少需要IO年的时间。这种手工的处理效率低下, 不适合现代文字信息处理的需要,需要一种能够准确的输出东巴文的方法。我 们开发了东巴文拼音输入法,按音输出东巴文需要使用者掌握东巴文的读音, 这对于不懂读音的人来说是无法进行计算机录入的。针对这种情况,本发明设 计了东巴文图元输入法及键盘。

发明内容
东巴文常见的结构有独体结构、上下结构、左右结构、包围结构这四种
主要结构。其中独体结构如"夭"、"悉"、"会"、"f ,、 "^";上下结构如"^"、
"Y"、 "1"、 T,、"吞"、"忒"等;左右结构如",餘"、"/纷"、"f,、 等;包围结构" "、 " "、"錢"、"W"、 " ,,等。
首先我们对东巴文结构进行编码,独体结构的编为d,上下结构的编写为 s,左右结构的编写为z,包围结构的编写为b,这样就对东巴文进行了一级粗编 码,接下来要对东巴文四种结构进行二级细编码。东巴文是一种图形文字,与汉字不同在于它没有偏旁部首的概念,本发明 提出东巴文图元表示。
常见用来描述图形的基本元素也就是图元,有点、直线、圆、圆曲线、左 斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形这几种基本图元。对这几种图 元进行编码,详细编码如表l东巴文图元编码表所示。
东巴文由于是一种图形文字很多文字的结构中含有数字,这个汉字以及其
他少数民族文字有着截然不同的区别。如骰子"G3"中点的数量、燃烧
竖曲线的数量、宝物"⑥"圆的数量等,这些都需要进行数量的编码。对图元
的重复出现数量进行了相应的编码,y(—)、 e (二)、 s (三)、f (四)、w (五)、 1 (六)、q (七)、b (八)、j (九)、d (多)。
表1东巴文二级编码表
图元点直线圆圆曲线左斜线
编码力《
图元右斜线竖线竖曲线椭圆曲线矩形
编码力7
对于东巴文我们采取从上到下、从左到右、从外到内的编码顺序,依照本发 明中论述的编码规则进行编码制作码表。部分东巴文图形编码如下-
々dfgcs * sfadcf々dfgcg.
下面将通过实例对发明作进一步详细说明,但下述的实例仅仅是本发明其 中的例子而已,并不代表本发明所限定的权利保护范围。本发明的权利保护范 围以权利要求书为准。
具体实施方式
实例i独体结构编码实例
使用图元输入法对东巴文进行取码,首先对独体结构取码进行解释说明。
i)例如"d^"天字属于独体结构,确定首编码为d,然后分析其图元,
其图元为圆曲线,则变为f,最后东巴文"々"被编码为df。
2) 例如东巴文"^ "字,首先分析结构,这个字是独体结构,确定首
编码为d,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为圆曲线(f)、左斜线(g)、圆(c)三种,且圆的 数量为三个(s),那么按照图元部分编码为fgcs。
3) 例如东巴文"^""字,首先分析结构,这个字是独体结构,确定首
编码为d,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为圆曲线(f)、左斜线(g)、圆(c)、左斜线((g), 那么该文字最终编码为dfgcg。
4) 例如东巴文"<^>"字,首先分析结构,这个字是独体结构,确定首编码为d,然后分析其图元构成,按照从上到下、从左到右、从外到内
的分析顺序分别得到其图元为圆曲线(f)、点(a),那么该文字最终编码 为dfa。
5)例如东巴文"#"字,首先分析结构,这个字是独体结构,确定首
编码为d,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为直线(b)两条(e)、竖线(i)两条(e), 那么该文字最终编码为dbeie。 实例2上下结构编码实例
1) 例如东巴文"^ "字,首先分析结构,这个字是上下结构,确定首
编码为s,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为圆曲线(f)、点(a)多个(d)、圆(c)四 个(f),那么该文字最终编码为sfadcf。
2) 例如东巴文"~~"字,首先分析结构,这个字是上下结构,确定首
编码为s,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为直线(b)、圆(c)、直线(b)、两个(e),那 么该文字最终编码为sbcbe。 实例3左右结构编码实例
1)例如东巴文"/々 ;"字,首先分析结构,这个字是左右结构,确定首编 码为z,然后分析其图元构成,按照从上到下、从左到右、从外到内的分析顺序分别得到其图元为右斜线(h)四条(f),那么该文字最终编码
为zhf。
2)例如东巴文"T^"字,首先分析结构,这个字是左右结构,确定首
编码为Z;然后分析其图元构成,先对左边结构"夭"按照从上到下、 从左到右、从外到内的分析顺序分别得到其图元为圆(C)、直线(b)、 '右斜线(h)、左斜线(g);对右边边结构按照从上到下、从左到右、从 外到内的分析顺序分别得到其图元为右斜线(h)三条(S)、矩形(1)、
点(a)五个(w);那么该文字最终编码为zcbhghslaw。 实例4包围结构编码实例
1) 例如东巴文" "字,首先分析结构,这个字是包围结构,确定首编
码为b,然后分析其图元构成,按照从上到下、从左到右、从外到内的 分析顺序分别得到其图元为圆(c)六条(1),那么该文字最终编码为bcl。
2) 例如东巴文字,首先分析结构,这个字是包围结构,确定首
编码为b,然后分析其图元构成,按照从上到下、从左到右、从外到内 的分析顺序分别得到其图元为圆(c)、点(a)七条(q),那么该文字最 终编码为bcaq。
权利要求
1、一种东巴文的图元输入方法及键盘,其特征在于把东巴文先按结构分为四种,分别对其进行编码,然后对每种结构进行二级细编码;二级细编码中将每种结构拆分为点、直线、圆、圆曲线、左斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形分别进行编码;粗编码和二级编码顺序组合构成东巴文的图元输入方法及键盘。
2、 按照权利要求1中要求1所述的东巴文图元输入方法及键盘,其特征在 于在二级细编码过程中,如果图元出现连续多次重复,需要对图元的出现次 数进行编码。
全文摘要
本发明涉及一种东巴文字的图元输入方法及键盘,属计算机文字信息处理领域。该输入方法先对东巴文字的独体结构、上下结构、左右结构、包围结构这四种主要结构进行粗编码,将其分别编码d、s、z、b。然后将东巴文字分解为点、直线、圆、圆曲线、左斜线、右斜线、竖线、竖曲线、椭圆曲线、矩形这几种图元,进行二次编码,同时要对图元出现的次数进行编码。将每个字的粗编码和二级编码顺序组合就是东巴文图元输入法。本发明经测试,键码率远远低于东巴文拼音输入法。本发明具有简单、易学的特点,即使不会读写东巴文字的人员也能在计算机上输入东巴文字,有利于东巴文字的推广和传播。
文档编号G06F3/023GK101477408SQ20091000329
公开日2009年7月8日 申请日期2009年1月26日 优先权日2009年1月26日
发明者赵晶莹, 海 郭 申请人:大连民族学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1