一种信息交换用基本集汉字的13位编码方法

文档序号:6561162阅读:147来源:国知局
专利名称:一种信息交换用基本集汉字的13位编码方法
技术领域
本发明涉及一种信息交换用基本集汉字的13位编码方法,使用于信息技术中信息交换技术领域,即通讯、计算机信息交换和处理,属于汉字编码方法技术领域。
背景技术
GB2312-1980《信息交换用汉字编码字符集 基本集》对基本集6763个汉字给出了一种编码方法,该文献的“表1 图形字符代码表”如图1所示的汉字区域给出了这些汉字的代码,其代码由第一字节和第二字节组成,使用14位二进制数。这个汉字区域从0x3021即汉字“啊”至0x777E即汉字“齄”结束,0x表示其后是十六进制数字,前两位是第一字节,后两位是第二字节,下同。
基本集6763个汉字常使用在嵌入式计算机系统中,GB2312-1980的14位二进制数表示的汉字代码用于嵌入式计算机系统串行方式交换含汉字的信息时,信息交换效率较低,信息交换时间较长。

发明内容
本发明的目的是提供一种信息交换用基本集汉字的13位编码方法,这种13位的汉字代码能和GB2312-1980的14位二进制数表示的汉字代码方便地互相转换,以便计算机系统能高效地交换和处理含汉字的信息。
为实现以上目的,本发明的技术方案是提供一种信息交换用基本集汉字的13位编码方法,其特征在于,使用13位二进制数表示GB2312-1980信息交换用汉字编码字符集基本集中用14位二进制数表示的汉字代码,其方法为对GB2312-1980的基本集的每一个汉字,都采用两个字节表示,第一字节使用6位二进制数,第二字节使用7位二进制数;这13位的汉字代码从GB2312-1980的14位汉字代码转换而来;一.GB2312-1980的14位汉字代码转换为13位汉字代码的方法从GB2312-1980图形字符代码表的汉字区域中任取一个汉字的14位代码,第一字节记为A,低7位有效,第二字节记为B,低7位有效;转换成的13位代码第一字节记为a,低6位有效,第二字节记为b,低7位有效;转换算法如下 b=B%0x20A<0x40;B,A≥0x40;]]>算式二式中*——乘法;/——除法;|x/y|取商——x除以y,结果仅用整数商;x%y——x除以y,结果仅用余数;将GB2312-1980图形字符代码表的汉字区域中所有汉字按算式—和算式二转换为13位汉字代码,制成13位二进制数表示的汉字代码表;二.13位汉字代码转换为GB2312-1980的14位汉字代码的方法从13位二进制数表示的汉字代码表中任取一个13位汉字代码,第一字节记为a,低6位有效,第二字节记为b,低7位有效;转换成的14位代码第一字节记为A,低7位有效,第二字节记为B,低7位有效;转换算法如下 式中*——乘法;/——除法;|x/y|取商——x除以y,结果仅用整数商;x&y——x按位与y。
汉字的二进制数表示的代码位数越少越好,以提高信息交换效率,节约信息交换时间。实际上,13位二进制数就能表示213即8192个代码,可以覆盖表示基本集6763个汉字。一般嵌入式计算机系统使用串行方式交换含基本集汉字的信息时,发送方使用本发明的算式一和算式二将14位汉字代码转换为13位汉字代码发送,接收方使用本发明的算式三和算式四将收到的13位汉字代码转换为14位汉字代码存储和处理,减少了收发的代码位数,提高了信息交换效率。
本发明的优点是使用13位二进制数表示GB2312-1980中用14位二进制数表示的汉字代码,节约了一位二进制数位,本发明给出了这两种代码互相转换的简单算法,有利于实际使用,这应用于信息交换技术领域能有效提高信息交换效率,节约信息交换时间。


图1为GB2312-1980的图形字符代码表;图2为本发明的13位二进制数表示的汉字代码表。
具体实施例方式
以下结合附图和实施例对本发明作进一步说明。
一.GB2312-1980的14位汉字代码转换为13位汉字代码的方法实施例1汉字“好”,在图1-2查得14位代码为0x3A43,即A=0x3A,B=0x43。代入算式一和二得a=(0x3A-0x30)*4+|0x43/0x20|取商=0x2A,b=0x43%0x20=0x03;即“好”转换成的13位代码为0x2A03,查图2-8可知转换正确。
实施例2汉字“齄”,在图1-15中查得14位代码为0x777E,即A=0x77,B=0x7E。代入算式一和二得a=0x77-0x40=0x37,b=0x7E;
即“齄”转换成的13位代码为0x377E,查图2-14可知转换正确。
二.13位汉字代码转换为GB2312-1980的14位汉字代码的方法实施例3汉字“好”,在图2-8中查得13位代码为0x2A03,即a=0x2A,b=0x03。代入算式三和四得A=0x30+|0x2A/4|取商=0x3A,B=0x03+(0x2A&3)*0x20=0x43;即“好”转换成的14位代码为0x3A43,查图1-2可知转换正确。
实施例4汉字“齄”,在图2-14中查得13位代码为0x377E,即a=0x37,b=0x7E。代入算式三和四得A=0x37+0x40=0x77,B=0x7E;即“齄”转换成的14位代码为0x777E,查图1-15可知转换正确。
下面使用计算机编程语言C,可用一般计算机系统使本发明的13位二进制数表示的汉字代码,和GB2312-1980的14位二进制数表示的汉字代码方便地互相转换,其中一种较佳的实施方式如下unsigned char a,b,AA,BB;/*---------------------------------------**函数名AB14_to_ab13**功能将14位汉字码AA,BB转换为13位汉字码a,b。
**输入AA,14位汉字码第一字节,低7位有效;BB,14位汉字码第二字节,低7位有效。
**输出a,13位汉字码第一字节,低6位有效;b,13位汉字码第二字节,低7位有效;----------------------------------------*/void AB14_to_ab13(){if(AA<0x40){
b=BB/0x20; //(BB/0x20)的商a=(AA-0x30)*4+b;b=BB%0x20;//(BB/0x20)的余数}else{a=AA-0x40;b=BB;}}/*-----------------------------------**函数名ab13_to_AB14**功能将13位汉字码a,b转换为14位汉字码AA,BB。
**输入a,13位汉字码第一字节,低6位有效;b,13位汉字码第二字节,低7位有效;**输出AA,14位汉字码第一字节,低7位有效;BB,14位汉字码第二字节,低7位有效。
-----------------------------------*/void ab13_to_AB14(){if(b<0x20){AA=0x30+a/4;BB=b+(a&3)*0x20;}else{AA=a+0x40;BB=b;}}
权利要求
1.一种信息交换用基本集汉字的13位编码方法,其特征在于,使用13位二进制数表示GB2312-1980即信息交换用汉字编码字符集基本集中用14位二进制数表示的汉字代码,其方法为对GB2312-1980的基本集的每一个汉字,都采用两个字节表示,第一字节使用6位二进制数,第二字节使用7位二进制数;一.GB2312-1980的14位汉字代码转换为13位汉字代码的方法从GB2312-1980的图形字符代码表中任取一个汉字的14位代码,第一字节记为A,低7位有效,第二字节记为B,低7位有效;转换成的13位代码第一字节记为a,低6位有效,第二字节记为b,低7位有效;转换算法如下 (算式一)b=B%0x20A<0x40;B,A≥0x40;]]>(算式二)式中*——乘法;/——除法;|x/y|取商——x除以y,结果仅用整数商;x%y——x除以y,结果仅用余数;0x——表示其后是16进制数字,下同;将GB2312-1980图形字符代码表的汉字区域中所有汉字按算式一和算式二转换为13位汉字代码,制成13位二进制数表示的汉字代码表;二.13位汉字代码转换为GB2312-1980的14位汉字代码的方法从13位二进制数表示的汉字代码表中任取一个13位汉字代码,第一字节记为a,低6位有效,第二字节记为b,低7位有效;转换成的14位代码第一字节记为A,低7位有效,第二字节记为B,低7位有效;转换算法如下 (算式三) (算式四)式中*——乘法;/——除法;|x/y|取商——x除以y,结果仅用整数商;x&y——x按位与y。
全文摘要
本发明涉及一种信息交换用基本集汉字的13位编码方法,其特征在于,使用13位二进制数表示GB2312-1980信息交换用汉字编码字符集基本集中用14位二进制数表示的汉字代码。本发明的优点是使用13位二进制数表示GB2312-1980中用14位二进制数表示的汉字代码,节约了一位二进制数位,并且,本发明给出了这两种代码互相转换的简单算法,有利于实际使用。这应用于信息交换技术领域能有效提高信息交换效率,节约信息交换时间。
文档编号G06F17/28GK1932806SQ20061011688
公开日2007年3月21日 申请日期2006年10月8日 优先权日2006年10月8日
发明者夏华龙, 潘日虎 申请人:上海埃威航空电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1