一种基于新短浮点型数据的数据转换方法

文档序号：9869696阅读：614来源：国知局

一种基于新短浮点型数据的数据转换方法
【技术领域】
[0001] 本发明设及数据处理技术领域，尤其是一种基于新短浮点型数据的数据转换方法。
【背景技术】
[0002] 随着社会的日益发展，由科学研究、社交网络、自然环境监测等产生的数W亿计的数据呈爆炸式增长，无论在工业界还是学术界，大规模数据处理都受到火热追捧。数据的多样性和指数级增长给数据存储和传输带来了巨大压力，严重阻碍了高性能计算在科学领域的运用和发展。
[0003] 浮点数在计算机系统中是普遍存在的(从PC到超级计算机都广泛存在）。几乎每种计算机语言都有浮点数型数据。浮点数型数据的通用标准是IEEE754标准。IEEE754标准在表示浮点数时，每个浮点数均由立部分组成:符号位S (sign),指数部分E (exponent,也称为阶码部分）和尾数部分M (mantissa)。
[0004] I邸E754标准的浮点数一般采用W下四种基本格式： (1)单精度格式他位）：除去符号位1位后，E占8位，M占23位。
[0005] (2)扩展单精度格式:E〉=ll位，M〉31位。
[0006] (3)双精度格式：（64 位）；E=11 位，M=52 位。
[0007] (4)扩展双精度格式:E〉=15位，M〉63位。
[000引数据的转换方式包括数据压缩、解压缩、存储与传输等。对浮点型数据来说，数据的总位数决定了数据转换的效率。目前IEEE754标准的四种浮点型数据的总位数至少为32 位，若能采用总位数少于32位的数据格式来表示浮点型数据，将会进一步加快数据转换的速度和效率，降低数据存储量和传输成本，运对于追求更高压缩效率的有损压缩(有损压缩指的是解压缩时不能精确恢复原始数据，有一定的信息损失，该方法主要用于图像、视频、音频等少量信息遗失而不会影响原有数据效果的领域)来说，显得尤为重要。

【发明内容】

[0009] 为解决上述技术问题，本发明的目的在于:提供一种转换速度快、效率高、存储量少和传输成本低的，基于新短浮点型数据的数据转换方法。
[0010] 本发明所采取的技术方案是：一种基于新短浮点型数据的数据转换方法，包括： A、确定数据转换的变换形式及所采用的变换算法，所述数据转换的变换形式包括但不限于压缩、解压缩、存储和传输； B、根据确定的变换形式采用相应的变换算法将新短浮点型数据转换为其它浮点型数据或将其它浮点型数据转换为新短浮点型数据，所述新短浮点型数据为8位短浮点型数据或16位短浮点型数据。
[0011] 进一步，所述8位短浮点型数据的数据格式为:符号位为1位，阶码部分共4位，尾数部分共3位;若阶码为O且尾数为O，则运个数的值为± O;若阶码为255且尾数为O，则运个数为无穷数;阶码为255且尾数不为O，则运个数表示非法数;负数的表示范围为[-416，-1.953 X10-3]，正数的表示范围为[1.953 X 10-3,416];相对误差小于等于6.22%。
[0012] 进一步，所述16位短浮点型数据的数据格式为:符号位为1位，阶码部分共8位，尾数部分共7位;若阶码为0且尾数为0，则运个数的值为± 0;若阶码为15且尾数为0，则运个数为无穷数;阶码为15且尾数不为0，则运个数表示非法数;负数的表示范围为[-3. Ol X IO38， -1.401298 X 10-45]，正数的表示范围为[1.401298 X 10-45,3.Ol X 1038];相对误差小于等于1.05%。
[0013] 进一步，所述其它浮点型数据为IEEE754标准的单精度浮点型数据或双精度浮点型数据。
[0014] 进一步，所述步骤B中将单精度浮点型数据转换为8位短浮点型数据或16位短浮点型数据运一步骤，其包括： B11、将浮点型数据按照整型的数据格式进行逐位读取； B12、利用位运算，分别获取单精度浮点型数据的符号位、阶码W及尾数部分； B13、通过移位W及截取运算，获得单精度浮点型数据中阶码W及尾数部分压缩后的值； B14、采用位或运算将单精度浮点型数据的符号位、阶码W及尾数部分压缩后的值合并为8位短浮点型数据或16位短浮点型数据。
[0015] 进一步，所述步骤B中8位短浮点型数据转换为单精度浮点型数据运一步骤，其包括： B21、按压缩时的数据格式从8位短浮点型数据中截取符号位S，阶码部分E和尾数部分 M； B22、按IEEE754标准的数据格式，对单精度浮点型数据进行回填，所述对单精度浮点型数据进行回填运一步骤包括：将符号位S直接填充至单精度浮点型数据首字节位的第0位；将尾数部分M填入单精度浮点型数据的第9位至第11位，并往单精度浮点型数据的第12 位至第31位填0; 根据阶码部分E计算解压后的阶码E'，然后将E'的值填入单精度浮点型数据的第1位至第 8 位中，其中，当 E=O 时，E'=0;当1 < E < 254时，E'= E + 120;当 E=255 时，E'=255。
[0016] 其中，本发明8位短浮点型数据的解压缩方法中对无穷（INF) W及非法数(化N)的处理方法与IEEE754所定义的方法有所不同，能更加充分地利用存储空间。
[0017] 进一步，所述步骤B中将16位短浮点型数据转换为单精度浮点型数据运一步骤，其包括： B31、按压缩时的数据格式从16位短浮点型数据中截取符号位S，阶码E和尾数M; B32、按照IEEE754标准的数据格式，对单精度浮点型数据进行回填，所述对单精度浮点型数据进行回填运一步骤包括：将符号位S直接填充至单精度浮点型数据首字节位的第0位；将尾数部分M填入单精度浮点型数据的第9位至第15位，并往单精度浮点型数据的第16 位至第31位填0; 根据阶码部分E计算解压后的阶码E'，然后将E'的值填入单精度浮点型数据的第I位至第8位中，其中，E' = E。
[0018] 进一步，所述步骤B中将8位短浮点型数据转换为双精度浮点型数据运一步骤，其具体为：先将8位短浮点型数据转换为单精度浮点型数据，然后通过强制转换将单精度浮点型数据直接转换为双精度浮点型数据；或者先从8位短浮点型数据中截取符号位S、阶码部分E和尾数部分M，然后按照IEEE754 标准的数据格式，对双精度浮点型数据进行回填，得到转换后的双精度浮点型数据，所述对双精度浮点型数据进行回填运一步骤包括：将符号位S直接填充至单精度浮点型数据首字节位的第0位；将尾数部分M填入单精度浮点型数据的第12位至第14位，并往双精度浮点型数据的第 15位至第63位填0; 根据阶码部分E计算解压后的阶码E'，然后将E'的值填入双精度浮点型数据的第1位至第 11 位中，其中，当E=O时，E'=0;当1 < E < 254时，E'= E + 120;当E=255时，E' = 255。
[0019] 进一步，若需要将单精度浮点型数据转换为8位短浮点型数据，则采用转换公式y= f8(X)或y=f8ex(X)将单精度浮点型数据X转化为8位短浮点型数据y;若需要将单精度浮点型数据转换为16位短浮点型数据，则采用转换公式y=fl6(X)或y=fl6ex(X)将单精度浮点型数据X转化为16位短浮点型数据y，其中，函数f8(x)和函数fi6(x)分别为8位短浮点型数据和 16位短浮点型数据的普通版本转换函数，函数fSexU)和函数f ISex(X)分别为8位短浮点型数据和16位短浮点型数据的精确版本转换函数；函数f8(x)只根据单精度浮点型数据X的第9 位至第11位来确定8位短浮点型数据y的尾数，而函数fsexU)则根据数据X的第9位和第10位来确定数据y尾数的前2位并根据数据X的第11位和第12位来确定数据y尾数的最后1位；函数fi6(x)只根据单精度浮点型数据X的第9位至第15位来确定8位短浮点型数据y的尾数，而函数fi6ex(x)则根据数据X的第9位至第14位来确定数据y尾数的前6位并根据数据X的第15 位和第16位来确定数据y尾数的最后1位。
[0020] 进一步，所述步骤B在通过压缩转换算法将其它浮点型数据转换为新短浮点型数据时还包括W下步骤：对新短浮点型数据进行二进制格式紧凑存储，生成二进制数据文件；登记二进制数据文件的压缩标记。
[0021] 本发明的有益效果是:采用了 8位短浮点型数据或16位短浮点型数据来进行数据转换，与IEEE754标准的浮点型数据相比，总位数更少，进一步加快了数据转换的速度和效率，降低数据存储量和传输成本，具有压缩率高和存储量小的优势，尤其适用于数据的有损压缩存储与传输。进一步，8位短浮点型数据的表示范围为[-416,416]，相对误差小于等于 6.22%;而16位短浮点型数据的表示范围为[-3.Ol X 1038,3.Ol XlO38L相对误差小于等于1.05%，使得新短浮点型数据在同等的存储空间条件下具有更大的表示范围和更高的精度。进一步，将单精度浮点型数据转换为8位短浮点型数据或16位短浮点型数据时，能采用精确版本转换函数来进行压缩转换

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：霍颖翔;滕少华;张巍;
技术所有人：广东工业大学;
我是此专利的发明人

上一篇：超奈奎斯特采样系统中二元信号重建的平滑函数和方法
上一篇：一种观测矩阵优化方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、田老师：1: 建筑节能绿色建筑能耗的模拟与检测(EnergyPlus)；建筑碳排放和生命周期评价；城市微气候、建筑能耗与太阳能技术的相互影响；地理信息系统(GIS)和空间回归方法用于城市建筑能耗分析；不确定性、敏感性分析和机器学习方法应用于建筑能耗分析(R)；贝叶斯方法用于城市和单体建筑能源分析 2: 过
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。