用于减小所需存储容量以及创建数据库的方法

文档序号:6415633阅读:256来源:国知局
专利名称:用于减小所需存储容量以及创建数据库的方法
技术领域
本发明涉及一种用于减小数据库的所需存储容量的方法以及用于执行该方法的装置。
熟练地建立数据库的模型是一个难题,特别当涉及非常大量的数据的时候。一个具体的例子是需要存储电话资费信息,或者存储其他对于世界范围内的任何地方-地方的组合或者至少对于相当大的国家(例如德国)的独立可分配的信息单元。可用于此的存储空间应当保持为最小。但是就德国而言,已经总共有5604×5604个可能的拨号代码组合。因此总共有大于3千万个数据记录。在这种情况下,每个数据记录包括仅对于该拨号代码来说至少两个4个字节的长整数值,对于地名至少25个字节,以及至少4个字节用于分配到各个资费区。因此每个数据记录至少具有4+4+25+4=37个字节。因此,即使没有考虑到各个所选择数据库的所谓系统开销(索引,等等),整个数据库将具有约为1.1G字节的大小。熟练地建立数据库模型以及经典的压缩技术将使得所需存储容量减小到约为100M字节。对于特定的数据库系统来说(这将在下文中具体描述),还需要进一步减小所需存储容量。
德国专利DE 34 25 844 A1公开一种用于快速地在数据存储器中检索由电信交换系统或数据处理系统所产生的特定数据记录的方法。该方法提出当数据记录被存储在数据存储器中时,搜索条目同时被作为所谓的关键字并行地存储在特定存储区中。在进一步处理的过程中,或者当数据记录被打印出来时,一但找到对应于搜索条目的关键字时,用于特定存储区的顺序搜索的地址计数器的计数器部位被用于寻址在数据存储器中搜索的相关数据记录。
另一种用于数据存储器的搜索方法公开于德国专利DE 39 08 684 A1中。在该方法中,有限管理区、位于管理区内的搜索区、以及搜索对象被预定于n维坐标系统中,插入搜索区中的搜索对象被预先确定。
这些方法仅能够稍微减小存储容量的需求。
因此本发明基于特定方法和装置的目的,该装置适用于执行该方法以把特定数据库所需存储容量减小到超过目前已知的范围。
用于减小数据库的所需存储容量的本发明的方法和特征在于,要被存储的信息单元被分配给至少二维光栅矩阵的交点,各个颜色值被分配给位于该光栅矩阵中的信息单元,如此形成的图像矩阵作为数据库或者数据库的一部分存储,最好在该图像矩阵已经受到图像压缩之后存储。
该光栅矩阵被坐标轴所横过,并且由算法或分配表所定义的信息内容可以被分配给各个坐标轴值。具体来说,用于该光栅图像矩阵中的适当颜色值是已知的和已定义的RGB(红绿蓝三原色)颜色值,从而使得可以采用经典的无失真的压缩方法进一步相当大程度地减小所需存储容量。
用于执行根据本发明的方法的本发明的装置的特征在于权利要求5的特点,根据进一步的从属权利要求具有改进的可能性。
本发明将参照附图利用实施例进行更具体的描述。


图1示出数据库的结构示意图。
本发明基于这样的概念,即,任何信息的条目可以被变换为定义一幅图像的多维(例如,二维)颜色空间中的颜色值。信息的复合组(例如,数据库或扩展表格)被表示为一串颜色值,也就是说,作为图像。该颜色值不是任意地串在一起的,而是按照多维矩阵或坐标系统的形式的,该坐标轴被分配给他们自身的信息内容。除了与该颜色值转换相关的减小之外,现在可以把经典的无失真图像压缩方法应用于由该转换所产生的图像。
经典的数据库通常以表格存储信息,每一列具有其自身的信息内容,但是该行(如果有的话)被用在一相同的方式。
根据本发明,原子或分子信息单元的组合被产生或特别变换为复杂颜色值。例如,三个ASCII字符被组合形成一颜色值。在这种情况下,对特定字符串的颜色值的分配由一算法或分配表所定义,该分配表依次类似地可以作为图像信息存储。
参照上述电话资费信息数据库的实例,例如,二维颜色矩阵的x轴被分配给目的位置,而y轴被分配给起始位置。5604×5604矩阵这样构成。相应的资费区在交点进入。另外,需要一索引,其中拨号代码被分配给矩阵的行和/或列。各个资费信息被作为颜色值输入到矩阵。其结果是一幅总共有5604×5604个点以及每个点具有4字节的颜色深度的位图。当作为位图存储时,所需存储容量仍然约为13M字节。但是,由于现在具有一幅图,可以毫无困难地采用经典的无失真图像压缩方法。如果考虑以PNG格式(可移植的网络图像格式)作为基础,例如,对于所得数据库最多仍然需要仅仅约为650K字节的存储容量,结合可能的较快访问各个数据记录的方法。
该附图用图解法示出该单元或者应用根据本发明的方法的数据库的结构。
在以多坐标轴分配作为基础的范围内,提供坐标轴数值分配单元或者坐标轴变换单元ATU。该ATU通过算法或分配表格把特定的坐标轴数值分配给原子或分子信息或中间信息的条目,并且把所述坐标轴数值再次转移回来。中间信息的例子是指向文件的指针,或者,在更复杂的情况中,为“真正的”图像。
图像(通常)被称为各个颜色值的二维排列(“分布”)。因此,图像也可以被理解为一个坐标系统,二维或多维坐标系统,其中各个颜色值被定位,例如在当前的上下文中。在多于二维坐标系统的情况下,也可以称为颜色空间。
如果以二维坐标系统为例,则可以代表在ATU之下的分配规则,参见上述实例,简化为如下“取拨号代码的整数值作为坐标轴数值”,所有始发位置的数量则被确定为信息空间。
ATU本身依次访问颜色值转换器单元或者颜色变换单元CTU,它确定特定信息条目对坐标值数值的分配,也就是说各个颜色值到原子或分子信息单元或者中间信息单元的分配,反过来同理。
该分配可以再次通过算法或分配表进行。在这种情况下,采用如下基本概念
已知,颜色值可以被描述为RGB值。在这种情况下,一个RGB值例如通过各个8-字节数值(十进制0至255)表示红、绿和蓝的成分。这三个独立的颜色值被转换为单个RGB值,例如红=255,绿=255,蓝=255→RGB=16777215,或者红=65,绿=43,蓝=0→RGB=11073。
然后三个独立的数值被按位把各颜色值合并形成24字节的颜色值。
例如255对应于11111111。结果,当由比特数值表示时,RGB值(255,255,255)变为比特数值11111111 111111111 1111111。
如该实例所示,特定信息条目如此被转换为颜色值,更精确地说-通过对各个比特数值定义的分配表,-或者通过用于把RGB值分配给原子或分子信息或者中间信息的条目的分配表,-或者通过在每种情况下把原子或分子或中间信息分配给特定的红、绿和蓝数值的一种算法或者分配表。
换句话说,CTU这样把颜色值(例如,RGB值)分配给原子或分子信息或中间信息的条目。在这种情况下,该应用不限于,例如,24-字节的RGB值的产生,而且可以类似地应用于任何颜色值,例如32-字节RGB值。
这将用CTU逻辑方案的简单实例进行说明“在每种情况中从三个连续ASCII数值组成一个颜色值”。
采用这种简单规则,例如,字“Beispieltext”[“举例文本”]可以由包括四个像素的一串颜色值所表示Beispieltext→(66,101,105)(115,112,105)(101,108,116)(101,120,116)→6907202,6910067,7629925,7632997。
如果坐标轴数值分配单元ATU与颜色值转换单元CTU结合使用,能够以简单的方式类似地采用不能够用于经典数据库系统中的特定的坐标轴以存储附加信息。
然后数据或信息实际存储在存储器组中的图像或颜色空间中,在图中称为数据立方体。
如上文所述,对于二维颜色空间(图像)可以采用经典的无失真压缩方法以进一步压缩并减小所需存储容量。在多于二维颜色空间的情况下,可以由二维图像来模拟,或者可以把适当的无失真压缩算法应用于多维图像空间。
最后,为了与外界进行通信,存在一个作为数据库引擎的接口,它的主要任务是信息的(缓冲)存储和检索。该接口还必须完成所有经典数据库系统的基本功能;因此它仅在其实际实现形式上有所不同。
如果它的附加功能被减小为最基本的功能,则实际的差别是本发明的上下文中所需的像素值必须通过多维颜色空间中的数据库接口进行读取或设置。通常,基本处理过程如下(1) CTU把出现的信息单转换为颜色值;(2) ATU(如果适当的话,可以不只有一个)再次把信息单元(颜色值)定位于它们各自的信息空间中,以及(3) 数据库引擎在相应位置设置或读取由在数据存储器(数据立方体)中的CTU所确定的颜色值。
根据本发明的数据库解决方法的特定优点主要是-所需存储容量在相当大程度上得到减小,例如减小100倍,也就是说,例如从100M字节减小到650K字节。
-数据库访问由于该结构而变得更快,并且数据库尺寸更小。
在所需存储空间上的第一次减小已经通过利用颜色值转换器单元CTU而实现;进一步的实质性减小是通过另外采用坐标轴数值分配单元ATU而实现的。
根据本发明的方法或者所述减小所需存储容量的数据库结构主要适用于涉及非常大量的数据,或者与数据量相关的传输费用,例如对于“视频点播”、“新闻点播”部分以及用于互联网传输等。与经典的数据库相比,另外需要的建立数据库模型的工作对于这些应用领域来说是值得的。当前处于显著地位的令人感兴趣的应用领域是世界范围的路由数据库系统,特别对于互联网传真服务,以及上述用于资费信息的系统以及通过售票机的计算的应用。
权利要求
1.用于减小数据库的所需存储容量的方法,其特征在于-要被存储的信息单元被分配给至少二维光栅矩阵的交点,-各个颜色值被分配给位于该光栅矩阵中的信息单元,以及-如此形成的图像矩阵被作为数据库或数据库的一部分存储。
2.根据权利要求1所述的方法,其特征在于,复合的RGB颜色值被用作为颜色值。
3.根据权利要求1或2所述的方法,其特征在于,图像矩阵的颜色值在作为数据库或数据库的一部分存储之前受到图像压缩处理。
4.根据权利要求1至3中的一项所述的方法,其特征在于,由分配表所定义的算法或信息内容被分配给光栅矩阵的坐标轴数值。
5.用于执行根据权利要求1或2所述的方法的装置,其特征在于-颜色值转换单元(CTU),其通过一种算法或分配表把原子或分子信息单元或者中间信息单元分配给在由颜色矩阵所预定的颜色空间内的颜色矩阵的确定交点作为各个颜色值,-存储器组(数据立方体),用于存储该颜色值,以及-接口(数据库引擎),其设置或读取通过颜色值转换单元确定的颜色值。
6.根据权利要求5所述的装置,其特征在于,一个坐标轴数值分配单元(ATU)通过一种算法或分配表把原子或分子信息单元或中间信息单元分配给对应于多维颜色值矩阵的坐标系统的预定坐标轴数值。
7.根据权利要求5或6所述的装置,其特征在于,一种用于无失真地压缩该颜色值矩阵的装置,该装置被分配给存储器组。
全文摘要
为了减小数据库的所需存储容量,本发明规定把要被存储的信息单元分配给位于颜色空间中的至少二维光栅矩阵的交点,各个颜色值被分配给位于光栅矩阵中的信息单元,并且最好在图像压缩之后,把如此形成的图像矩阵作为数据库或数据库的一部分存储。根据本发明的解决方案使得特定数据库的所需存储容量减小100倍或更多。本发明主要适用于涉及大量数据和取决数据量的传输花费。
文档编号G06F17/30GK1252146SQ98804033
公开日2000年5月3日 申请日期1998年4月8日 优先权日1997年4月9日
发明者阿明·埃尔-加扎尔 申请人:数据平方公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1