字数据库压缩的制作方法

文档序号:7744016阅读:141来源:国知局
专利名称:字数据库压缩的制作方法
技术领域
本发明涉及一种用于在无线通信系统的移动通信设备的存储装置中存储字数据库的方法、一种用于执行上述方法的计算机软件产品、以及一种包含根据上述新方法所存储的字数据库的移动通信设备。
用于诸如GSM、UMTS系统等无线通信系统的现代移动通信设备,比如便携式蜂窝电话、个人数字助理等,为用户提供了以许多不同的语言来显示消息、指令、按键功能等等的可能性。此外,当输入将要例如经由短消息系统(SMS系统)发送到通信对方的、包括字符符号等等的手写消息(written message)时,现代移动通信设备通过呈现用户最可能期望输入的字或词语,来支持字、表达式和词语的输入。经由移动通信设备中普通的有限键盘来输入字、语句及较长的消息,是十分麻烦的。移动通信设备趋向于非常的小而轻便,且因此仅具有以供输入字符、符号、数字等等使用的非常受限的按键数目。通常,几个字符、数字及符号被分配给单个按键。因此,为了输入期望的字符、数字或符号,用户不得不推按好几次对应的按键,直到在序列中得到所期望的输入。在德国和欧洲,现代移动通信设备为字、表达式、词语等等的输入提供支持,例如,通过所谓的T9系统,它使用户能只按压一次按键,将所期望的输入分配给此按键,由此控制装置,即处理器等,以及相应的通信设备软件就根据已经按压的按键次序来辨识用户所想要的字、表达式或词语,并显现出相应的备选提案。借此,显著降低了输入时间,而且操作舒适性大大提高了。
在另一方面,这类支持系统和以众多语言来操作通信设备的可能性,需要在通信设备中存储一个大的字数据库。所以,在移动通信设备中存储这种数据库所需要的存储空间是非常大的,并且该存储空间也会随着支持操作舒适性的附加功能而增加。
因此,本发明的目的是,提供一种用于在无线移动系统的移动通信设备的存储装置中存储字数据库的方法,以及提供一种能够执行上述方法的计算机软件产品和移动通信设备,它们允许节省用于存储字数据库的存储器空间。
上述目的是通过根据权利要求1的一种用于在无线通信系统的移动通信设备的存储器装置中存储字数据库的方法来实现的,所述方法包括以下步骤按字母顺序对不同语言的字进行排序,以及按树状结构来排列字数据库中的字,借此仅仅在树状结构的节点中存储一次由两个或多个接连的字共用的公共前缀,而各个字的相应末尾被存为节点的叶子,借此所述节点和叶子被相应的控制符号所参照,以便能够访问这些字。
上述目的进一步是通过根据权利要求8的用于在无线通信系统的移动通信设备的存储器装置中存储字数据库的计算机软件产品来实现的,所述计算机软件产品,当存储于处理设备的存储器装置中时,能够执行创造性方法的方法步骤。
上述目的进一步是通过根据权利要求9的无线通信系统的移动通信设备来实现的,所述移动通信设备具有用于根据创造性方法的方法步骤来存储字数据库的存储器装置,还具有用于访问字数据库的控制装置。
基本上已经认识到本发明的基本原理,即包括移动通信设备中所使用的不同语言中的多个字的字数据库包含大量带有公共前缀的字。在本文中,前缀是位于字起始处的一个、两个或多个字符的序列。因此,通过共用多个字的公共前缀,能够极大地减少所需的存储空间,所述多个字彼此按字母顺序紧密地接连排列。根据本发明,提出了在字数据库中按树状结构来对字进行排列,借此将每个公共的共用前缀分配给节点,并且各个不同的字尾都是树的叶子。这里,必须理解的是术语‘字’不仅涵盖带有预定含义的字符序列,而且也涵盖具有预定含义的字符及符号的组合以及仅仅符号本身等,所述预定含义被用在根据本发明的无线通信系统的移动通信设备的操作中。
优选地,至少一个控制符号被分配给每一个节点和叶子。因此,可以简单、快速且非常有效地访问数据库中的各个字。更加优选的是,在所述排序步骤之前,执行检测用在移动通信设备中的常用字和语句的步骤,以及执行用字参照来替代已检测到的常用字的步骤。因此,术语‘语句’涵盖了用在移动通信设备中以供指示用户、通知软按键相应功能等等的各种包含两个或多个字、词语或表达式的消息。因此,形成包含公共的已替代的字以及相应所分配的字参照的参照表。最好,字符串被用作为字参照。照此,通过确保各种语句中公共的共用字被具备显著缩短必需的存储空间的字参照所替代,能够进一步减少字数据库所需的存储空间。
更加优选的是,在所述排列步骤之后,在字数据库上执行数据压缩。因此,优选使用Borrows-Wheeler(博罗-惠勒)变换算法。
在下列说明中,相对于特定实施例并且结合公开的附图来对本发明作出详细解释,在附图中

图1示出根据本发明的移动通信设备的示意性表示;图2是示出根据本发明的方法的结构框架的流程图;图3是示出根据本发明、用于创建字参照表的程序步骤的流程图;和图4是示出根据本发明、用于辨识字参照表的程序步骤的流程图。
图1示意性示出了无线通信系统的移动通信设备1,本发明被应用于所述移动通信设备。具体而言,移动通信设备1可以是便携式蜂窝电话、个人数字助理等,以供在GSM、UMTS等系统中操作。移动通信设备1包括控制装置2,如处理器等,以用于控制通信设备的主要功能,比如在通信系统中接收和发送数据,控制显示装置4、输入装置5以及通信设备1操作所需的所有其它部件。另外,根据本发明,配备存储装置3并将其连接于控制装置2,以用于存储字数据库。将要理解的是图1仅仅示出了供理解本发明所需的移动通信设备部件,但实际上还包括设备操作所需的所有其它部件,比如接收/发送电路、显示器、天线等等。
因此,根据下面所阐述的创造性方法,在通信设备1组装期间,字数据库被存储在存储装置3中。
一个基本事实是现代移动通信设备是由厂商提供的,以供在不同的大陆、国家和语言中使用。因此,操作语言,即通信设备1显示或声学输出指令、控制功能所用的语言,是能由用户来将其设置成多种语言的其中一种的。这另一方面就需要包含所有字、符号、表达式、词语等的字数据库必须存储在通信设备1的存储装置3中。因此,人们已经认识到,至少是西方语言在字符、音节、前缀、甚至是句子里面的字都带有显著的冗余。而且,几种语言共用公共的字。本发明尤其针对于利用这些冗余来节省存储空间,以供在存储装置3中存储字数据库。
根据本发明的方法的结构框架在图2的流程图中作了说明。从步骤S0的字数据库开始,由程序步骤序列组成的子过程S1引入字参照(word reference)。因此,将字参照分配给字数据库当中每一个至少两次被使用的字,并且用它们所分配的字参照来替代相应的字。又由程序步骤序列形成的下一个子过程S2将在S1中修改的字数据库重编成树状结构,以供进一步缩减所需要的存储容量。在最终步骤S3中,在过程在S4结束以前,利用现有技术的数据压缩算法来进一步压缩如此重编的字数据库。
图3详细说明了上述子过程S1。在开始步骤S10中的程序之后,在第一个步骤S11,当浏览字数据库时,检测常用字,即反复用于移动通信设备1的语句中的字。通信设备1的操作中,通信设备1经常通过利用两个或多个字形式的语句来向用户通知不同的功能,给予他或她指示等等。在本申请的意义上讲,语句不必是符合语法地正确语句,而可以是甚至不带动词等的短语句。用在移动通信设备1中的语句必须被预先存储起来,以便根据通信设备1的操作、应用程序或各个功能,能够将相应的语句显示给用户或声音上地输出给用户。因此,许多这些语句都共用诸如术语的或非术语的这类常用字,所述术语的字例如是SIM、PIN,而所述非术语的字例如是激活的、成本、未知的等等。由此,在步骤12,检测出被存储和使用于通信装置1中的语句当中的这种字冗余,并且把字参照分配给这些反复使用字中的每一个。接着,在步骤S13,这些常用字被字参照所替代。当然,字参照明显比所替代的常用字更短且需要更少的存储空间。同时,在步骤S14形成包含已替代的常用字以及已相应分配的字参照的参照表,以便当将要从存储器装置3中读取句子并输出给用户时,相应的字参照能被将要输出给用户的适当的字或术语所替代。优选地,字参照是字符串。在步骤S15中,所述子过程S1结束。
在图4的流程图中给出了程序步骤的第二序列S2的详述。对包括那些被在第一子过程S1中字参照替代的字的那些字按字母顺序排序。这意味着,在步骤S21,不同语言中的所有字、术语、表达式等等均按字母顺序加以排序。以下的表1示出了一段相应已排序的字52)abajo
53)abbonamento54)abbonato55)abeceda56)abfrage57)abilitata58)abilitato59)abonado60)abonament61)abonamentu62)abonat63)abone64)abonent65)abonnee66)abonnemangsA?vertrA$delse67)abonnement68)abonnent69)abonnA?70)abord71)abr72)abril73)abroad74)absent75)abspielen76)abuzivA?77)abweisen78)abwesend……这里,变得显而易见的是许多字共用同一个前缀,就如在所示示例中的前缀“ab”。在步骤S22中检测这些共用的前缀。接下来,根据本发明,字数据库是按树状结构排列的,由此,在步骤S23,仅仅在树状结构的节点中存储一次由两个或多个按字母顺序接连的字所共用的公共前缀,并且在步骤S24,将各个字的相应末尾都存为节点的叶子。在表1的实例中,26个连续的字共用前缀“ab”。同二个字符再加上一个或多个控制符号相比,在单个节点中仅存储一次前缀可节省2×26=52个字符。这样,在步骤S25,公共的共用前缀被存储在节点中,借此将控制符号分配给每个节点。此外,在步骤S26,每个字连同相应的控制符号都被分配给相对应的节点的叶子。当控制装置2从字数据库中读出字时,通过控制符号能快速而有效地访问所想要的字。
在第三步或子过程S3中,利用已知的数据压缩算法分别对具有树状结构及参照表的字数据库作进一步压缩,所述数据压缩算法优选为博罗-惠勒变换算法。因此,字的数量被进一步压缩。
本发明因此显著地减少了在移动通信设备1的存储器装置3中存储字数据库所需的存储空间。因此,在相应处理设备中,上述压缩方法可实现为计算机软件产品,当根据本发明来生产和组装移动通信设备1时,可使用此处理设备。
虽然已经描述并示出了本发明的具体实施例,但是本领域普通技术人员应当理解的是,由于可以作许多修改,因而不应当局限于本发明的所述方法。因此,本申请意图涵盖任何及全部实施例和/或特征,这种实施例和/或特征可以落入在此所公开和要求的基本原理的实际精神和范围内。
权利要求
1.用于在无线通信系统的移动通信设备的存储器装置中存储字数据库的方法,该方法包括以下步骤按字母顺序对不同语言的字进行排序,以及按树状结构来排列字数据库中的字,借此仅仅在树状结构的节点中存储一次由两个或多个接连的字共用的公共前缀,而各个字的相应末尾被存为节点的叶子,借此所述节点和叶子被相应的控制符号所参照,以便能够访问这些字。
2.根据权利要求1所述的方法,其特征在于至少一个控制符号被分配给每一个节点和叶子。
3.根据权利要求1或2所述的方法,其特征在于在所述排序步骤之前,还执行以下步骤检测语句中的常用字,所述语句将被用在所述移动通信设备中;和执行用字参照替代所述已检测到的常用字。
4.根据权利要求3所述的方法,其特征在于形成参照表,该参照表包括公共的已替代的字以及相应所分配的字参照。
5.根据权利要求3或4所述的方法,其特征在于字符串被用作字参照。
6.根据权利要求1至5的其中一项所述的方法,其特征在于在所述排列步骤之后,在字数据库上执行压缩。
7.根据权利要求6所述的方法,其特征在于在所述压缩步骤中,使用博罗-惠勒变换算法。
8.用于在无线通信系统的移动通信设备的存储器装置中存储字数据库的计算机软件产品,当所述计算机软件产品被存储在处理设备的存储器装置中时,能够执行要求1到7的其中一项的方法步骤。
9.无线通信系统的移动通信设备,其具有用于存储字数据库的存储器装置,所述字数据库是根据权利要求1到7的其中一项的方法步骤存储的,还具有用于访问字数据库的控制装置。
全文摘要
本发明涉及一种用于在无线通信系统的移动通信设备的存储器装置中存储字数据库的方法,该方法包括以下步骤按字母顺序对不同语言的字进行排序,以及按树状结构来排列字数据库中的字,借此仅仅在树状结构的节点中存储一次由两个或多个接连的字共用的公共前缀,而各个字的相应末尾被存为节点的叶子,借此所述节点和叶子被相应的控制符号所参照,以便能够访问这些字。
文档编号H04M1/2745GK1564991SQ02819502
公开日2005年1月12日 申请日期2002年9月19日 优先权日2001年10月2日
发明者S·罗图尔科 申请人:索尼国际(欧洲)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1