一种数据压缩方法及其装置的制作方法

文档序号:7525919阅读:188来源:国知局

专利名称::一种数据压缩方法及其装置的制作方法
技术领域
:本发明属于网络游戏
技术领域
,尤其涉及一种数据压缩方法及其装置。
背景技术
:随着信息和通信技术的发展,出现了许多大型的多人在线游戏,譬如大型多人在线角色扮演游戏、即时战略等网络游戏,一般大型的网络游戏具有复杂的大型软件系统和海量的用户数据,此类网络游戏的服务器需要接收和发送大量的数据,这样,数据传输对网络带宽提出较高的要求。在数据的传输过程中,通常需要对待传输的数据进行压缩,以减少实际传输的数据量,减少网络传输资源的占用以及减少传输失败的几率,提高数据传输的效率。在对数据压缩过程中,通常使用数据字典完成数据的压缩,所述数据字典中存有用于数据压缩的具有高重复概率的字符串及其代码,这些字符串及其代码用于代替所述待压缩数据,其中,数据字典中包含的所述高重复概率的字符串及其代码越多,数据的压缩率越高。现有技术中,以所述数据字典为基础实现的数据压缩,每次压缩数据时都需要1)对待压缩数据进行扫描;2)生成用于所述待压缩数据的数据字典;3)根据所述生成的lt据字典对待压缩数据进行压缩处理;4)将压缩后的数据传输到接收端。其中对数据压缩每次都要进行扫描待压缩数据的过程,且每次都要重新生成数据字典,需要大量的扫描处理和生成数据字典的时间,而且需要开辟相对大的内存空间作为数据緩冲区,虽然现有的改进方案提出了对待压缩数据进行分段扫描,将待压缩的字符串的字符逐渐流入所述的数据緩冲区以减少緩沖区的压力,但需耗费大量时间处理和生成数据字典,还有,当生成数据字典时,如果将低重复概率的字符串及其代码也存储到数据字典就会增加字典的数据量,将会再一次增加传输数据时的压力。终上所述,即影响了数据压缩速度,也降低了最终的数据传输速度。
发明内容本发明实施例的目的在于提供一种数据压缩方法,旨在解决现有技术中利用数据字典对数据进行压缩时,耗费大量时间处理和生成数据字典及低压缩率的问题。本发明实施例是这样实现的,一种数据压缩方法,所述方法包括以下步骤判断待压缩数据中所包含文本信息的语境;根据所述语境匹配数据字典,并利用该数据字典对待压缩数据进行压缩处理;对接收端的数据字典估夂同步处理。本发明实施例的另一目的在于提供一种数据压缩装置,所述装置包括语境判断模块,用于判断待压缩数据中所包含的文本信息的语境;数据字典数据库,用于预先将数据字典与特定语境进行匹配处理,根据待压缩的语境匹配数据字典;数据压缩处理才莫块,用于#4居选取的数据字典对待压缩数据进行试压缩及发送前的压缩处理。本发明实施例通过定期判断待压缩数据语境匹配数据字典,以及利用初选的数据字典对待压缩数据进行试压缩,既准确匹配数据字典以提高了数据压缩率,也减低了字典的数据量,从整体上缩短数据压缩的时间,过程实现方便。图l是本发明实施例提供的数据压缩方法的流程图;图2是本发明实施例提供的数据压缩装置的结构图;图3是本发明实施例提供的数据压缩装置中的语境判断模块的结构具体实施例方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进4亍进一步详细"i兌明。应当理解,此处所描述的具体实施例4又仅用以解释本发明,并不用于限定本发明。下面结合附图对本发明进行进一步的说明。图1示出了本发明实施例提供的数据压缩方法的流程。在步骤S101中,判断待压缩数据中所包含文本信息的语境;在具体实现过程中,统计所述文本信息中每个词语的出现概率,根据预先设定的规则选取一组词语,通过分析并逻辑运算所述选定词语的语境参数值,根据运算结果确定待压缩数据所处的语言环境。其中,根据预先设定的规则选取若干词语时,所述选取规则优选的,选取出现概率相对较高的若干词语,将文本信息中的所有词语按照出现概率的高低进行排列,按照预先设定的选取数量从上至下选取高重复率的词语。优选的,还可以同时结合词语的长度来选取若干词语,按照预先设定的词语长度范围的参数值,根据上述词语出现概率的高低排列顺序,对符合长度条件的词语从上至下选取高重复率的词语。所述统计文本信息中每个词语的出现概率时,同时按照语境关联情况对每个词语赋予彼此不同的语境参数值。譬如下表:<table>tableseeoriginaldocumentpage6</column></row><table>所述出现概率是出现词语占文本信息中的所有词语的百分比。所述通过分析并逻辑运算所述选定词语的语境参数值,#>据运算结果确定待压缩数据所处的语言环境,具体过程首先,每个词语预先设定了语境参数值,不同语境对应不同的参数数值,然后,再对所述选定词语的语境参数值进行分析,分析后进行相适应的逻辑运算,根据运算后所得的语境参数值确定待压缩数据所处的语言环境。所述对选定词语的语境参数值进行分析并逻辑运算,是将所述参数值进行比较处理,并根据比较结果执行相应的逻辑运算如果,参数值彼此差异较小时,则所述逻辑运算,优选的,可以通过取平均值的方式来确定待压缩数据的语境。例如,根据预先设定的规则选取了"生产木剑"和"建筑冶炼工厂",对所述选定词语的语境参数值取平均值,得出结果为"006",按照所述平均值重新匹配语境,如果,语境参数值的平均值的结果与每个词语的语境参数值非常近似时,也可以直接根据其中任意一个词语的语境参数值判断出是游戏用户的操作指令,确定待压缩数据为玩家操作游戏的语境。反之,参数值彼此差异较大时,则所述逻辑运算,优选的,可以通过忽略出现概率相对较小的选定词语,再对未被忽略词语的语境参数值进行比较,如杲,参数值彼此差异仍然较大,继续对出现概率相对较小的选定词语进行忽略,直到参数值彼此差异较小,此时,根据最终选定的词语的语境参数值,可以利用上述取平均值的方式来确定待压缩数据的语境。例如,根据预先设定的规则选取了"生产木剑,'和"荣誉点",忽略概率较小的选定词语"荣誉点,,根据词语"生产木剑,,的语境参数值可以判断出是游戏用户的操作指令,确定是玩家操作游戏的语境。其中,在所述忽略出现概率相对较小的选定词语之后,对其余选定词语的语境参数值进行比较,根据比较结果判断是继续忽略,还是对选定词语取平均值。在步骤S102中,4艮据待压缩数据的语境匹配一组数^"字典,并利用所述一組数据字典对待压缩数据进行试压缩。在具体实施过程中,在数据字典数据库中,预先将一组相近似数据字典与特定语境进行匹配处理,根据待压缩lt据的语境选定与所述语境相匹配一组相近似数据字典,匹配成功后,则利用所述选定的一组数据字典分别对待压缩数据进行试压缩处理。优选的,所述根据语境匹配一组数据字典时,还可以同时参考上一待压缩数据的语境情况,而后再去匹配一组数据字典,以提高匹配数据字典的准确度。例如,引入权重值的概念,首先,分别对待压缩数据与上一待压缩数据的语境预先设定权重值,对所述待压缩数据与上一待压缩数据的语境参数值分别乘以各自的权重值,将乘以权重值的语境参数值组合后得到修正后的语境。在步骤S103中,比较试压缩结果,选择压缩比最优的数据字典。其中,利用匹配的一组数据字典分别对待压缩数据进行试压缩完成后,统计利用不同数据字典进行数据压缩的压缩比,压縮比越大,压缩后的数据量越小,选取实现最高压缩比所对应的数据字典。在步骤S104中,利用所述选取的压缩字典对待压缩数据执行压缩处理。在步骤S105中,对接收端的数据字典做同步处理。所述同步处理的具体过程中,在发送数据包到接收端时,将上述所选取数据字典与压缩后的数据先后分别发送到接收端,在数据接收端中,首先利用接收到的数据字典替换所述接收端保存的原有数据字典,再根据更新后的数据字典的编码压缩MJ'J对压缩^据进行解压縮处理。优先的,还可以通过差异更新处理以实现同步数据字典,所述差异更新处理是将选取的数据字典与发送端的上一待压缩数据所利用的数据字典进行差异比较,根据比较结果统计出数据接收端的原有数据字典需要修改或增减的部分,根据所述修改或增减的部分编写更新数据的指令,通过发送更新指令到接收端,对接收端的原有数据字典进行更新处理。在实施例提供的数据压缩方法中,在对待压缩数据执行压缩处理前,可以在一定时间内利用现有的数据字典对待压缩数据进行压縮,具体的,通过系统设定选取数据字典的时间间隔,在设定的一定时间内待压缩数据的语境变化不大,压缩数据时,利用同一数据字典对待压缩数据进行压缩,接收端保存的数据字典也不需进^f亍同步处理,以达到加快压缩进程的目的。本发明实施例还提供了一种数据压缩装置,请参阅图2、图3,所述装置包括语境判断模块21、数据字典数据库22、数据压缩处理模块23、数据字典选取模块24以及同步处理模块25。所述语境判断模块21包括概率统计模块210、选取与赋值模块211、分析与逻辑运算模块212。所述语境判断模块21,用于判断待压缩数据中所包含的文本信息的语境;所述数据字典数据库22,用于预先将数据字典与特定语境进行匹配处理,根据待压缩的语境匹配数据字典;所述数据压缩处理模块23,用于根据选取的数据字典对待压缩数据进行试压缩及发送前的压缩处理;所述数据字典选fMi块24,用于统计利用不同数据字典进行数据压缩的压缩比,选择压缩比最优的数据字典;所述同步处理模块25,用于更新数据接收端保存的原有数据字典。其中,所述语境判断模块21对待压缩数据中所包含的文本信息的语境进行判断先由概率统计;漠块210统计所述待压缩数据的文本信息中每个词语的出现概率,并在选取与赋值模块211中,根据预先设定的规则选取若干词语,并按照词语间的关联情况对所述词语预先设定了语境参数值,再通过分析与逻辑运算模块212对所述选定词语的语境参数值进行差异比较,根据比较结果执行相应的逻辑运算,根据运算结果确定待压缩数据的语境;所述数据字典数据库22获取语境判断结果,根据所述语境匹配一组数据字典;然后,所述数据压缩处理模块23利用所述匹配的一组数据字典对待压缩数据进4亍试压缩;所述数据字典选取模块24统计利用不同数据字典进行数据压缩的压缩比,并选取实现最9高压縮比所对应的数据字典;利用所述同步处理才莫块25将选取的数据字典与发送端的上一待压缩数据所利用的数据字典进行差异比较,统计出数据接收端的原有数据字典需要修改或增减的部分,进而对接收端保存的原有数据字典进行替换或部分更新处理。上述模块实现其功能的具体方法在前文已述,此处不再赘述。本发明实施例才艮据判断待压缩数据中所包含的文本信息的语境,以及利用初选的数据字典对待压缩数据进行试压缩,准确的匹配数据字典。另外,在对待压缩数据执行压缩处理前,无需每次都进行选取数据字典,在一定时间内,利用同一数据字典对待压缩数据进行压缩处理,从而整体上缩短了数据压缩的时间,及时地将数据发送到接收端,此压缩过程简洁、数椐压缩率高、实现方便。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。权利要求1、一种数据压缩方法,其特征在于,所述方法包括以下步骤判断待压缩数据中所包含文本信息的语境;根据所述语境匹配数据字典,并利用该数据字典对待压缩数据进行压缩处理;对接收端的数据字典做同步处理。2、如权利要求1所述的数据压缩方法,其特征在于,所述判断待压缩数据中所包含的文本信息的语境的步骤进一步包括统计所述文本信息中每个词语的出现概率,4艮据预先设定的规则选取一组词语,通过分析并逻辑运算所述选定词语的语境参数值,根据运算结果确定待压缩数据所处的语言环境。3、如权利要求2所述的数据压缩方法,其特征在于,所述选取规则包括根据设定的选取词语的长度范围,选取出现概率相对较高的若干词语。4、如权利要求2或3所述的数据压缩方法,其特征在于,所述对选定词语的语境参数值进行分析并逻辑运算进一步包括将所述参数值进行比较处理,如果,参数值彼此差异较小,对所述选定词语的语境参数值取平均值,否则,参数值彼此差异较大,对出现概率相对较小的词语进行忽略处理,参照出现概率相对较大的选定词语的语境参数值来确定待压缩数据的语境。5、如权利要求1所述的数据压缩方法,其特征在于,所述根据所述语境匹配数据字典,并利用该数据字典对待压缩数据进行压缩处理的步骤进一步包括在数据字典数据库中,预先将一组相近似的数据字典与特定语境进行匹配处理,根据待压缩数据的语境选定与所述语境相匹配的一组相近似数据字典,匹配成功后,则利用所述选定的一组^t据字典分别对待压缩数据进行试压缩处理。6、如权利要求5所述的数据压缩方法,其特征在于,所述利用选定的一组数据字典分别对待压缩数据进行试压缩处理之后还包括统计并比较试压縮结果,选择压缩比最优的数据字典。7、一种数据压缩装置,其特征在于,所述装置包括语境判断模块,用于判断待压缩数据中所包含的文本信息的语境;数据字典数据库,用于预先将数据字典与特定语境进行匹配处理,根据待压缩数据的语境匹配数据字典;数据压缩处理模块,用于根据选取的数据字典对待压缩数据进行试压缩及发送前的压缩处理。8、如权利要求7所述的数据压缩装置,其特征在于,所述装置还包括同步处理模块,用于将选取的数据字典与发送端的上一待压缩数据所利用的数据字典进行差异比较,统计出数据接收端的原有数据字典需要修改或增减的部分,根据所述修改或增减的部分编写更新数据的指令,通过发送更新指令到接收端,对接收端的数据字典进行更新处理。9、如权利要求7所述的数据压缩装置,其特征在于,所述装置还包括数据字典选:l^莫块,用于统计利用不同数据字典进行数据压缩的压缩比,选择压缩比最优的数据字典。10、如权利要求7至9任一项所迷的数据压縮装置,其特征在于,所述装置的语境判断模块还包括概率统计模块,用于统计所述待压缩数据的文本信息中每个词语的出现概率;选取与赋值模块,用于根据预先设定的规则选取若干词语,按照词语间的语境关联情况对所述词语设定语境参数值;分析与逻辑运算模块,用于对所述选定词语的语境参数值进行差异比较,根据比较结果执行相应的逻辑运算。全文摘要本发明适用于网络游戏
技术领域
,提供了一种数据压缩方法及其装置,所述方法包括判断待压缩数据中所包含文本信息的语境;根据所述语境匹配数据字典,并利用该数据字典对待压缩数据进行压缩处理;对接收端的数据字典做同步处理。本发明实施例通过判断待压缩数据语境匹配数据字典,以及利用初选的数据字典对待压缩数据进行试压缩,不仅准确匹配数据字典以提高了数据压缩率,也将低了字典的数据量,从整体上缩短数据压缩的时间,过程实现方便。文档编号H03M7/30GK101540613SQ200910106619公开日2009年9月23日申请日期2009年4月10日优先权日2009年4月10日发明者宇关申请人:深圳市新飞扬数码技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1