一种短信压缩编码方法

文档序号:7649268阅读:323来源:国知局
专利名称:一种短信压缩编码方法
技术领域
本发明涉及手机技术领域,尤其涉及一种手机上短信压缩编码方法。

背景技术
随着人民生活水平的提高,手机已成为每个用户必不可少的通讯工具,人们通过手机可以很方便的相互联系。当然,为了实惠,有相当一部分人更乐意通过手机短信传递信息。
目前,手机短信在进行编码时是采用国际通用的7位压缩标准方式进行,每个英文字母(或标点符号)占用7位存储空间。而每条短信正文的有效载荷为140个字节,所以对于普通短信,每条最多容纳160个字母(或标点符号),如果超过了160个,则就必须拆分成多条短信进行发送。这样就增加了短信的发送数量,相应的增加了通信费用。


发明内容
本发明要解决的技术问题是提供一种短信压缩编码方法,可以将手机短信内容压缩进行发送。
为解决上述技术问题,本发明的目的是通过以下技术方案实现的。
一种短信压缩编码方法,包括步骤 a用户输入短信内容; b根据短信内容搜索词根库,并判断短信内容的所有文字是否全部属于词根库,如果是,则进入步骤c;否则,进入步骤d; c采用词根库的编码对短信进行压缩;并以8位编码格式发送信息; d不对短信内容进行压缩,以原文发送短信。
其中,步骤b中所述词根库分为一级词根库和二级词根库,所述一级词根库包含常用256个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用8位编码;所述二级词根库包含常用512个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用9位编码。
其中,步骤b中搜索词根库具体包括根据短信内容检索出词根库第一个字母开头的词根,并进行排序;根据排序好的词根,查到长度相同的匹配字串。
其中,步骤c中压缩后的短信文字第1字节高4位为词根库版本,第2字节高4位为词根库序号。
其中,步骤c之后还包括解压缩短信内容,具体为先读取第1字节和第2字节的高4位,索引到具体版本的具体一级的词根库,然后通过该版本该级别的词根库编码表检索出所有英文字母、标点符号、词根和常用单词。
其中,步骤a中所述短信内容为英文短信内容。
以上技术方案可以看出,本发明具有以下有益效果 本发明按照英文词根的使用频率,采用词根库的方式对手机短信进行压缩,使得在一定程度上为手机用户节省了通信费用,同时实现了移动增值服务商和用户的双赢的局面,用户受惠,运营商提高了自己的形象。



图1为本发明编码压缩流程图; 图2为本发明搜索流程图;
具体实施例方式 本发明的核心思想是按照英文词根的使用频率,采用词根库的方式,将词根库分为一级词根库(包含了最常用的256个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用8位编码)、二级词根库(包含了最常用的512个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用9位编码)。然后从一级词根库依次开始搜索(搜索顺序是一级词根库、二级词根库),判断该段文字中的所有文字是否全部属于某一级词根库,如果是的话,则中止搜索,然后采用该级词根库的编码进行压缩。
同样用户可以手动选择(或配置)采用哪级词根库进行编码压缩。
在压缩时,将每段压缩后的文字第1个字节高4位定义为词根库版本;第1个字节低4位保留。然后将每段压缩后的文字第2个字节高4位定义为词根库序号(我们目前的字库只有2级,如果2级字库不够用,可以考虑将字库增加到更多级,相应的每级词根库的编码占用存储空间也依次递增,每级按照1位增长);第2个字节低4位保留。
在解压缩时,首先读取第一个字节的高4位,判断出压缩方是采用了哪个版本的词根库。接着读取第2个字节的高4位,确定压缩方采用了哪一级的词根库,然后通过该版本该级别的词根库编码表检索出所有英文字母、标点符号、词根和常用单词。这样就可以根据词根库将原始信息还原出来了。
为便于对本发明进一步理解,现结合附图对本发明进行详细描述。
请参阅图1所示,本发明编码压缩流程图,包括 步骤101用户输入英文短信; 步骤102根据短信内容搜索词根库; 具体搜索流程图,请参阅图2所示,包括 步骤201初始化变量i=1; 步骤202判断变量i是否小于等于短信文本段的长度,如果是,则进入步骤203;否则,结束搜索; 步骤203步骤204从文本段的第i个字母开始搜索,检索出词根库以第i个字母开头的词根,找到N个词根,以词根长度进行排序,初始化j=i; 步骤205根据排序好的词根,从词根j开始比较文本段自第i个字母开始相同长度的字串; 步骤206判断是否找到完全匹配字串,如果是,则进入步骤207;否则,进入步骤208; 步骤207中止本次匹配搜索过程; 步骤208跳到下一个排序后的词根,j=j+1,返回步骤205; 步骤209变量i=i+本次匹配词根长度。
步骤103判断短信内容的所有文字是否全部属于词根库,如果是,则进入步骤104;否则,进入步骤106; 步骤104~步骤105采用词根库的编码对短信进行压缩;以八位编码格式发送短信; 步骤106~步骤107不对短信内容进行压缩,以英文编码格式发送短信,结束。
每一级的词根库都包含两张表,第一张表是基本表,第二张表是扩展表;下面给出一级词根库编码表例子,表1为一级词根库编码表其本表;表格中编码项为十进制数,该编码表中的英文字母、标点符号、词根和常用单词只是示例;编码值为256的转义符,意思是跟在其后的8位数据不再是该一级词根库对应的英文字母(或标点符号,或词根,或单词),而是一级词根库的扩展表中对应的英文字母(或标点符号,或词根,或单词)。在压缩时,假若英文字母(或标点符号,或词根,或单词)属于扩展表,则在编码前需要额外插入一个字节(值256);在解码时,假若遇到这个特殊的转义符字节(值为256),则需要根据扩展表进行解码。
编码值为254的首字母大写符1,意思是跟在其后的8位数据对应着一级词根库的基本表的相应编码的单词,但是该单词的首字母要换成大写的。
编码值为255的首字母大写符2,意思是跟在其后的8位数据对应着一级词根库的扩展表的相应编码的单词,但是该单词的首字母要换成大写的。
基本表编码值为253,252的项作为保留用,用来扩展以后需要加入的额外选项。
表1 表2为下一级词根库编码表扩展表 表2 表1、表2用来示范和描述本发明的压缩编码方法,实际的编码表应按照实际的英文字母、标点符号、词根和常用单词的使用频率,将常用的且长度较短的英文字母、标点符号、词根和常用单词放在基本表中,相对基本表要不太常用且长度较长的放在扩展表。
本发明压缩方法除了适用于英文外,还适用于其他印欧语系(例如英语、德语、意大利语、法语、西班牙语)的语言压缩。
以上对本发明所提供的一种短信压缩编码方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种短信压缩编码方法,其特征在于,包括步骤
a用户输入短信内容;
b根据短信内容搜索词根库,并判断短信内容的所有文字是否全部属于词根库,如果是,则进入步骤c;否则,进入步骤d;
c采用词根库的编码对短信进行压缩;并以8位编码格式发送信息;
d不对短信内容进行压缩,以原文发送短信。
2.如权利要求1所述的短信压缩编码方法,其特征在于,步骤b中所述词根库分为一级词根库和二级词根库,所述一级词根库包含常用256个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用8位编码;所述二级词根库包含常用512个英文字母、标点符号、词根和常用单词,每个英文字母、标点符号、词根和常用单词采用9位编码。
3.如权利要求1或2所述的短信压缩编码方法,其特征在于,步骤b中搜索词根库具体包括根据短信内容检索出词根库第一个字母开头的词根,并进行排序;根据排序好的词根,查到长度相同的匹配字串。
4.如权利要求3所述的短信压缩编码方法,其特征在于,步骤c中压缩后的短信文字第1字节高4位为词根库版本,第2字节高4位为词根库序号。
5.如权利要求4所述的短信压缩编码方法,其特征在于,步骤c之后还包括解压缩短信内容,具体为先读取第1字节和第2字节的高4位,索引到具体版本的具体一级的词根库,然后通过该版本该级别的词根库编码表检索出所有英文字母、标点符号、词根和常用单词。
6.如权利要求1所述的短信压缩编码方法,其特征在于,步骤a中所述短信内容为英文短信内容。
全文摘要
本发明公开了一种短信压缩编码方法,包括步骤a用户输入短信内容;b根据短信内容搜索词根库,并判断短信内容的所有文字是否全部属于词根库,如果是,则进入步骤c;否则,进入步骤d;c采用词根库的编码对短信进行压缩;并以8位编码格式发送信息;d不对短信内容进行压缩,以原文发送短信。本发明按照英文词根的使用频率,采用词根库的方式对手机短信进行压缩,使得在一定程度上为手机用户节省了通信费用,同时实现了移动增值服务商和用户的双赢的局面,用户受惠,运营商提高了自己的形象。
文档编号H04W4/14GK101132550SQ20071007730
公开日2008年2月27日 申请日期2007年9月19日 优先权日2007年9月19日
发明者斌 何 申请人:康佳集团股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1