终端短信息搜索方法及其装置的制作方法

文档序号:6578970阅读:221来源:国知局
专利名称:终端短信息搜索方法及其装置的制作方法
技术领域
本发明涉及无线终端纟支术4页域,具体而言,涉及一种终端短信 息搜索方法及其装置。
背景技术
短信息目前,诸如手机等的移动终端设备都支持短信息存储功 能短信息,有的还提供了搜索功能,但是随着短信息存储量的增加, 也提高了短信息搜索功能实现的难度。通常情况下,在移动终端内, 短信息的排序方式是基于时间排列的,用户如果需要查找历史短信 息,则往往需要从信息队列的两端逐个查看,查找效率较低。另一 方面,很多移动终端能够支持超过一千个汉字的短信息,如果需要在这类短信息中搜索某些关#:词,采用手动方式查找实现难度较大。相关技术中已经有一些短信息搜索的方法,例如,在标题为《一 种查找手机短信的方法》的中国专利申请中,提供了如下方法将 手机存储器中的信息读取到手机内存后查找用户所需短信;然后搜 索引擎根据用户输入查询条件对所有短信息进行搜索,搜索到满足 查询条件的短信息,获取满足查询条件的短信内容的记录号并将这 些短信息内容保存在一緩存文件中。该方法在查找的过程中查找信 息量比较大,查找操作过程比较复杂,而且对于检索的模糊信息无 法进行搜索。包括上述方法在内的目前所采用的短信息搜索方法在^f吏用上至少存在如下问题1、大容量信息存在的情况下,由于采用信息匹配 方式,造成4臾索效率4交^f氐;2、对于信息的协i义部分和用户凄欠据部分 无法提取和分别处理,用户实际搜索过程的信息定位困难;3、仅支 持关键字搜索,不支持非匹配搜索,检索的模糊信息无法进行搜索, 影响了用户搜索的使用效果。发明内容针对相关技术中存在的大容量信息搜索效率低、搜索过程的信 息定位困难、模糊信息无法进行搜索的问题而提出本发明,为此, 本发明的主要目的在于提供一种改进的终端短信息搜索方案,以解 决上述问题中的至少之一。为了实现上述目的,才艮据本发明的一个方面,才是供了一种终端 短信息4臾索方法。根据本发明的终端短信息搜索方法包括对短信息进行解析,构建索引数据库;接收输入的搜索内容,并根据搜索内容在索引数据库中搜索相应的短信息。优选地,对短信息进行解析,构建索引数据库还包括对短信 息数据进行解析和处理,得到文本内容;对文本内容进行分词得到 分词数据,并基于分词数据建立索引;将分词数据和索引存储到索 引数据库。优选地,上述短信息凄史据还包括短信息协i义头和用户^:据,对 短信息协i义头和用户凄t据进4亍解析和处理还包4舌对用户凝:据进4亍 解码;对解码后的用户数据进行内容分析,其中,内容分析包括 对不同类型的用户数据的字段和内容分别进行标识。优选地,存储到索引数据库还包括将建立的索引写入索引文 件,并将索引文件存储到索引数据库。优选地,对短信息协_汉头进4亍处理还包4舌过滤4卓短信息中用 于控制短信息网络传输的数据。优选地,根据搜索内容在索引数据库中搜索相应的短信息还包 括对搜索内容进行处理,并根据处理后的搜索内容在索引数据库 中搜索相应的短信息,其中,处理包括对搜索内容进行分词处理。优选地,上述方法还包括采用设置合并因子的方式对索引数 据库进4f更新。为了实现上述目的,根据本发明的另一方面,提供了一种终端 短信息搜索装置。根据本发明的终端短信息搜索方法还包括解析模块,用于对 短信息进行解析得到解析数据;索引数据库,用于保存解析数据; 接收模块,用于接收检索关键词;检索模块,用于根据检索关键词 从索引数据库中进行4企索。优选地,上述解析;漠块还包括解析子才莫块,对用户数据进行 解码;以及对解码后的用户数据进行内容分析,其中,内容分析为 对不同类型的用户数据进行字段和内容分别标识,才艮据用户数据的 不同来定义不同的类型。分词模块,从文本内容提取短信息协议头 和用户凄t据以及建立索引。优选地,上述解析才莫块还包括过滤子才莫块,用于/人解析数据 中过滤掉用于控制短信息网络传输的数据。通过本发明,采用对短信息进行解析,构建索引数据库;接收 输入的搜索内容,并根据搜索内容在索引数据库中搜索相应的短信 息的方法及其装置,解决了大容量信息搜索效率低、搜索过程的信 息定位困难、模糊信息无法进行搜索的问题,进而达到了对移动终 端保存的短信息进行快速搜索,根据用户输入的信息,快速返回用 户需要的目标短信和用户凝:据的效果。


此处所说明的附图用来提供对本发明的进一步理解,构成本申 请的一部分,本发明的示意性实施例及其i兌明用于解释本发明,并 不构成对本发明的不当限定。在附图中图1是根据本发明实施例的终端短信息搜索方法的流程图。图2是根据本发明实施例的本发明解析器处理信息功能流程图;图3是根据本发明实施例的分词器处理流程图; 图4是根据本发明实施例的用户搜索功能流程图; 图5是根据本发明实施例的索引数据库更新流程图。 图6是根据本发明实施例的终端短信息搜索装置的结构框图。
具体实施方式
功能扭克述考虑到相关技术中大容量信息搜索效率低、搜索过程的信息定 位困难、模糊信息无法进行搜索的问题,本发明实施例提供了一种中,在终端i殳置一索引凝:据库,通过用户输入的搜索关键词在索引数据库中进行搜索,相比于现有技 术,可以纟是高纟臾索的效率。优选地,为了实现本发明的短信息搜索方法,可以在终端上设 置功能4建或者菜单,用户通过编辑冲医输入搜索关键词,以启动查询 过程,终端内部的搜索程序在搜索索引数据库完成搜索后,得到结 果短信息列表,用户可以选择列表中的具体信息,以查看其具体内六谷。需要i兌明的是,在不冲突的情况下,本申i青中的实施例及实施 例中的特4正可以相互组合。下面将参考附图并结合实施例来详细i兌 明本发明。方法实施例才艮据本发明的实施例,提供了一种终端短信息4臾索方法。下面 将结合实例和附图对本发明实施例的实现过程进行详细描述。图1是才艮据本发明实施例的终端短信息4臾索方法的流程图。如图1所示,该终端短信息搜索方法包括步骤S101至步骤S102,下 面将参照附图来详细描述该方法步骤SIOI,对短信息进行解析,构建索引数据库形成索引数据 库,优选地,该解析可以是终端对短信息进行解码和分析,该步骤 可以通过解析器来实现;步骤S102,接收输入的搜索内容,并根据所述搜索内容在所述 索引数据库中搜索相应的短信息。图2是才艮据本发明实施例的解析器处理的功能流程图,该流程 主要对用户的短信息数据进行解析和处理,如图2所示,具体操作 如下述的步骤S201至步骤S204:步骤S201 ,终端接收到新信息或者用户在本地保存信息到终端 内存以后,解析器通过读取文本的方式打开内存中的信息协议数据 单元(Protocol Data Unit,简一尔为PDU )文4牛;步骤S202,通过预处理对信息PDU进行解码,从PDU文件头 开始,逐行处理数据,判断短信息的数据是否属于用户数据,如果 属于用户数据则提交解码器进行解码,否则直接丢弃而不进行解码;步骤S203 ,解析器按照短信息协议解析用户数据部分的内容, 包括信息的基本字段和扩展字段。短信息的号码段采用的编码方式 是二进制编码的十进制(Binary Coded Decimal,简称为BCD)码, 经过解析后转换成正常的号码,英文的短信息一般是压缩方式编码, 而中文信息使用的是Unicode码(万国码),解析器通过判断信息的 类型和编码方式进;f亍解码,解码后的凄t据进;f亍内容分析;步骤S204,内容分析的过程主要用于对不同类型的数据的字段 和内容分别进行标识,才艮据凄t据的特点定义不同的类型。如用户号 码标识为类型1,信息的时间戳标识为类型2等,优选地,标识好 的文本数据组合后转发给分词器进行处理。图3是根据本发明实施例的分词器处理的流程图,如图3所示, 该处理流程包括如下的步骤S301至步骤S302:步骤S301,分词器接收到解析器处理完成的数据后,首先进行 预处理操作。根据文本数据中的不同类型判断是否需要进行分词。 在分词器中已经预定义了规则,分词器根据预定义的规则判断字段 是否需要进行分词。如果需要分词则将数据发给分词器进行分词,否则直接提交到索51数据库中处理。定义电话号码和时间不参与分 词,分词器解析数据过程中如果判断数据字段等于用户号码或者短 信息时间戳,则将这部分数据直接发给索引数据库保存。索引数据库定义的参考格式包括如下的字段内容Field.Number,用于保存 用户的号石马;Field.Time,用于^f呆存4言息的时间戳;Field.Subject, 切分词索引并存储,保存主题及标题等信息;Field.Unlndexed,用 于不索引,只存储的内容,如保存文件路径;Field.Text,切分词索 引并存储,保存用户数据内容。除基础字段外,还可根据搜索的需 要定义补充字段,如不用于返回显示,但需要进行检索关键词的信 息说明信息等;步骤S302,分词器将需要分词处理的数据进行拆分,对于英文 数据,直接根据空格进行分词。对于中文信息,因为中文字符之间 没有间隔,因此需要将语句中使用自动切分算法,将单词按照2元 语法方式切分出来,比如"我去银行了"。分词处理为"我去去银 银行行了"。这样切分的好处是不需要建立专门的字典表,实现比 较简单。基于2元切分后的索引一般大小和源文件差不多,而对于 英文,索引文件一般只有原文件的40%左右。图4是根据本发明实施例的用户搜索功能的实现流程图。如图 4所示,该用户搜索功能流程包括如下的步骤S401至步骤S404:步骤S401,用户通过终端菜单丰餘入查询的内容,3口移动终端号 码,词语或者时间;步骤S402,根据用户输入信息的类型进行判断,是否需要进行 分词处理。如果需要分词则由分词器进行分词处理,否则直接提交 索引数据库进行查询。比如,用户输入了连续的号码"13311232123", 分词预处理过程根据分词规则判断输入内容为手机号码,不需要参与分词,直4妾提交查询。分词器分词的算法仍然按照2元语法方式 进行分词,逐词进4于处理;步骤S403,经过分词处理的数据或者不需要分词的数据,提交 索引数据库进行查询,搜索完成后,将结果集合按照出现的次数;步骤S404,得到索引数据库返回的结果集后,通过结果集中的 信息标识码(Identification,简称为ID),获取到相关的短信息并将 信息与搜索相关的内容以列表的方式显示给用户,用户可以选择相 应的短信息进4于全文查看。图5是根据本发明实施例的索引数据库更新流程图。该索引数 据库更新流程是为了减少索引数据库输入/输出(input/output,简称 为I/O)更新的频率,通过在生成临时索引文件,减少4交大文件更 專斤的时间和凌丈率如图5所示,该索引数据库更新流程包括如下的步骤S501至 步骤S502:步骤S501,索引数据库建立完成后,当检测到用户信息数据发 生了变更,如接收到了新的短信息或者用户修改了本地信息的内容, 更新索引任务检查当前临时索引信息的数量是否等于合并因子。当小于合并因子的情况下,由解析器和分词器处理流程创建新的索引 并保存本地的临时索引中;步骤S502,如果信息的数目达到了合并因子上限,则将生成的 临时索引更新到本地索引库中,更新过程通过文件操作方式实现, 文件操作完成后需要关闭索引文件。装置实施例根据本发明的实施例,提供了 一种终端短信息搜索装置。图6是4艮据本发明实施例的终端短信息:溲索装置的结构框图。 如图6中所示,该装置包括解析模块2、索引数据库4、接收模块 6和检索模块8。下面对上述结构进行描述解析模块2,用于对短信息进行解析并输出文本内容以及从文 本内容提取短信息协议头和用户凄史据以及建立索引;索引凄史据库4, 用于保存短信息协议头、用户数据以及索引信息;接收^f莫块6,用 于接收用户输入的检索关键词200;检索模块8,用于根据检索关键 词200从索引数据库4中进行4全索。下面描述才艮据本发明实施例的终端短信息搜索装置的各结构连 接关系解析模块2,位于终端20内,终端20接收到新信息或者 用户在本地保存信息到终端后,解析模块2用于对短信息100进行 解析并输出文本内容以及从文本内容提取短信息协议头和用户数据 以及建立索引;索引数据库4,连接至解析模块2,用于保存短信息 协议头、用户数据以及索引信息;接收模块6,用于接收用户输入 的检索关键词200;检索模块8,连接至索引数据库4和接收模块6, 用于根据检索关键词200从索引数据库4中进行检索。优选地,解析才莫块还可以包括解析子才莫块22 (可以对应于方 法实施例中的解析器),对用户数据进行解码;以及对解码后的用户 数据进行内容分析,其中,内容分析为对不同类型的用户数据进行 字段和内容分别标识,根据用户数据的不同来定义不同的类型。分 词模块24 (可以对应于方法实施例中的分词器),从文本内容提取 短信息协议头和用户凄史据以及建立索引。优选地,在解析模块2中还包括过滤子模块26,过滤掉短信 息协议头中用于控制短信息网络传输的数据。下面将参照图6来描述解析模块2中各子模块之间的连接关系 解析子才莫块22,对短信息100进行解码和内容分析;分词才莫块24, 连接至解析子模块22,用于对解析后的数据进行分词;过滤子模块 26,连接至解析子模块22和分词模块24,用于过滤掉短信息协议 头中用于控制短信息网络传输的数据。从以上的描述中可以看出,本发明实现了对移动终端保存的短 信息进行快速搜索,根据用户输入的信息,快速返回用户需要的目 标短信和用户凄欠据的效果。以上所述〗又为本发明的优选实施例而已,并不用于限制本发明, 对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的4呆护范围之内。
权利要求
1.一种终端短信息搜索方法,其特征在于,包括对短信息进行解析,构建索引数据库;接收输入的搜索内容,并根据所述搜索内容在所述索引数据库中搜索相应的短信息。
2. 根据权利要求1所述的方法,其特征在于,所述对短信息进行 解析,构建索引数据库包括对短信息数据进行解析和处理,得到文本内容;对所述文本内容进行分词得到分词数据,并基于所述分词 数据建立索引;将所述分词数据和所述索引存储到所述索引数据库。
3. 根据权利要求2所述的方法,所述短信息数据包括短信息协议 头和用户数据,其特征在于,对所述短信息协议头和所述用户 数据进行解析和处理包括对所述用户凄t据进4亍解码;对解码后的所述用户数据进行内容分析,其中,所述内容 分析包括对不同类型的用户翁:据的字革殳和内容分别进4亍标 识。
4. 根据权利要求2所述的方法,其特征在于,所述存储到所述索 引数据库包括将建立的所述索引写入索引文件,并将所述索 《I文件存储到所述索引数据库。
5. 根据权利要求3所述的方法,其特征在于,对所述短信息协议 头进行处理包括过滤掉所述短信息中用于控制短信息网络传 输的数据。
6. 根据权利要求1所述的方法,其特征在于,才艮据所述搜索内容 在所述索引数据库中搜索相应的短信息还包括对所述搜索内容进行处理,并根据处理后的搜索内容在所 述索引数据库中搜索相应的短信息,其中,所述处理包括对 所述搜索内容进4亍分词处理。
7. 才艮据权利要求1-6中4壬一项所述的方法,其特征在于,所述方 法还包括采用设置合并因子的方式对所述索《1数据库进行更新。
8. —种终端短信息搜索装置,其特征在于,包括解析模块,用于对短信息进行解析得到解析数据; 索引数据库,用于保存所述解析数据;接收模块,用于接收检索关键词;检索模块,用于根据所述检索关键词从所述索引数据库中 进行检索。
9. 根据权利要求8所述的装置,其特征在于,所述解析模块包括解析子才莫块,对所述用户数据进行解码;以及对解码后的 所述用户数据进行内容分析,其中,所述内容分析为对不同类 型的用户数据进行字段和内容分别标识,根据所述用户数据的 不同来定义不同的类型;分词才莫块,从所述文本内容提取短信息协议头和用户数据 以及建立索引。
10. 根据权利要求8所述的装置,其特征在于,所述解析模块还包 括过滤子模块,用于从所述解析数据中过滤掉用于控制所述 短信息网络传输的数据。
全文摘要
本发明公开了一种终端短信息搜索方法及其装置,该方法包括对短信息进行解析,构建索引数据库;接收输入的搜索内容,并根据搜索内容在索引数据库中搜索相应的短信息。通过本发明解决了大容量信息搜索效率低、搜索过程的信息定位困难、模糊信息无法进行搜索的问题,进而达到了对移动终端保存的短信息进行快速搜索,根据用户输入的信息,快速返回用户需要的目标短信和用户数据的效果。
文档编号G06F17/30GK101600023SQ200910151538
公开日2009年12月9日 申请日期2009年6月30日 优先权日2009年6月30日
发明者刘长山, 石小雨 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1