多层锚点提取方法及装置的制作方法

文档序号:7689775阅读:151来源:国知局
专利名称:多层锚点提取方法及装置的制作方法
技术领域
本发明涉及手机领域,尤其涉及手机短信的多层锚点提取技术。
技术背景当前,大多数的手机用户都会使用手机来发送短信息,手机的 短信息服务传递及时,方便灵活,即可传情达意,也能联络通知, 还能对重要信息保存备案,因而深受人们的喜爱。习惯用短信息的 人都知道,能够轻松地将信息发送者的手机号码以及短信息中包含 的电话号码保存到自己话机的通讯录中,方便地保存短信中包含的Email地址或者向其发送Email,甚至对短信内容中包含的URL地 址进行快速连接和保存书签等操作。通常,基于锚点提取的提取电话号码、Email地址、URL地址 可以分为三部分内容提取、聚焦高亮显示和使用聚焦项。内容提取作为锚点提取的核心部分,主要是通过扫描整个短信 字符,结合RFC规范(规定电子邮件的标准格式的RFC 822 -Standard for the format of ARPA Internet text messages,以及规定统一 资源才示i口、才寻的RFC 2396 - Uniform Resource Identifiers (URI): Generic Syntax.)中相应的(电i舌号码、Email和URL地址)_浯法 规则对其中的有效字符串进行提取,并以某种方式存储提取结果。聚焦高亮显示则根据读取到的提取结果,在手机阅读接收短信界面中,判断相应的内容(电话号码、Email地址和URL地址)的 起始和终点位置,对该部分内容聚焦并高亮显示,〗吏用户可以选择 是否对该内容进行操作以及如何操作。同时要实现在多项可选内容 之间切换,如短信内容中包含多个电话号码以及Email地址和URL 地址,则用户可对每条内容进行操作, 一般由方向键按照顺序实现 前后切换。使用聚焦项是指手机通过平台的菜单功能对用户按键触发的事 件做出反应,实现对聚焦内容的具体操作。用户通过功能键调用可 选的操作项,通过方向键选择要进行的操作,如对电话号码进行呼 叫、保存、发送短信、发送彩信等操作,对Email地址进行保存和 发送mail等操作,对URL地址进行连接和保存书签等操作。目前大多数手机都实现了锚点提取的功能。然而效果并不尽人 意,究其原因主要是对提取规则理解单一、没有容错机制和智能化 程度不够。短信内容是由用户编辑的,在编辑过程中每个人习惯又 有所不同。尤其在短信中同时包含电话号码、Email地址和URL地 址时,三者之间、甚至是同一类型的两条提取内容之间都有可能存 在着重叠交叉的现象。比如URL中包含类似电话号码的数字串、 Email地址中包含类似URL地址的后缀等等。因此,需要一种多层锚点提取的解决方案,能够解决上述相关 技术中的问题。发明内容本发明旨在在锚点提取的基础上,实现容错机制,对出现交叉 提取的内容进行智能判断,尽可能多的提取内容供用户选择使用。根据本发明的一个方面,提供了一种多层锚点提取方法,包括以下步骤步骤一,扫描短消息文本并根据预定的规则提取信息; 步骤二,根据提取的信息的类型创建一个或多个链表,并将信息存 储到一个或多个链表中;以及步骤三,判断信息之间是否有重叠部 分,并根据判断结果以及根据预定的整合规则将一个或多个链表整 合为至少一个链表。步骤三包括以下步骤如果判断出信息之间没有重叠,则根据 预定的整合规则将一个或多个链表整合为至少一个链表,否则,根 据预定的整合规则将一个或多个链表整合为多于一个链表。步骤三还包括以下步骤将具有彼此相互重叠部分的信息分别 存储到多于 一个链表中的不同链表中;以及根据预定的算法确定提 取的信息是否为非法提取信息,如果是,则将其删除。上述方法还包4舌以下步-骤确定至少一个链表的显示顺序;以 及按照确定的顺序显示存储在至少 一个链表中的所提取的信息。预定的提取规则包括容错机制,信息包括地址信息,以及地址 4言息的类型包4舌电i舌号石马、Email i也址、和URL ;也址。根据本发明的另一个方面,提供了一种多层锚点提取装置,包 括提取模块,用于扫描短消息文本并根据预定的规则提取信息; 链表创建及存储模块,根据提取的信息的类型创建一个或多个链表, 并将信息存储到 一个或多个链表中;以及判断整合模块,判断信息 之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将 一个或多个链表整合为至少 一 个链表。链表创建及存储模块包括链表创建单元,用于根据提取的信 息的类型创建一个或多个链表;以及存储单元,用于将提取的信息 存储到一个或多个链表中。7判断整合模块包括判断单元,用于判断信息之间是否有重叠 部分;以及整合单元,用于根据判断结果以及根据预定的整合规则 将一个或多个链表整合为至少一个链表。本发明为简单、快速、全面、灵活地提取短信内容中的电话号 码、Email地址和URL地址l是供了 一种有效的途径。本发明的其它特征和优点将在随后的i兌明书中阐述,并且,部 分地从说明书中变得显而易见,或者通过实施本发明而了解。本发 明的目的和其他优点可通过在所写的说明书、权利要求书、以及附 图中所特别指出的结构来实现和获得。


此处所说明的附图用来4是供对本发明的进一步理解,构成本申 请的一部分,本发明的示意性实施例及其说明用于解释本发明,并 不构成对本发明的不当限定。在附图中图1示出了根据本发明一个实施例的多层锚点提取方法的流程图;图2示出了根据本发明一个实施例的多层锚点提取装置的框图;以及图3示出了根据本发明另一个实施例的多层锚点提取方法的流 程图。
具体实施方式
下面将结合附图来详细说明本发明的实施例。图1示出了根据本发明实施例的多层锚点提取方法的流程图。参照图1,根据本发明实施例的多层锚点提取方法包括以下步骤 步骤S102,扫描短消息文本并根据预定的规则提取信息;步骤S104, 根据提取的信息的类型创建一个或多个链表,并将信息存储到一个 或多个链表中;以及步骤S106,判断信息之间是否有重叠部分,并 根据判断结果以及根据预定的整合规则将一个或多个链表整合为至 少一个链表。步骤S106包括以下步骤如果判断出信息之间没有重叠,则 根据预定的整合规则将一个或多个链表整合为至少 一个链表,否则, 根据预定的整合规则将一个或多个链表整合为多于一个链表。步骤S106还包括以下步骤将具有彼此相互重叠部分的信息 分别存储到多于一个链表中的不同链表中;以及根据预定的算法确 定提取的信息是否为非法提取信息,如果是,则将其删除。上述方法还包4舌以下步驶《确定至少一个链表的显示顺序;以 及按照确定的顺序显示存储在至少 一个链表中的所提取的信息。预定的提取规则包括容错机制,信息包括地址信息,以及地址 信息的类型包括电话号码、Email地址、和URL地址。图2示出了根据本发明实施例的多层锚点提取装置的框图。参 照图2,根据本发明实施例的多层锚点提取装置200包括提取模 块202,用于扫描短消息文本并根据预定的规则提取信息;链表创 建及存储模块204,根据提取的信息的类型创建一个或多个链表, 并将信息存储到一个或多个链表中;以及判断整合模块206,判断 信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规 则将一个或多个链表整合为至少一个链表。链表创建及存储模块204包括链表创建单元,用于根据提取 的信息的类型创建一个或多个链表;以及存储单元,用于将提取的 信息存储到一个或多个链表中。判断整合才莫块206包括判断单元,用于判断信息之间是否有 重叠部分;以及整合单元,用于根据判断结果以及根据预定的整合 头见则将一个或多个链表整合为至少一个链表。下面参照图3来详细描述本发明的另一个实施例。本实施例的多层锚点提取的方法包括以下步骤步骤S302,定义电话号码、Email地址和URL地址的提取规则, 有效字符及字符段(参考前文所述的RFC规范);步骤S304,分别才艮据电话号码、Email地址和URL地址的语法 扫描整个短信文本,提取相应内容,生成对应的链表;步骤S306,整合生成的三个链表,4艮据整合头见则删除可确定的 非法提耳又;步骤S308, 一艮据链表的交叉结构,确定并组合分层显示结构;以及步骤S310,对菜单中use highlight的管理和控制。实施例的主要包含两部分, 一是提耳又电话号码、Email地址和 URL地址并生成对应的链表;二是对链表进行整合,使之合理的组 合并显示给用户。在该实施例中,对提取内容按照单链表的方式存储,而三种不 同内容是分别提取的。提取的过程主要是逐字符扫描,按照对应的语法进行判别。如果确定一个字符串是要提取的内容,则在链表中 创建一个新的节点,节点包含类型、起点、长度、内容等信息。链 表头节点则包含整个链表中节点个数、起始节点、终止节点等信息。 链表中各个节点按照其起点在短信中出现的顺序进行排序,以便链 表整合以及用户根据方向键顺序聚焦显示。链表的整合主要是针对不同链表或者同一链表中内容的交叉情况而设计的,也就是说经过提取,电话号码跟URL地址可能是有重 叠部分的,同样电话号码跟Email地址之间、Email地址跟URL地 址之间也可能存在着重叠部分。举例而言,比如说一个长8位的数字串出现在一个URL地址中,在电话号码冲是取时这8位的数字串作 为一个电话号码提取出来,而在URL提取使包含这8位数字串的整 个字符串又作为 一个URL地址提取出来,于是生成的电话号码链表 跟URL链表就有重叠部分。目前大多数手机都是按照某个优先级进 行取舍,比如默认URL的提取级别高于电话号码,则这8位的数字 串就不作为电话号码使用,仅仅是当作URL的一部分。然而这种才是 取显然并不能满足用户的要求,因为用户可能需要这8位字符串作 为一个电话号码存4诸起来的。本系统采用的链表整合方式既按照设 计好的整合规则,对三个提取链表进行整合,根据链表结构的特点 最终生成一条或者两条链表,包含所有对用户来说可能是有用信息 的提取内容,并且每个链表中没有节点在位置上的重叠交叉。菜单中use highlight选项需要根据最终生成的链表个数增加相 应的菜单项。对于一条链表的情况,按照链表中内容的先后顺序高 亮显示对应的内容,方向4建控制向前或向后选4奪,用户可以对某个 需要使用的内容进行use highlight操作。对于两条链表的情况,首 先4姿照连表中内容的先后顺序高亮显示对应内容,当用户通过方向 键浏览整个短信文本没有发现自己想要聚焦的内容时,可以通过菜 单选择第二条链表进行浏览,如同第一条链表一样,按照顺序进行高亮显示,方向键控制向前或向后浏览,遇到需要使用的内容即可做use highlight操作。综上所述,本实施例主要分为两大块提取内容生成链表,整 合链表。其中才是取内容采用RFO见范并通过扫描短信内容对电话号 码、Email地址、URL地址进行提取,整合链表则是对提取出的内 容进行准确的容错处理以及重叠内容的完整显示。通过采用以上的 才支术,本发明实现对短信中电话号码、Email地址和URL地址的快 速、全面、灵活提取,并在阅读短信的用户界面合理地显示所有提 取到的内容,极大地方便了用户对提取内容的操作。本发明为简单、快速、全面、灵活地提取短信内容中的电话号 码、Email地址和URL地址提供了一种有效的途径。以上所述仅为本发明的优选实施例而已,并不用于限制本发明, 对于本领域的才支术人员来i兑,本发明可以有各种更改和变化。凡在 本发明的精神和原则之内,所作的任何修改、等同替换、改进等, 均应包含在本发明的保护范围之内。
权利要求
1.一种多层锚点提取方法,其特征在于,包括以下步骤步骤一,扫描短消息文本并根据预定的规则提取信息;步骤二,根据提取的所述信息的类型创建一个或多个链表,并将所述信息存储到所述一个或多个链表中;以及步骤三,判断所述信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将所述一个或多个链表整合为至少一个链表。
2. 根据权利要求1所述的方法,其特征在于,所述步骤三包括以 下步骤如果判断出所述信息之间没有重叠,则根据所述预定的整 合规则将所述一个或多个链表整合为至少一个链表,否则,才艮 据所述预定的整合夫见则将所述一个或多个《连表整合为多于一 个链表。
3. 根据权利要求2所述的方法,其特征在于,所述步骤三还包括 以下步骤将具有^:此相互重叠部分的所述信息分别存储到所述多 于一个链表中的不同链表中。
4. 才艮据权利要求3所述的方法,其特征在于,所述步骤三还包括 以下步骤根据预定的算法确定提取的所述信息是否为非法提取信 息,如果是,则将其删除。
5. 根据权利要求4所述的方法,其特征在于,还包括以下步骤确定所述至少一个链表的显示顺序;以及按照确定的顺序显示存储在所述至少一个4连表中的所4是 取的信息。
6. 根据权利要求1至5中任一项所述的方法,其特征在于,所述 预定的提取规则包括容错机制。
7. 才艮据斥又利要求1至5中任一项所述的方法,其特征在于,所述 信息包括地址信息。
8. 根据权利要求7所述的方法,其特征在于,所述地址信息的类 型包括电话号码、Email地址、和URL地址。
9. 一种多层锚点提取装置,其特征在于,包括提取模块,用于扫描短消息文本并根据预定的规则提取信自、'链表创建及存储模块,根据提取的所述信息的类型创建一个或多个链表,并将所述信息存储到所述一个或多个链表中; 以及判断整合模块,判断所述信息之间是否有重叠部分,并根 据判断结果以及才艮据预定的整合^L则将所述一个或多个链表 整合为至少一个链表。
10. 根据权利要求9所述的装置,其特征在于,所述链表创建及存 储模块包括链表创建单元,用于根据提取的所述信息的类型创建一个 或多个链表;以及存储单元,用于将提取的所述信息存储到所述一个或多个 链表中。
11. 根据权利要求10所述的装置,其特征在于,所述判断整合模块包括判断单元,用于判断所述信息之间是否有重叠部分;以及整合单元,用于根据判断结果以及根据预定的整合规则将 所述一个或多个链表整合为至少 一个链表。
全文摘要
本发明公开了多层锚点提取方法及装置,该方法包括以下步骤步骤一,扫描短消息文本并根据预定的规则提取信息;步骤二,根据提取的信息的类型创建一个或多个链表,并将信息存储到一个或多个链表中;以及步骤三,判断信息之间是否有重叠部分,并根据判断结果以及根据预定的整合规则将一个或多个链表整合为至少一个链表。本发明为简单、快速、全面、灵活地提取短信内容中的电话号码、Email地址和URL地址提供了一种有效的途径。
文档编号H04Q7/22GK101247603SQ20081008409
公开日2008年8月20日 申请日期2008年3月26日 优先权日2008年3月26日
发明者敏 蒋, 丹 薛, 斌 陈 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1