一种生成传真索引的方法、报文分析装置和传真检索系统的制作方法

文档序号:6585779阅读:225来源:国知局
专利名称:一种生成传真索引的方法、报文分析装置和传真检索系统的制作方法
技术领域
本发明属于传真技术领域,尤其涉及一种生成传真索引的方法、报文分析装置和 传真检索系统。
背景技术
在经济全球化的今天,很多跨国跨地区的业务不可能当面办理,由于传真特有的 法律效力,可以使得大量的订单、合同等通过传真签署,而许多跨地区的业务甚至需要多个 子公司的协作完成;另外对这些大公司来说,很重要的一个办公方式是公司内部资料、通 知、命令等信息通过传真方式进行交互。在这种应用中,公司需要对所有的办公传真统一存档、分类管理,到目前为止,传 真的分类和检索都是靠人力实现的,浪费了大量的人力资源,效率低下,因此需要实现传真 的自动分类,从而大幅度地降低人力成本,提高工作效率。

发明内容
有鉴于此,本发明的目的在于提供一种生成传真索引的方法、报文分析装置和传 真检索系统。本发明实施例提供的一种生成传真索引的方法,包括对传真报文进行版面分析, 提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述 标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。进一步的,所述进行版面分析包括提取所述传真报文的页眉部分;所述提取传 真报文中的特征信息包括提取所述传真报文的页眉部分中的号码、收发时间和收发单位 fn息o进一步的,所述进行版面分析包括将所述传真报文正文部分划分成图标图像区 域、文本图像区域和表格图像区域。进一步的,所述提取传真报文中的特征信息包括从所述图标图像区域中提取图 标特征信息。进一步的,所述提取传真报文中的特征信息包括从所述文本图像区域中提取关
键字信息。进一步的,所述提取传真报文中的特征信息包括从所述表格图像区域中提取表 格特征信息。本发明实施例还提供一种报文分析装置,包括版面分析模块,用于对传真报文进 行版面分析;特征信息提取模块,用于提取所述传真报文中的特征信息;索引生成模块,用 于根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引, 以便用户根据所述标签查找相对应的传真报文。进一步的,所述版面分析模块具体用于提取所述传真报文的页眉部分,并将所述 传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
进一步的,所述特征信息提取模块包括页眉信息识别子模块,用于提取传真报文 的页眉部分中的号码、收发时间和收发单位信息;图标识别子模块,用于从所述图标图像区 域中提取图标特征信息;关键词识别子模块,用于从所述文本图像区域中提取关键字信息; 表格识别子模块,用于从所述表格图像区域中提取表格特征信息。本发明实施例还提供一种传真检索系统,包括所述的报文分析装置,还包括中心 服务器、传真报文存储单元、数据库、特征信息存储单元,特征信息描述单元、属性表、传真 检索单元和用户接口单元;其中,所述传真报文存储单元用于存储经过所述中心服务器接 收和分发的传真报文;所述特征信息描述单元用于从所述报文分析装置分析得到的特征信 息中生成特征描述符;所述特征信息存储单元用于与所述传真报文数据相关联存储所述传 真报文的特征描述符;所述属性表为基于传真报文的特征信息生成的属性表;所述传真检 索单元,用于接收输入的与所述特征信息相关的检索条件,并对所述属性进行检索,生成满 足所述检索条件的传真报文。本发明通过对传真建立多重标签的方法,方便了传真的管理和检索,节约了大量 的人力资源。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他的附图。图1是本发明实施例一提供的一种生成传真索引的方法的流程图;图2是本发明实施例二提供的一种报文分析装置的示意图;图3是本发明实施例三提供的一种传真检索系统的示意图;图4是本发明实施例提供的传真检索系统应用场景的示意图;图5是利用本实施例提供的传真检索系统对传真报文进行检索的示意图。
具体实施例方式为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例 中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是 本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员 在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。实施例一本发明实施例一提供一种生成传真索引的方法,如图1所示,该方法包括步骤S101 对传真报文进行版面分析;步骤S102 提取所述传真报文中的特征信息;步骤S103 根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述 传真报文的索引,以便用户根据所述标签查找相对应的传真报文。其中传真报文的版面通常可以分为页眉和正文部分。因此步骤S101中对传真报 文进行版面分析可以包括提取所述传真报文的页眉部分,并将所述传真报文正文部分划
5分成图标图像区域、文本图像区域和表格图像区域。这样,步骤S102中提取报文中的特征信息可以包括步骤S 1021 提取传真报文的页眉部分中的号码、收发时间和收发单位信息;其 中收发时间的格式可以是年月日小时分秒,号码包括主被叫号码,收发单位信息可以是传 真业务所属公司名称。步骤S1022 从图标图像区域中提取图标特征信息;上述图标特征信息可以是徽标信息。步骤S1023 从文本图像区域中提取关键字信息;步骤S1024 从表格图像区域中提取表格特征信息。需要说明的是,上述步骤S1021-S1024的执行顺序没有限制,并且不必要限定全 部执行,即可以执行其中的任意步骤的任意组合。实施例二本实施例相应提供一种报文分析装置,如图2所示,该装置200包括版面分析模块201,用于对传真报文进行版面分析;特征信息提取模块202,用于对提取所述传真报文中的特征信息;索引生成模块203,用于根据所述提取的特征信息为传真报文建立标签,将所述标 签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。其中,版面分析模块201可以具体用于提取传真报文的页眉部分,并将所述传真 报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。而特征信息提取模块 202可以包括页眉信息识别子模块2021,用于提取传真报文的页眉部分中的号码、收发时间和 收发单位信息图标识别子模块2022,用于从所述图标图像区域中提取图标特征信息;关键词识别子模块2023,用于从所述文本图像区域中提取关键字信息;表格识别子模块2024,用于从所述表格图像区域中提取表格特征信息。实施例三本实施例相应提供一种传真检索系统,如图3所示,该系统包括上述实施例二中 的报文分析装置200,还包括中心服务器301、传真报文存储单元302、数据库303、特征信 息存储单元304,特征信息描述单元305、属性表306、传真检索单元307和用户接口单元 308 ;其中,所述传真报文存储单元302、报文分析装置200、用户接口单元308均与中心 服务器301相连,所述中心服务器301与各分公司的服务器通过公司内部IP连接,接收和 分发的传真均要经过中心服务器301存入传真报文存储单元302,并且所述属性表306是包 含于所述数据库303之中的。所述传真报文存储单元302用于存储经过所述中心服务器301接收和分发的传真 报文;其中传真报文可以为bmp格式的二值图像;数据库303用来存储所有传真的分公司 ID、文件生成时间、传真收发方向、传真的存储路径、处理标志等信息;所述特征信息描述单元305用于从所述报文分析装置200分析得到的特征信息中 生成特征描述符;
所述特征信息存储单元304用于与所述传真报文数据相关联存储所述传真报文 的特征描述符;所述属性表306为基于传真报文的特征信息生成的属性表;所述传真检索单元307,用于接收输入的与所述特征信息相关的检索条件,并对所 述属性进行检索,生成满足所述检索条件的传真报文。图4示出了本发明实施例的应用场合的示意图。下面举例说明利用本实施例提供的传真检索系统对传真报文进行检索的过程如 图5所示,首先用户输入检索条件(对应步骤S501);然后系统查找对应的存储模块(对应 步骤S502);接着对照属性表(对应步骤S503)。如果没有相关文件,则程序退出,如果有相 关文件,则继续执行步骤S504 查找存储数据;最后执行步骤S505 输出满足检索条件的传 真报文检索结果。本发明通过对传真按收发时间(格式为年月日小时分秒)、主被叫号码、传真业务 所属分公司名、图标特征、关键字、表格特征、传真类型以及范围建立多重标签的方法,方便 了传真的管理和检索,节约了大量的人力资源。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本发明的保护范围。
权利要求
一种生成传真索引的方法,其特征在于,包括对传真报文进行版面分析,提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
2.根据权利要求1所述的方法,其特征在于,所述进行版面分析包括 提取所述传真报文的页眉部分;所述提取传真报文中的特征信息包括提取所述传真报文的页眉部分中的号码、收发时间和收发单位信息。
3.根据权利要求1所述的方法,其特征在于,所述进行版面分析包括将所述传真报文正文部分划分成图标图像区域、文本图像区域和表格图像区域。
4.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括 从所述图标图像区域中提取图标特征信息。
5.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括 从所述文本图像区域中提取关键字信息。
6.根据权利要求3所述的方法,其特征在于,所述提取传真报文中的特征信息包括 从所述表格图像区域中提取表格特征信息。
7.一种报文分析装置,其特征在于,包括 版面分析模块,用于对传真报文进行版面分析;特征信息提取模块,用于提取所述传真报文中的特征信息;索引生成模块,用于根据所述提取的特征信息为传真报文建立标签,将所述标签作为 所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。
8.根据权利要求7所述的报文分析装置,其特征在于,所述版面分析模块具体用于提 取所述传真报文的页眉部分,并将所述传真报文正文部分划分成图标图像区域、文本图像 区域和表格图像区域。
9.根据权利要求8所述的报文分析装置,其特征在于,所述特征信息提取模块包括 页眉信息识别子模块,用于提取传真报文的页眉部分中的号码、收发时间和收发单位信息; 图标识别子模块,用于从所述图标图像区域中提取图标特征信息; 关键词识别子模块,用于从所述文本图像区域中提取关键字信息; 表格识别子模块,用于从所述表格图像区域中提取表格特征信息。
10.一种传真检索系统,其特征在于,包括如权利要求7至9中任意一项所述的报文分 析装置,还包括中心服务器、传真报文存储单元、数据库、特征信息存储单元,特征信息描 述单元、属性表、传真检索单元和用户接口单元;其中,所述传真报文存储单元用于存储经过所述中心服务器接收和分发的传真报文; 所述特征信息描述单元用于从所述报文分析装置分析得到的特征信息中生成特征描 述符;所述特征信息存储单元用于与所述传真报文数据相关联存储所述传真报文的特征描 述符;所述属性表为基于传真报文的特征信息生成的属性表;所述传真检索单元,用于接收输入的与所述特征信息相关的检索条件,并对所述属性 进行检索,生成满足所述检索条件的传真报文。
全文摘要
本发明实施例提供的一种生成传真索引的方法,包括对传真报文进行版面分析,提取所述传真报文中的特征信息,根据所述提取的特征信息为传真报文建立标签,将所述标签作为所述传真报文的索引,以便用户根据所述标签查找相对应的传真报文。使用本发明提供的生成传真索引的方法,方便了传真的管理和检索,节约了大量的人力资源。
文档编号G06F17/21GK101876999SQ20091025009
公开日2010年11月3日 申请日期2009年12月4日 优先权日2009年12月4日
发明者于洪涛, 冯晓磊, 李鹏 申请人:中国人民解放军信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1