一种专利信息分析方法及装置的制作方法

文档序号:6605318阅读:211来源:国知局
专利名称:一种专利信息分析方法及装置的制作方法
技术领域
本发明涉及数据处理领域,尤其涉及一种专利信息分析方法及装置。
背景技术
专利信息分析是根据不同的需求和目的,对专利数据进行采集、组织、整理,采用不同的方法和模型(定量或定性)挖掘隐含在专利文献中的法律、经济与技术信息,发现专利申请的分布规律和发展趋势,从而将零碎的信息转化为系统的认识,以指导企业经营决策和技术创新的一种技术方法。专利信息分析实质上是对专利文献的特征项及相关指标进行的统计和分析。专利文献的特征项及相关指标,例如申请人、发明人、申请类型、申请日、国际分类、标引项目等。现有技术中提供的专利信息分析方法,一般提供固定的分析内容,分析内容不能扩展。为了适应专利文献的标引项目不断扩展的趋势,应对不同的需求和目的,实现专利信息分析的可扩展性成为亟待解决的技术问题之一。

发明内容
本发明实施例提供一种专利信息分析方法及装置,用以实现专利信息分析的可扩展性。本发明实施例提供一种专利信息分析方法,包括接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。本发明实施例一种专利信息分析装置,包括数据源,用于提供专利数据;分析模板管理模块,用于管理配置的至少一个分析模板,所述分析模板用于定义分析项目和度量指标;信息分析模块,用于接收用户发起的针对特定的分析模板的分析指令,根据所述分析指令从所述分析模板管理模块中提取该特定的分析模板,通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标, 查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;呈现模块,用于将所述信息分析模块得到的分析结果呈现给用户。本发明实施例提供的专利信息分析方法及装置,预先针对不同的需求和目的配置多个分析模板,分析模板用于定义分析项目和度量指标,用户可以针对任一分析模板发起分析指令,根据分析指令提取相应的分析模板,根据分析模板通过访问数据源得到分析结果并向用户进行呈现,能够对专利数据进行快速、一致、交互的分析,由于分析模板可以灵活配置,因此可以实现专利信息分析的可扩展性。本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。


图1为本发明实施例中分析模板配置界面示意图;图2为本发明实施例中专利信息分析方法流程图;图3为本发明实施例中年度申请量分析的分析结果呈现示意图;图4为本发明实施例中专利信息分析装置框图。
具体实施例方式本发明实施例提供一种专利信息分析方法及装置,基于分析模板对专利数据进行快速、一致、交互的分析,实现专利信息分析的可扩展性。以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明,并且在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。首先介绍分析模板及其配置方法。分析模板定义分析项目和度量指标。如图1所示为分析模板配置界面示意图,定义区划分为维度区和数据区,维度区又可进一步划分,图1中以将维度区划分为行区和列区为例进行示意性说明。在配置分析模板时,用户可以从可用字段列表中选择需要定义的可用字段,可用字段列表中的可用字段按照属性可以划分为度量类和分析类,度量类字段只允许添加到数据区,分析类字段只允许添加到维度区。添加到数据区的度量类字段可以称为度量指标,例如申请量;添加到维度区的分析类字段可以称为分析项目,例如申请类型、申请人、申请年度等等。可用字段列表在数据库中采用维度表的形式存储,每一个度量指标或者分析项目占用维度表中的一条记录,每一条记录具有若干属性,例如表示属于度量类还是分析类的属性、排序属性等。具体实施中,如果需要增加或者减少分析项目,只需要相应添加或者删除维度表中的一条记录即可实现。为了便于用户查找和使用,可用字段列表中的可用字段可以按照使用频率从高到低的顺序排序,即将常用的可用字段排在靠前位置,不常用的可用字段排在靠后位置;可用字段也可以按照分组形式管理,将相关的可用字段划分到同一分组中。根据每个可用字段的排序属性,可以对分析项目自身的数据内容进行排序,例如对申请年度进行排序(默认按照年度降序排列),也可以按照度量指标对分析项目的数据内容进行排序,例如按照申请量对申请人进行排序。较佳的,分析模板还可定义分析结果的输出类型,输出类型具体可以包括基于柱形图表示输出结果、基于折线图表示输出结果、基于扇形图表示输出结果,等等。用户可以在分析模板配置界面的输出类型对话框中输入或选择输出类型,同时在输出预览对话框中可以预览该输出类型。如果用户未选择输出类型,可以按照默认的输出类型向用户呈现分析结果。针对不同的输出类型,分析模板还需要同时定义各分析项目在输出类型中的分析维度。例如对于柱形图和折线图来说,维度区需要进一步划分为行区和列区,其中添加到行区的分析项目其在输出类型中的分析维度为“行维度”,添加到列区的分析项目其在输出类型中的分析维度为“列维度”;对于扇形图来说,维度区需要进一步划分为半径区和角度区, 其中添加到半径区的分析项目其在输出类型中的分析维度为“半径维度”,添加到角度区的分析项目其在输出类型中的分析维度为“角度维度”。较佳的,分析模板还可定义其中一个或多个分析项目的过滤条件,用于对分析项目的数据内容进行条件过滤,既可设定在过滤条件范围之内为符合过滤条件,也可设定在过滤条件范围之外为符合过滤条件,例如包含、不包含、部分包含等。例如,针对申请类型, 可以定义过滤条件为发明,同时可以设定申请类型为发明的专利文献符合过滤条件,也可设定申请类型为非发明(实用新型和外观设计)的专利文献符合过滤条件;针对申请人,可以设定申请量超过设定数值的申请人符合过滤条件;针对申请年度,可以设定指定的时间范围内符合过滤条件,等等。用户可以在分析模板配置界面的过滤条件对话框中输入或选择当前分析项目的过滤条件。对于分析项目的数据内容固定的分析项目,例如申请类型的数据内容固定为发明、实用新型和外观设计,可以直接使用该分析项目的数据内容进行条件过滤;对于分析项目的数据内容不固定的分析项目,例如申请年度的数据内容根据数据源中专利文献的不同而不同,可以在获取到该分析项目的数据内容之后进行条件过滤。针对配置的分析模板,用户可以在分析模板配置界面的模板标识对话框中输入唯一标识(例如名称、编号等)。至此,完成了对分析模板的配置。用户可以根据不同的分析需求和目的,配置多个分析模板,也可以随时添加分析模板,或者删除配置完成的分析模板。具体实施中,配置的至少一个分析模板可以按照分析模板中分析项目的相关度以分组方式存在。同一分组的各分析模板组成一个分析模板组,属于同一主题。配置完成的分析模板组是针对某一主题的,可以将其保存为系统默认的分析模板组,这样不必为每个主题配置分析模板组,系统自动判断当前主题是否包括自身的分析模板组,如果有,则加载当前主题的分析模板组,如果没有,则加载系统默认的分析模板组;用户也可以直接获取系统默认的分析模板组作为当前主题的分组模板组;分析模板组是针对主题的,根据不同的分析需求和目的,为不同的主题配置不同的分析模板组,既满足了主题的个性化,又满足了分析的通用性。举例进行说明,假设分析模板分别为申请类型分布——行维度申请类型,列维度无,度量指标申请量;年度申请量分析——行维度申请年度,列维度无,度量指标申请量;年度类型分析——行维度申请年度,列维度申请类型,度量指标申请量;申请人:申请量排行榜——行维度申请人,列维度无,度量指标申请量;申请人:申请类型分析——行维度申请人,列维度申请类型,度量指标申请量;申请人:年度申请量分析——行维度申请人,列维度申请年度,度量指标申请量;则根据分析项目的相关度,申请类型分布、年度申请量分析、年度类型分析为一组,申请人申请量排行榜、申请人申请类型分析、申请人年度申请量分析为一组。基于配置完成的分析模板,本发明实施例提供了一种专利信息分析方法,如图2 所示,包括S201、接收用户发起的针对特定的分析模板的分析指令;S202、根据针对特定的分析模板的分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;S203、通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容, 并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;具体实施中,如果分析模板还定义了其中一个或多个分析项目的过滤条件;则针对该一个或多个定义了过滤条件的分析项目,通过访问数据源查找符合该一个或多个分析项目中对应的过滤条件的数据内容;S204、将得到的分析结果呈现给用户;具体实施中,如果分析模板还定义分析结果的输出类型、以及各分析项目在输出类型中的分析维度,则按照该特定的分析模板定义的输出类型,并结合各分析项目在输出类型中的分析维度,呈现得到的分析结果。具体实施中,数据源可以采用集中存储方式,也可以采用分布式存储方式。数据源可以为关系数据库系统,也可以为基于OLAP (On-Line AnalysisProcessing,联机分析处理)的分析服务系统。其中,关系数据库系统是指建立在关系模型基础上的数据库,关系模型由关系数据结构、关系操作集合、关系完整性约束三部分组成。SQL(StructuredQuery Language,结构化查询语言)是一种数据库查询的程序设计语言,用于执行对关系数据库系统中数据的存取、查询、更新和管理。随着数据库技术的发展和应用,数据库存储的数据量上升到兆兆(T)甚至千兆兆 (P)字节,用户的查询需求也越来越复杂,需要对多张表中千万条记录的数据进行数据分析和信息综合,关系数据库系统已不能全部满足上述要求。操作型应用和分析型应用,特别是在性能上难以两全,由此在关系数据库系统中放宽了对冗余的限制,引入了统计综合数据,但统计综合数据的应用逻辑是分散而杂乱的、非系统化的,因此分析功能有限,不灵活,维护困难。通过专门的数据综合引擎,辅之以更加直观的数据访问界面,力图统一分散的公共应用逻辑,在短时间内响应复杂的查询要求,该类技术定义为OLAP。MDX(Mutil Dimensional Expressions,多位查询表达式)是OLAP分析采用的核心查询语言。如果数据源为关系数据库系统,维度表中的分析项目需要设置该分析项目在关系数据库系统系统中所在表的名称、以及表的主键等属性,从而构造标准的SQL语句实现对关系数据库系统的访问。维度表中分析项目的定义如下public class Dimension{string dimName ;// 分析项目的名称,keystringdimFieldNname; //对应的可用字段名称string dimTtabIeNname ; //所在表的名称
string dimCcaption ;// 标题AllowedAreas alIowedDdareas ; //允许添力口至Ij的区域维度区(例如行区、 列区)、数据区SortMode defaultSsort ; //排序方式默认、按照申请量、按照名称bool allowedFfilter ; //是否允许参与分析模板的条件过滤bool isSortCount ; //是否只返回分析项目的内容,或者按照设定的排序方式返回申请量例如,申请年度AppYear需要设置如下属性可用字段AppYear,表1,DocNo ;申请类型AppType需要设置如下属性可用字段AppType,表2,DocNo ;通过构造如下标准的SQL语句可以实现对关系数据库系统的访问Select Count (*), AppYear, AppType from 表 1 inner join 表 2 on 表 L DocNo = 表2. DocNo ;//从表1和表2中查询AppYear、AppType from,以及满足查询到的AppYear 和AppType的数据量,其中表1和表2内关联;进一步,对访问关系数据库系统得到的执行结果集进行交叉处理,生成二维交叉表数据,也可以通过其它方式生成二维交叉表数据,从而得到访问结果。交叉处理有多种实现方式,可以在数据库进行交叉处理,也可以在内存进行交叉处理。如果数据源为基于OLAP的分析服务系统,维度表中存储内容如下申请年度[App Date], [Year]申请类型:[Dim App Type], [App Type]申请量[Measures]· [AppCount]假设分析模板定义申请年度为行维度,申请类型为列维度,以及度量指标为申请量,则可构造如下标准的MDX分析语句实现对基于OLAP的分析服务系统的访问withSelect{{[AppDate]. [Year]. [Total], topcount(nonempty({addcalculatedmembers({[AppDate]. [Year]. Members})-{[App Date]. [Year]. [Total]}}),27)}}on rows, {[DimApp Type]. [App Type]. [Total], topcount(nonempty({addcalculatedmembers({[DimApp Type]. [App Type] · Members})-{[Dim App Type]. [App Type]. [Total]}}),27)}on columns from 数据集市名 Where [Measures]. [AppCount]//查询[Year]、[App Type],以及满足查询到的 [Year]、[App Type]的[AppCount],从而得到分析结果。举例进行说明专利信息分析方法的实施过程。假设特定的分析模板为年度申请量分析,其中行维度为申请年度,度量指标为申请量,专利信息分析方法包括如下步骤步骤1、接收用户发起的针对年度申请量分析的分析指令;步骤2、根据该分析指令从配置的至少一个分析模板中提取年度申请量分析,年度申请量分析定义分析项目为申请年度、度量指标为申请量、输出类型为折线图、以及申请年度在折线图中的分析维度为行维度;步骤3、通过访问数据源查找申请年度对应的数据内容,以及满足上述申请年度的申请量,将查找到的申请年度及其对应的申请量作为得到分析结果,分析结果如下表所
示;
权利要求
1.一种专利信息分析方法,其特征在于,包括接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。
2.如权利要求1所述的方法,其特征在于,所述分析模板还定义其中一个或多个分析项目的过滤条件;以及所述通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,具体包括针对该一个或多个定义了过滤条件的分析项目,通过访问数据源查找符合该一个或多个分析项目中对应的过滤条件的数据内容。
3.如权利要求1或2所述的方法,其特征在于,所述分析模板还定义分析结果的输出类型、以及各分析项目在输出类型中的分析维度;以及所述将得到的分析结果呈现给用户,具体包括按照该特定的分析模板定义的输出类型,并结合各分析项目在输出类型中的分析维度,呈现得到的分析结果。
4.如权利要求1所述的方法,其特征在于,还包括接收用户发起的针对特定的分析模板的更新指令;根据所述更新指令更新并保存该特定的分析模板。
5.如权利要求1所述的方法,其特征在于,所述配置的至少一个分析模板按照分析模板中分析项目的相关度以分组方式存在。
6.一种专利信息分析装置,其特征在于,包括数据源,用于提供专利数据;分析模板管理模块,用于管理配置的至少一个分析模板,所述分析模板用于定义分析项目和度量指标;信息分析模块,用于接收用户发起的针对特定的分析模板的分析指令,根据所述分析指令从所述分析模板管理模块中提取该特定的分析模板,通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;呈现模块,用于将所述信息分析模块得到的分析结果呈现给用户。
7.如权利要求6所述的装置,其特征在于,所述分析模板还定义其中一个或多个分析项目的过滤条件;以及所述信息分析模块,具体用于针对该一个或多个定义了过滤条件的分析项目,通过访问数据源查找符合该一个或多个分析项目中对应的过滤条件的数据内容。
8.如权利要求6或7所述的装置,其特征在于,所述分析模板还定义分析结果的输出类型、以及各分析项目在输出类型中的分析维度;以及所述呈现模块,具体用于按照所述特定的分析模板定义的输出类型,并结合各分析项目在输出类型中的分析维度,呈现所述信息分析模块得到的分析结果。
9.如权利要求6所述的装置,其特征在于,所述数据源为关系数据库系统或者基于联机分析处理OLAP的分析服务系统。
10.如权利要求6所述的装置,其特征在于,所述分析模板管理模块,还用于按照分析模板中分析项目的相关度对配置的至少一个分析模板分组管理。
全文摘要
本发明公开了一种专利信息分析方法及装置,用以实现专利信息分析的可扩展性。专利信息分析方法,包括接收用户发起的针对特定的分析模板的分析指令;根据所述分析指令从配置的至少一个分析模板中提取该特定的分析模板,所述分析模板用于定义分析项目和度量指标;通过访问数据源查找该特定的分析模板定义的分析项目对应的数据内容,并根据该特定的分析模版定义的度量指标,查找满足所述数据内容的度量指标值,将查找到的数据内容及其对应的度量指标值作为得到的分析结果;将得到的分析结果呈现给用户。
文档编号G06F17/30GK102298598SQ201010217459
公开日2011年12月28日 申请日期2010年6月23日 优先权日2010年6月23日
发明者甄春杰 申请人:潘晓梅
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1