一种专利文献要素对相似度计算影响的表示方法

文档序号:6543615阅读:473来源:国知局
一种专利文献要素对相似度计算影响的表示方法
【专利摘要】本发明公开了一种专利文献要素对相似度计算影响的表示方法,包括以下步骤:确定与专利文献相似度计算有关的影响要素,并将各影响要素用不同的圆表示;确定各影响要素对专利文献相似度计算影响的大小,并用圆的大小表示;分析不同影响要素之间的相关性,相关性大的,表示影响因素的圆之间的距离就近;相关性小的,表示影响因素的圆之间的距离就远;将有相互关系的影响要素之间用线相连,即能表示出专利文献的影响要素对相似度计算影响。本发明能直观准确地表示专利文献各影响要素对专利文献相似度计算的影响,可应用于专利文献的相似度计算和检测。
【专利说明】一种专利文献要素对相似度计算影响的表示方法
【技术领域】
[0001]本发明属于信息检索领域,具体涉及一种专利文献的相似检索技术。
【背景技术】
[0002]专利文献包含大量的技术、经济、法律等信息,成为知识产权战略推进中的关键因素。一些最先进的、最有价值的发明总是最早在专利文献上公开发表。内容的新颖性使得专利文献成为查找某一领域最新进展的最简便、最迅速的工具。从日常生活到高精尖技术几乎无所不包,【技术领域】的广泛性决定了专利文献内容范围的广泛性。专利法要求专利文献
【发明内容】
部分必须是紧紧扣住发明的任务,只描述与发明有关的内容,无关的少提或不提,从而使得专利文献的信息密度大,针对性和实用性强。专利文献提供了一个丰富的知识宝库,已成为科学技术进步和创新的主要载体。知识产权的获取、创造、运用和管理过程均离不开对相似专利文献的计算机检测,专利文献相似度计算的有效性,即查全率(或召回率)和查准率(或精确率)备受关注,成为研究的热点。
[0003]申请号为201310313779.8的专利申请,公开了一种专利文献模型树构建方法,将专利文献的各组成部分的内容、多代引文和IPC相结合起来构建专利文献的模型树:将整个专利文献作为根节点;将摘要、说明书、权利要求书、IPC和引文作为中间节点;将独立权利要求,IPC的部、大组、小组、大类,以及引文中的I代引文至m-ι代引文作为中间结点;将发明的名称、摘要中的技术方案和应用领域、权利要求中的从属权权利要求,以及说明书中的现有技术、解决的问题、技术方案、有益效果和实施例,IPC中小类,引文中的m0代引文作为叶结点,其中m为专利文献的第m代引文,1≤m≤nv
[0004]现有技术只是将专利文献的组成要素构建成模型树,未剖析专利文献各要素对专利文献相似度计算的影响关系,也未将专利文献各要素组合对相似度计算的影响关系进行形式化表示。
[0005]本发明创造得到教育部人文社会科学研究青年基金项目(13YJC870026)资助。
[0006]对比文件.王秀红.一种专利文献模型树构建方法,申请号201310313779.8,申请日 2013-07-24。

【发明内容】

[0007]本发明的目的在于提供一种专利文献要素对相似度计算影响的表示方法,以挖掘专利文献不同的影响要素对专利文献相似度计算的影响关系并进行直观的形式化准确表/In?从而进一步提闻专利文献相似度计算的精确率和召回率。
[0008]为了解决以上技术问题,本发明采用的具体技术方案如下。
[0009]一种专利文献要素对相似度计算影响的表示方法,其特征在于包括以下步骤: 步骤一,剖析专利文献内容结构特征,确定与专利文献相似度计算有关的影响要素,并
将各影响要素用不同的圆表示;
步骤二,确定各影响要素对专利文献相似度计算的影响大小,并用圆的大小表示影响要素对专利文献相似度计算的影响大小;
步骤三,分析不同影响要素之间的相关性,相关性大的,表示影响要素的圆之间的距离就近;相关性小的,表示影响因素的圆之间的距离就远;
步骤四,将有相互关系的影响要素之间用线相连,即直观地表示出专利文献的影响要素对相似度计算的影响。
[0010]所述步骤一中的影响要素包括:篇名、摘要、IPC、说明书、权利要求书和引文,所述权利要求书包括独立权利要求。
[0011]所述的说明书包括【背景技术】、发明技术方案、实施例和有益效果。
[0012]所述的权利要求书包括I级从属权利要求。
[0013]所述I级从属权利要求包括2级从属权利要求。
[0014]所述的IPC号为部号、大类号、小类号、大组号或小组号的IPC号。
[0015]所述的引文包括I代引文、2代引文或2代以上引文。
[0016]本发明具有有益效果。本发明通过剖析专利文献内容结构特征,确定与专利文献相似度计算有关的影响要素并用不同的圆表示,分析各影响要素对专利文献相似度计算的影响大小,并用圆的大小表示影响要素对专利文献相似度计算的影响大小;通过设置圆之间的距离的近和远来表示影响因素对相似度计算影响的大小,从而实现形式化地准确地表示出专利文献要素对相似度计算的影响,明确专利文献的各要素对专利文献相似度计算的影响,为专利文献相似度计算过程中要素权重的设置提供依据,提高专利文献相似度计算的精确率和召回率。
【专利附图】

【附图说明】
[0017]图1是本发明中影响要素对专利文献相似度计算影响的表示图。
【具体实施方式】
[0018]下面结合附图和具体实施例,对本发明的技术方案做进一步详细说明。
[0019]一种专利文献要素对相似度计算影响的表示方法,表示形式如图1所示,具体包括以下步骤。
[0020]剖析专利文献内容结构特征,确定与专利文献相似度计算有关的影响要素,并将各影响要素用不同的圆表示。
[0021]各国专利文献内容结构均具有统一的编排体例,与技术方案相关的主要有:专利名称即篇名、摘要、说明书、权利要求书、IPC号。说明书部分包括【背景技术】、
【发明内容】
即发明技术方案、有益效果、【具体实施方式】即实施例;权利要求书部分包括独立权利要求,往往还包括从属权利要求,体现了发明的实质性内容、划定的专利权保护范围、被法律保护的独占权的界限;各国专利文献基本上均有国际专利分类IPC号,且依从高到低的等级体系级别分为部、大组、小组、大类、小类。此外,美国、日本、欧洲等大部分国外专利文献均具有发明人和审查员提供的对比文件即引文,引文也是现有的相关技术,它在一定程度上反映了专利和引文之间的相关性。最终确定与专利文献相似度计算有关的影响要素,包括:篇名、摘要、IPC、说明书、权利要求书和引文,所述权利要求书包括独立权利要求、I级从属权利要求、2级从属权利要求。并将各影响要素用圆表示,如图1所示。[0022](2)分析各影响要素对专利文献相似度计算的影响大小,并用圆的大小表影响要素对专利文献相似度计算的影响大小。
[0023]权利要求书内容最能反映发明的技术方案和创新点;同时,说明书中的
【发明内容】
部分的技术方案的公开,依专利法要求覆盖权利要求书的技术保护范围,内容上与权利要求书部分有很大的重复;IPC号均是由审查员对发明创新的技术内容进行的专业的准确分类,能准确地反映发明的技术方案所属的具体【技术领域】;三者对专利文献的相似度计算影响最大,所以画出的圆最大,如图1所示。
[0024]I代引文比2代引文对专利文献相似度计算的影响要大,所以表示I代引文的圆比表示2代引文的圆要大。权利要求书中,从属权利要求限定的保护的技术范围要比它所从属的权利要求要求保护的技术范围要小和具体,从属权利要求对相似度计算的影响比它所从属的权利要求对相似度计算的影响要大;说明书中,【背景技术】、有益效果对相似度计算影响比
【发明内容】
对相似度计算的影响要小,画出的圆就小;实施例部分对相似度计算影响【背景技术】的相应影响要大,则表示实施例的圆就比表示【背景技术】的圆要大,如图1所示。
[0025]从部号、大类号、小类号、大组号到小组号,IPC的类号越下位且当两个待比对的专利文献的IPC号相同或相近,说明两个待比对的专利文献的技术方案领域越相同和相近,则圆的直径越大,即从小组号到大组号到小类号到大类号到部号所对应的圆为从大到小,如图1所示; 申请人:为了战略的考虑,重要发明创新思想在篇名和摘要中不充分体现,对专利文献相似度计算的影响要比权利要求书、IPC号、和发明技术方案部分对专利文献相似度计算的影响要小,圆的直径就相对要小;如图1所示。
[0026]分析不同影响要素之间的相关性大小,并对应地用表示影响因素的圆之间的距离大小来表示。
[0027]【背景技术】、发明技术方案、实施例和有益效果同属于说明书部分,于是代表【背景技术】、发明技术方案、实施例和有益效果的圆同时位于表示说明书的大圆内;部号、大类、小类、大组、小组号同属IPC号,位于同一大圆内;2级从属权要注从属于I级从属权利要求,I级从属权利要求从属于独立权利要求,代表他们的圆位于同一大圆内。
[0028]权利要求书、说明书和IPC之间的技术相关性描述密切相关,代表三部分内容的圆之间的距离就近。如图1所示。
[0029](4)将有相互关系的影响要素之间用线相连,即直观地表示出专利文献的影响要素对相似度计算的影响,如图1所示。
【权利要求】
1.一种专利文献要素对相似度计算影响的表示方法,其特征在于包括以下步骤: 步骤一,剖析专利文献内容结构特征,确定与专利文献相似度计算有关的影响要素,并将各影响要素用不同的圆表示; 步骤二,确定各影响要素对专利文献相似度计算的影响大小,并用圆的大小表示影响要素对专利文献相似度计算的影响大小; 步骤三,分析不同影响要素之间的相关性大小,并对应地用表示影响因素的圆之间的距离大小来表示; 步骤四,将有相互关系的影响要素之间用线相连,即直观地表示出专利文献的影响要素对相似度计算的影响。
2.根据权利要求1所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于所述步骤一中的影响要素包括:篇名、摘要、IPC、说明书、权利要求书和引文,所述权利要求书包括独立权利要求。
3.根据权利要求2所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于:所述的说明书包括【背景技术】、发明技术方案、实施例和有益效果。
4.根据权利要求2所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于:所述的权利要求书包括I级从属权利要求。
5.根据权利要求4所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于:所述I级从属权利要求包括2级从属权利要求。
6.根据权利要求2所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于:所述的IPC号为部号、大类号、小类号、大组号或小组号的IPC号。
7.根据权利要求2所述的一种专利文献要素对相似度计算影响的表示方法,其特征在于:所述的引文包括I代引文、2代引文或2代以上引文。
【文档编号】G06F17/30GK103942295SQ201410147207
【公开日】2014年7月23日 申请日期:2014年4月14日 优先权日:2014年4月14日
【发明者】王秀红, 袁银池, 陈潇君, 汪满容, 刘海军, 吕彬, 李洁玉 申请人:江苏大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1