一种客观量化的中国发明专利评估系统及方法与流程

文档序号:14873316发布日期:2018-07-07 02:37阅读:128来源:国知局

本发明涉及知识产权评估技术,是一种基于统计学及数据挖掘模型评估知识产权的客观量化的中国发明专利评估系统及方法。



背景技术:

目前专利权在当今商业活动中起着至关重要的作用。在投资领域,它鼓励投资者进入新兴产业,并在竞争者行动前率先抢占市场。在市场竞争中,它能够有效保护自身的创新技术,避免不必要的纠纷,并提升在业内的竞争优势;在战略布局方面,专利权对认清行业发展方向和经济走向,制定合适的专利战略布局也起着重要作用。

无论是专利权的自身价值和专利权在公司的经验和发展中的衍生价值都非常重要。但是,专利的评估却比较复杂和困难,当前国内普遍的专利评估方法(无论是检索评估,还是专利定价)均不同程度存在人为的干预,由于主观因素过多、评估者的经验和直觉作用明显,其科学合理性较难得到验证。如表1所示,检索评估,即通过专利检索方法,对比分析相关专利并判断专利的含金量、新颖性和创造性,以判定研发的意义或专利侵权的可能性,常用于专利研发布局及律师的专利诉讼分析等。专利价值评估是专利评估中最直观的价格体现,即以会计学中对无形资产评估的方法为基础(如收益法、成本法、市场法)实现估价,以解决专利交易中专利值多少钱的问题,常见于会计师和资产评估师的专利(无形资产)评估报告,然而运用三种基础估价方法都无法精确为专利定价。本专利专注于客观量化的专利评估方法的研究,其人为干扰因素较少、说服力更强。它是对专利优劣的判断,通过模型构建,找出目标专利优劣与其可以量化的专利的内部特征和外部特征指标之间的关系。

表1

表1为专利评估方法分类表。



技术实现要素:

本发明的目的在于克服现有技术之缺陷,提供了一种客观量化的中国发明专利评估系统及方法,其具有客观量化、自动化评估专利优劣的特性。

本发明是这样实现的:一种客观量化的中国发明专利评估系统及方法,其包括:

-专利信息数据库

-专利算法程序

-功能模块(包括专利检索、专利信息展示、专利分析、评估报告展示及导出等)其中专利评估方法集中体现于算法程序中,其包括:

一数据预处理模块,其包括数据清洗、数据信息提取、数据重新规划,数据清洗用以把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字段转换;数据信息提取用以提取关键时间信息并计算时间间隔,对摘要、说明书等文本的数量化处理、提取离散有序字段和无序分类型字段信息;数据重新规划用以对提取出的信息重新赋予新的值,以达到每一个值所对应的样本数量充足且整体呈现一定的分布结构;

一模型建立模块,其包括变量选择、模型寻优;

一专利评估模块,其包括ipv分数、百分比等级、专利评级、生存年限估计、对专利主体的评级

一种利用客观量化的中国发明专利评估系统进行评估的方法,其包括以下步骤:a、数据预处理;

b、模型建立;

c、专利评估。

进一步地,在步骤(a)中,所述数据预处理进一步包括:

(1)数据清洗,把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字段转换;

(2)数据信息提取,提取关键时间信息并计算时间间隔,对摘要、说明书文本信息的数量化处理、提取离散有序字段和无序分类型字段信息;

(3)数据重新规划,对提取出的信息重新赋予新的值,以达到每一个值所对应的样本数量充足且整体呈现一定的分布结构。

进一步地,在步骤(b)中,所述模型建立进一步包括:

(1)通过专利法规,剔除与评估专利好坏无关的字段;

(2)选择衡量专利优劣的字段作为建模目标字段,进一步规划目标字段,以达到分布结构更适合建模要求;

(3)通过统计学意义选择与目标字段有显著相关性的字段并检查其意义;

(4)根据对统计图形分布有分类特征的关键字段对建模数据分类;

(5)通过似然比指标,计算机自动进行建模前地降维处理;

(6)模型参数寻优,建模完成;

(7)模型部署上线。

进一步地,在步骤(c)中,

(1)使用所获得的模型对专利评出粗糙分数;

(2)把粗糙分数映射到0到200之间,给出ipv分数;

(3)基于ipv分数计算出百分比等级,并给出专利评级;

(4)基于ipv分数对专利生存年限进行预测,把ipv分数重新规划成几个等级,分别统计每个等级的专利在进入下一续费周期时的生存率和平均生存年限,进一步计算整个专利生存年限预测表;

(5)系统自动生成专利在线评估报告,其中包括专利的基本属性、评估得分、星级排名及专利生存年限预测。

进一步地,在步骤(c)中,专利评估选择多元回归模型作为评估模型,参数寻优方式选择通常的最小二乘法,y=βx+ε,y为因变量矩阵,x为自变量矩阵,β为系数矩阵,ε为残差矩阵。参数计算,β=(x′x)-1(x′y),x‘为x矩阵的转置。

进一步地,在步骤(c)中,引入似然比值进行事后维度选择,定义,lr1为无约束方程的似然函数,t为点的个数,为无约束方程的方差估计;lr2为约束方程的似然函数,为有约束方程的方差估计,lr1、lr2服从χ2分布,每次尝试剔除一个自变量对原方程的影响,如果影响超过χ2临界值,证明剔除此自变量对方程影响过大,如果在方程中有相关性很强的两个自变量,当一个被剔除时,由于另一个的存在,不会对方程产生重大影响,达到了对原多元回归模型进行了维度选择的效果。

本发明公开的评估系统将无形的知识产权量化,客观化,排除了人为因素的干扰,针对每一部分给出相应的评估结果,操作简单,容易为市场所接受,且理论扎实,精湛,统计范围广,差异小。

另本发明公开的评估方法完全基于对专利固有属性的客观量化,评估过程由计算机独立完成无需人工,能够高效地对每一个专利给出有参考意义的评估分数,进一步基于此评估分数估计专利的生存年限、专利等级,填补了程序化评估专利的空白,真实,可靠,符合目前的发展潮流。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的评估系统结构图;

图2为本发明实施例提供的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1-2,本发明实施例提供一种客观量化的中国发明专利评估系统及方法,详见以下说明。

一种客观量化的中国发明专利评估系统,其包括:一数据预处理模块,其包括数据清洗、数据信息提取、数据重新规划,数据清洗用以把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字段转换;数据信息提取用以提取关键时间信息并计算时间间隔,对摘要、说明书等文本信息的数量化处理、提取离散有序字段和无序分类型字段信息,当然,不能局限于以上列举的摘要、说明书信息,甚至也可以考虑从专利附图中提取信息;数据重新规划用以对提取出的信息重新赋予新的值,以达到每一个值所对应的样本数量充足且整体呈现一定的分布结构;一模型建立模块,其包括变量选择、模型寻优;一专利评估模块,其包括ipv分数、百分比等级、专利评级、生存年限估计、对专利主体的评级。

一种客观量化的中国发明专利评估系统进行评估的方法,其包括以下步骤:

a、数据预处理;在步骤(a)中,所述数据预处理进一步包括:

(1)数据清洗,把存在缺失的数据补全或移出、把重复数据统一、把格式错误的字段转换;

(2)数据信息提取,提取关键时间信息并计算时间间隔,对摘要、说明书等文本的数量化处理、提取离散有序字段和无序分类型字段信息;

(3)数据重新规划,对提取出的信息重新赋予新的值,以达到每一个值所对应的样本数量充足且整体呈现一定的分布结构。

此过程为标准化知识产权数据入库。首先,对每一篇专利文档进行标准化,把一篇专利的有用信息提取并规划成多个字段,存入数据库,其中每一篇专利都是由以上规划的字段所描述的一个点。数据入库后对数据进行第一次清洗,对缺失数据采用补充或剔除。

然后,把知识产权数据库里每一个专利字段的文本和符号信息映射成数值信息。如统计摘要字数、权利要求个数等。再次进行数据清洗,对缺失数据和错误数据采用补充和修正。

再者,找出与专利的优劣相关的量化指标,如在续费周期是否生存、是否授权、法律诉讼是否胜诉等指标。并筛选出足够大样本的专利数据。

b、模型建立;在步骤(b)中,所述模型建立进一步包括:

(1)通过专利法规,剔除与评估专利好坏无关的字段;

(2)选择衡量专利优劣的字段作为建模目标字段,进一步规划目标字段,以达到分布结构更适合建模要求;

(3)通过统计学意义选择与目标字段有显著相关性的字段并检查其意义;

(4)根据对统计图形分布有分类特征的关键字段对建模数据分类;

(5)通过似然比指标,计算机自动进行建模前地降维处理;

(6)模型参数寻优,建模完成;

(7)模型部署上线。

c、专利评估,在步骤(c)中,进一步包括:

(1)使用获得的模型对专利评出粗糙分数,即在步骤(b)中,所述模型建立后获得的模型;

(2)把粗糙分数映射到0到200之间,给出ipv分数;

(3)基于ipv分数计算出百分比等级,并给出专利评级;

(4)基于ipv分数对专利生存年限进行预测,把ipv分数重新规划成几个等级,分别对每个等级的专利的生存率进行统计,进而计算出整个专利生存年限预测表;

(5)系统自动生成专利在线评估报告,其中包括专利的基本属性、评估得分、星级排名及专利生存年限预测。

学习模型,首先使用专利业务知识和描述性统计确定与专利生存能力显著相关,且互相之间不具有明显相关性的字段,对这些字段重新做数据分箱处理,以保证每一个等级的数据量足够多,且每一个等级的专利平均生存年限有显著的相关性。假设专利评估人都是理性的且只关注专利的优劣,那大量预估的专利生存年限只会在真实生存年限的左右波动,且误差属于正态分布,在步骤(c)中,基于数据的精准度,专利评估选择多元回归模型作为评估模型,参数寻优方式选择通常的最小二乘法,y=βx+ε,y为因变量矩阵,x为自变量矩阵,β为系数矩阵,ε为残差矩阵。参数计算,β=(x′x)-1(x′y),x‘为x矩阵的转置。引入似然比值进行事后维度选择,定义:lr1为无约束方程的似然函数,t为点的个数,为无约束方程的方差估计;lr2为约束方程的似然函数,为有约束方程的方差估计,lr1、lr2服从χ2分布,每次尝试剔除一个自变量对原方程的影响,如果影响超过χ2临界值,证明剔除此自变量对方程影响过大,如果在方程中有相关性很强的两个自变量,当一个被剔除时,由于另一个的存在,不会对方程产生重大影响,达到了对原多元回归模型进行了维度选择的效果。通过上述步骤,获得模型。把评估规则部署到评估系统中,对所有专利进行评估打分。此模型能够得出中国专利对应生存年限的粗糙分数。为了更显著地反映分数的细节,把粗糙结果映射到更大的区间上。以分数大小排序,计算各专利在整个专利数据集中的位置,并把整个专利集分成五个等级,给每个专利进行评级。

预测专利生存年限。中国专利大概每三年一次费用调整,因此专利生存年限预测以三年一个周期。首先把专利分成更细的等级,以每一个等级中所有到期或无效专利在当前周期的生存能力作为估计当前生存周期专利存活能力的考察样本。进入下一个续费周期时,重新使用以上方法估计专利的生存能力,依次类推,直到中国专利的最长生存年限限制。通过对打分后的专利进行考察:从申请的公司人在相关技术领域的地位、申请内容的先进性等方面,佐证了这种评估方法能够大概率的给优秀专利打出较高分数。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1