一种评估专利对于企业产生影响的方法及系统

文档序号:28273701发布日期:2021-12-31 20:20阅读:96来源:国知局
一种评估专利对于企业产生影响的方法及系统

1.本发明涉及企业经营技术领域,尤其涉及一种评估专利对于企业产生影响的方法及系统。


背景技术:

2.随着中国经济的不断发展以及关于知识产权法律的不断健全,知识产权将更近一步在技术驱动型企业中发挥作用,如指导企业业务发展方向、形成企业技术壁垒、维护企业技术权益等。知识产权大致被分为专利权、商标权和著作权。其中,专利权对于企业的自主创新技术的保护发挥着不可替代的作用。各创新主体往往会将自主创新的技术去申请专利权以维护自身的合法权益。那么,如何判断专利是否在企业的发展中产生了影响是目前需要解决的问题。


技术实现要素:

3.本发明通过提供一种评估专利对于企业产生影响的方法及系统,能够判断专利是否在企业的发展中产生了影响。
4.本发明提供了一种评估专利对于企业产生影响的方法评估专利对于企业产生影响的方法,包括:
5.获取目标专利信息集合和目标企业经营状况信息集合;
6.将所述目标专利信息集合和所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;
7.将所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;
8.通过公式计算得到企业在各阶段的增长特征数据gr;其中,p
t
表示企业在t时刻的增长数据,p
t+

t
表示企业在t+δt时刻的增长数据;
9.通过公式计算得到平均市场趋势集合;其中,amt表示在一段时间内市场的平均趋势,t
i
表示处于[t,t+δt]中的i时刻,k表示t
i
∈[t,t+δt]中t
i
的个数,α表示判断阈值;
[0010]
将所述第一市场趋势集合和所述第二市场趋势集合分别与所述平均市场趋势集合进行比较,判断出专利是否对于企业产生影响。
[0011]
具体地,所述将所述第一市场趋势集合和所述第二市场趋势集合分别与所述平均市场趋势集合进行比较,判断出专利是否对于企业产生影响,包括:
[0012]
根据公式计算得到第一准确率acc1;其中,t1为所述第一市场趋势集合与所述平均市场趋势集合中相同元素的个数,f1为所述第一市场趋势集合与所述平均市场趋势集合中不同元素的个数;
[0013]
根据公式计算得到第二准确率acc2;其中,t2为所述第二市场趋势集合与所述平均市场趋势集合中相同元素的个数,f2为所述第二市场趋势集合与所述平均市场趋势集合中不同元素的个数;
[0014]
比较所述第一准确率acc1和所述第二准确率acc2的大小;
[0015]
若所述第一准确率acc1大于所述第二准确率acc2,则说明专利对于企业产生了影响;
[0016]
若所述第一准确率acc1小于所述第二准确率acc2,则说明专利对于企业没有产生影响。
[0017]
具体地,若专利对于企业产生了影响,还包括:
[0018]
将所述专利信息集合中增加一组目标特征元素的数值或所有特征元素不变情况下的第一市场趋势减去从所述专利信息集合中减少或去除所述目标特征元素情况下的第一市场趋势,得到与所述目标特征元素对应的差值;
[0019]
对得到的所有差值均取绝对值;
[0020]
比较所有绝对值的大小,若所述绝对值越大,则说明与所述绝对值对应的目标特征元素对于企业产生的影响越大。
[0021]
具体地,在所述将所述目标专利信息集合和所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中之前,还包括:
[0022]
获取原始目标专利信息集合、原始企业经营状况信息集合和原始企业市场趋势数据;
[0023]
将所述原始目标专利信息集合和所述原始企业经营状况信息集合作为输入数据,将所述原始企业市场趋势数据作为输出数据,对第一原始预测模型进行训练,得到所述第一影响预测模型。
[0024]
具体地,在所述将所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中之前,还包括:
[0025]
获取原始企业经营状况信息集合和原始企业市场趋势数据;
[0026]
将所述原始企业经营状况信息集合作为输入数据,将所述原始企业市场趋势数据作为输出数据,对第二原始预测模型进行训练,得到所述第二影响预测模型。
[0027]
本发明还提供了一种评估专利对于企业产生影响的系统,包括:
[0028]
目标数据获取模块,用于获取目标专利信息集合和目标企业经营状况信息集合;
[0029]
第一市场趋势预测模块,用于将所述目标专利信息集合和所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;
[0030]
第二市场趋势预测模块,用于将所述目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;
[0031]
增长特征数据计算模块,用于通过公式计算得到企业在各阶段的增长特征数据gr;其中,p
t
表示企业在t时刻的增长数据,p
t+

t
表示企业在t+δt时刻的增长数据;
[0032]
平均市场趋势计算模块,用于通过公式计算得到平均市场趋势集合;其中,amt表示在一段时间内市场的平均趋势,t
i
表示处于[t,t+δt]中的i时刻,k表示t
i
∈[t,t+δt]中t
i
的个数,α表示判断阈值;
[0033]
第一分析模块,用于将所述第一市场趋势集合和所述第二市场趋势集合分别与所述平均市场趋势集合进行比较,判断出专利是否对于企业产生影响。
[0034]
具体地,所述第一分析模块,包括:
[0035]
第一准确率计算单元,用于根据公式计算得到第一准确率acc1;其中,t1为所述第一市场趋势集合与所述平均市场趋势集合中相同元素的个数,f1为所述第一市场趋势集合与所述平均市场趋势集合中不同元素的个数;
[0036]
第二准确率计算单元,用于根据公式计算得到第二准确率acc2;其中,t2为所述第二市场趋势集合与所述平均市场趋势集合中相同元素的个数,f2为所述第二市场趋势集合与所述平均市场趋势集合中不同元素的个数;
[0037]
比较单元,用于比较所述第一准确率acc1和所述第二准确率acc2的大小;若所述第一准确率acc1大于所述第二准确率acc2,则说明专利对于企业产生了影响;若所述第一准确率acc1小于所述第二准确率acc2,则说明专利对于企业没有产生影响。
[0038]
具体地,还包括:
[0039]
求差值模块,用于若专利对于企业产生了影响,将所述专利信息集合中增加一组目标特征元素的数值或所有特征元素不变情况下的第一市场趋势减去从所述专利信息集合中减少或去除所述目标特征元素情况下的第一市场趋势,得到与所述目标特征元素对应的差值;
[0040]
求绝对值模块,用于对得到的所有差值均取绝对值;
[0041]
第二分析模块,用于比较所有绝对值的大小,若所述绝对值越大,则说明与所述绝对值对应的目标特征元素对于企业产生的影响越大。
[0042]
具体地,还包括:
[0043]
第一原始数据获取模块,用于获取原始目标专利信息集合、原始企业经营状况信息集合和原始企业市场趋势数据;
[0044]
第一影响预测模型训练模块,用于将所述原始目标专利信息集合和所述原始企业经营状况信息集合作为输入数据,将所述原始企业市场趋势数据作为输出数据,对第一原始预测模型进行训练,得到所述第一影响预测模型。
[0045]
具体地,还包括:
[0046]
第二原始数据获取模块,用于获取原始企业经营状况信息集合和原始企业市场趋
势数据;
[0047]
第二影响预测模型训练模块,用于将所述原始企业经营状况信息集合作为输入数据,将所述原始企业市场趋势数据作为输出数据,对第二原始预测模型进行训练,得到所述第二影响预测模型。
[0048]
本发明中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0049]
先获取目标专利信息集合和目标企业经营状况信息集合,将目标专利信息集合和目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;将目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;通过公式计算得到企业在各阶段的增长特征数据;通过公式计算得到平均市场趋势集合;将第一市场趋势集合和第二市场趋势集合分别与平均市场趋势集合进行比较,判断出专利是否对于企业产生影响,能够有针对地对科技型企业进行探索分析。
附图说明
[0050]
图1为本发明实施例提供的评估专利对于企业产生影响的方法的流程图;
[0051]
图2为本发明实施例中小波变换示意图;
[0052]
图3为本发明实施例中股票市场收盘价数据变换曲线图;
[0053]
图4为本发明实施例中专利申请量数据变换曲线图;
[0054]
图5为本发明实施例提供的评估专利对于企业产生影响的系统的模块图;
[0055]
图6为本发明实施例中拥有专利数量在200

400之间的所有公司与其中专利起作用的公司数据对比图;
[0056]
图7为本发明实施例中拥有专利数量在400

700之间的所有公司与其中专利起作用的公司数据对比图;
[0057]
图8为本发明实施例中拥有专利数量在700

1000之间的所有公司与其中专利起作用的公司数据对比图;
[0058]
图9为本发明实施例中平均召回率差值柱状图;
[0059]
图10为本发明实施例中平均精确率差值柱状图;
[0060]
图11为本发明实施例中平均f1差值柱状图;
[0061]
图12为本发明实施例中平均准确率差值曲线图;
[0062]
图13为本发明实施例中拥有专利数量在200

400之间的公司稳定性柱状图;
[0063]
图14为本发明实施例中拥有专利数量在400

700之间的公司稳定性柱状图;
[0064]
图15为本发明实施例中拥有专利数量在700

1000之间的公司稳定性柱状图;
[0065]
图16为本发明实施例中公司各项特征重要程度的排序图。
具体实施方式
[0066]
本发明实施例通过提供一种评估专利对于企业产生影响的方法及系统,能够判断专利是否在企业的发展中产生了影响。
[0067]
本发明实施例中的技术方案为实现上述技术效果,总体思路如下:
[0068]
先获取目标专利信息集合和目标企业经营状况信息集合,将目标专利信息集合和
目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;将目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;通过公式计算得到企业在各阶段的增长特征数据;通过公式计算得到平均市场趋势集合;将第一市场趋势集合和第二市场趋势集合分别与平均市场趋势集合进行比较,判断出专利是否对于企业产生影响,能够有针对地对科技型企业进行探索分析。
[0069]
在本实施例中,我们做了两组实验,一组采用专利数据加股票数据对y
amt
进行预测,另一组只采用股票数据对y
amt
进行预测。具体地,市场趋势预测模型tp可以表示为tp(y
amt
|x
ma
,x
pa
),该模型使用amt作为输出y,即y
amt
。因为在时间上有多个t,即有多个amt,所以y
amt
是amt的一个向量集合,x
ma
和x
pa
同理,x
ma
表示目标企业经营状况信息的向量表示集合,x
pa
表示目标企业专利信息的向量表示集合。y
amt
集合中用(1,0,0)表示

1,用(0,1,0)表示0,用(0,0,1)表示1,可以根据需要自行选择表示方式。y
amt
、x
ma
、x
pa
这三类向量集合组成数据集。
[0070]
为了更好地理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
[0071]
参见图1,本发明实施例提供的评估专利对于企业产生影响的方法,包括:
[0072]
步骤s110:获取目标专利信息集合和目标企业经营状况信息集合;
[0073]
在本实施例中,目标专利信息集合中包含有一段时间内的多件专利,目标企业经营状况信息集合中包含有企业营业额、纳税额、股票等信息。后续仅通过股票信息对本发明实施例提供的评估专利对于企业产生影响的方法及系统进行具体说明。
[0074]
对本步骤进行具体说明:
[0075]
1、选择数据源,例如:谷歌专利网、网易财经等。
[0076]
2、数据爬取:通过网络爬虫批量获取中国上市企业股市市场数据和专利数据。例如:处于2010

2020年的市场数据和专利文本。
[0077]
3、数据处理:
[0078]
a、提取上市企业的每日交易数据:开盘价、收盘价、最高价、最低价、涨跌额、涨跌幅、转手率、交易量、交易额等数据。
[0079]
b、利用专利文本内容的特征,从每一个专利文本中提取专利特征,例如:申请日期、公开日期、专利技术内容等特征。例如:选取属于制造业中的上市公司,在制造业中又选取了拥有专利数量处于200

1000区间的公司,将其分为三大类,分别为专利数量200

400为一类,400

700为一类,700

1000为一类,后续步骤均在此分类基础上进行,后续其他步骤均需在此每一类上都进行一遍,对处于这些类别中的单个公司进行介绍,其他公司的处理步骤一致。
[0080]
4、数据转换(discrete wavelet transform module)
[0081]
a、企业市场数据转换:在对企业股票市场数据的处理上,把每一种特征数据都看作一条在时间上的曲线波,对每一条曲线做数据转换,数据转换的方法如下:
[0082]
采用小波变换的方式对特征数据曲线进行处理,该方法可以提取原始信号中的高频信号和低频信号,采用多级变换的方式,变换示意如图2所示。
[0083]
小波变换中的基函数采用“sym”小波基,对数据做多级变换,每一次变换都将获得
一个平滑信号(低频信号)和细节信号(高频信号)。其中,x表示一个特征的输入信号,hp表示提取高频信号,d(1)表示第一次变换获得的高频信号,lp表示提取低频信号,a(1)表示第一次小波变换获得的低频信号,第二次变换是在第一次变换的低频信号a(1)的基础上获得的,依次类推,可进行t次小波变换。对于每一个特征,取t=2,即只取每个特征变换所得的d(1)、d(2)、a(1)和a(2)这四个信号与原始信号组成一组向量来表示相应的特征,将其称之为该特征的特征向量。
[0084]
真实示例展示如图3所示,所获得的高低频分量如图3所示,图3为股票市场收盘价的变换示例,其他特征的变换与此特征的变换方法一致。在图3中,第一条曲线为原始的特征曲线,第二、三条曲线分别为对原始特征曲线进行第一次变换所得到的低频信号和高频信号,此处只展示一次变换的效果。
[0085]
b、企业专利数据转换:图4为企业专利申请量数据变换的示例,其变换方法与股票数据的变换方式基本一致,此处不再赘述。
[0086]
在本实施例中,企业的股票数据ma用表示,其中,ma表示了公司c在时间t∈[t,t+δt]之间的股票特征向量集合ma
t
,pr由股票t时刻的价格类特征的特征向量组成,其中cp表示收盘价的特征向量,op表示开盘价的特征向量,hp表示最高价的特征向量,lp表示最低价的特征向量,vl表示交易量的特征向量,mt表示交易额的特征向量。fc是由t时刻股票的波动类特征的特征向量组成,其中fca表示涨跌额特征向量,fcr表示涨跌率特征向量,tsr表示转手率特征向量。在时间轴上,将存在一个ma的股票活动序列。
[0087]
企业的专利数据pa用表示,其中,pa表示了公司c在时间t∈[t,t+δt]之间的专利特征向量集合pa
t
,tst由专利t时刻的价格类特征的特征向量组成,其中apt表示专利申请量特征,ppt表示专利公开的数量的特征向量。tct是由t时刻专利的技术特征的特征向量组成。在时间轴上,将存在一个pa的专利活动序列。
[0088]
步骤s120:将目标专利信息集合和目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;
[0089]
在将目标专利信息集合和目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合之前,还包括:
[0090]
获取原始目标专利信息集合、原始企业经营状况信息集合和原始企业市场趋势数据;
[0091]
将原始目标专利信息集合和原始企业经营状况信息集合作为输入数据,将原始企业市场趋势数据作为输出数据,对第一原始预测模型进行训练,得到第一影响预测模型。
[0092]
具体地,为了便于监测专利在每一年发挥作用的情况,对2010

2020年之间的数据集进行划分,具体划分为四个小的数据集,即2010

2016、2011

2017、2012

2018和2013

2019这四个小的数据集。
[0093]
使用lstm循环记忆神经网络和bp网络搭建趋势预测模型tp并进行训练,将每个小数据集的前5年数据进行训练,后一年的数据作为测试,来验证专利是否起了作用,在本实施例中,称之为探究组。使用数据集中前5年数据集中的数据作为训练数据训练tp1模型,如[2010

2016]数据集中x
ma
、y
amt
和x
pa
的前5年数据分别表示为和示意如下:
[0094][0095]
其中,表示向量的连接操作,即采用专利数据加股票数据进行amt的趋势预测。
[0096]
使用数据集中后1年数据集中的数据作为测试数据测试tp1模型,如[2010

2016]数据集中x
ma
、y
amt
和x
pa
的后1年数据分别表示为和示意如下:
[0097][0098]
步骤s130:将目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;
[0099]
具体地,在目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合之前,还包括:
[0100]
获取原始企业经营状况信息集合和原始企业市场趋势数据;
[0101]
将原始企业经营状况信息集合作为输入数据,将原始企业市场趋势数据作为输出数据,对第二原始预测模型进行训练,得到第二影响预测模型;
[0102]
具体地,还设置了对照组。在本实施例中,对照组只采用股票数据对y
amt
进行预测。使用数据集中前5年数据集中的数据作为训练数据训练tp2模型,如[2010

2016]数据集中x
ma
和y
amt
的前5年数据分别表示为和示意如下:
[0103][0104]
使用数据集中后1年数据集中的数据作为测试数据测试tp2模型,如[2010

2016]数据集中x
ma
和y
amt
的后1年数据分别表示为和示意如下:
[0105][0106]
在两组实验中,探究组采用专利加股票数据的方式对amt进行趋势预测,而对照组只采用股票数据对amt进行趋势预测。而与x
ma
和x
pa
相关的数据是已经确定的,而y
amt
的相关数据由于amt计算中的α未确定而无法确定。当确定了两组实验方式之后,就可以通过这两种实验方式确定α,具体的确定方法如下:
[0107]
先确定α的一个总体范围,而对于每家公司,在这个范围内选取一个合适的α。将α固定到一个范围f,例如f=[0.02,0.025,0.03.0.035.0.04.0.045.0.05],不同的公司在这个范围内选择一个适合自己的α,即不同的公司有不同的市场涨跌判断标准。使用对照组来确定合适的α,如果一个在对照组实验中表现最好的α,如果在加上专利数据后在探究组上
表现更好,则说明专利对y
amt
起了作用。在对照组中,将股票活动的向量化表示x
ma
作为输入,对范围f中的每一个数值点都依次赋值给α,依次训练对照组tp2模型,依次使用测试数据对训练好的模型进行测试。在所有测试结果中,选择模型输出结果准确率最高的α作为计算amt中的α。
[0108]
在α确定之后,就可以使用确定的α计算出公司的amt,进而确定y
amt
,此时x
ma
、x
pa
和y
amt
就均已确定了,就可以正式进行上述地探究组实验和对照组实验的训练操作。
[0109]
步骤s140:通过公式计算得到企业在各阶段的增长特征数据gr;其中,p
t
表示企业在t时刻的增长数据,p
t+

t
表示企业在t+δt时刻的增长数据;
[0110]
在本实施例中,增长特征数据gr表示市场的增长率,它是由时间t+δt时刻的股票市场收盘价减去时间t时刻的股票市场收盘价除以时间t时刻的股票市场收盘价所获得的,它是一个比例数值,gr>0表示市场上涨,gr<0表示市场下跌,c表示公司。
[0111]
步骤s150:通过公式计算得到平均市场趋势集合;其中,amt表示在一段时间内市场的平均趋势,它是对处于amt时间域中的gr进行平均,获得该时间区间内的一个波动值,t
i
表示处于[t,t+δt]中的i时刻,k表示t
i
∈[t,t+δt]中t
i
的个数,α表示判断阈值,通过判断阈值α对amt进行划分;具体地,按照gr的波动范围将这种趋势划分为三类,即1表示上涨,0表示平稳,

1表示下跌。
[0112]
步骤s160:将第一市场趋势集合和第二市场趋势集合分别与平均市场趋势集合进行比较,判断出专利是否对于企业产生影响。
[0113]
对本步骤进行具体说明,将第一市场趋势集合和第二市场趋势集合分别与平均市场趋势集合进行比较,判断出专利是否对于企业产生影响,包括:
[0114]
根据公式计算得到第一准确率acc1;其中,t1为第一市场趋势集合与平均市场趋势集合中相同元素的个数,f1为第一市场趋势集合与平均市场趋势集合中不同元素的个数;
[0115]
根据公式计算得到第二准确率acc2;其中,t2为第二市场趋势集合与平均市场趋势集合中相同元素的个数,f2为第二市场趋势集合与平均市场趋势集合中不同元素的个数;
[0116]
比较第一准确率acc1和第二准确率acc2的大小;
[0117]
若第一准确率acc1大于第二准确率acc2,则说明专利对于企业产生了影响;
[0118]
若第一准确率acc1小于第二准确率acc2,则说明专利对于企业没有产生影响。
[0119]
对于探究组实验的acc1大于对照组实验的acc2的公司,其中每一家公司分别继续计算这些公司的平均召回率arecall、平均精确aprecision、平均af1。计算方式如下:
[0120]
见下表,或均包含三种向量,y
amt
也包含三种向量。若相同,用tp表示;若
不同,用fp表示。每一家公司的探究组实验和对照组实验均可用下表表示,下面使用探究组实验进行示例:
[0121][0122][0123]
可知,平均召回率arecall:
[0124][0125]
平均精确aprecision:
[0126][0127]
平均af1:
[0128][0129]
平均准确率aacc:
[0130][0131]
同样地,对照组实验的计算方式与上面的计算方式一致。分别计算出探究组实验和对照组实验的平均召回率arecall、平均精确aprecision、平均af1指标、平均准确率aacc,然后探究组实验和对照组实验的对应指标相减,根据各指标的差值即可知道探究组实验(即加上专利数据的数据)比对照组实验(即不加专利数据的数据)在各项指标上提升的大小,是否起了作用。以上这些指标是对acc指标的补充,从多项指标上充分验证实验的准确性。如果这些指标的差值总体上大于0,则可以判断专利在这家公司的股票市场上发挥了作用。
[0132]
为了判断具体是专利数据中的哪些专利特征对公司产生了影响,若专利对于企业产生了影响,还包括:
[0133]
将专利信息集合中增加一组目标特征元素的数值或所有特征元素不变情况下的第一市场趋势减去从专利信息集合中减少或去除目标特征元素情况下的第一市场趋势,得到与目标特征元素对应的差值;
[0134]
对得到的所有差值均取绝对值;
[0135]
比较所有绝对值的大小,若绝对值越大,则说明与该绝对值对应的目标特征元素对于企业产生的影响越大。
[0136]
具体地,还使用“稳定性”这一指标来判断专利发挥作用的公司中专利的作用是否稳定,稳定性被定义为一家公司的专利对该公司股市发挥的作用是否稳定,即专利除了在某一段时间之内发挥了作用之外,是否在其他时间也同样发挥了作用。如果专利除了在某一段时间之内发挥了作用之外,在其他时间也同样发挥了作用,则说明该公司专利在该公司股票市场发挥作用并非偶然,也更加充分说明了专利在股票市场发挥了重要作用。
[0137]
影响分析方法ie是基于趋势预测模型tp而存在的,对于某一家公司而言,当选取好α后,就可以在α所对应的tp模型上进行影响分析方法ie了。
[0138]
具体的影响分析方法ie为:根据已经获得的训练好的tp模型,对模型的输入进行改变来观测输出的变化。对于要进行影响力分析的特征,修改输入向量数据的该特征值,修改方法有:用增加或不变某一特征值的模型输出减去减少或去除该特征值的模型输出结果的变化程度,即用增加或不变某一特征值的模型输出减去减少或去除该特征值的模型输出所得数值的绝对值,将此绝对值称为变化程度。对于每一个专利分类中的每一个数据集,每一个数据集中的每一家公司都实行此方法,最后求平均变化程度d,以d来作为影响力判断依据。该方法的概念表达式如下:
[0139]
x
u
=[x
ma
,x
pa
]
u
[0140][0141]
上式中,u表示特征的变化,x
u
表示特征向量集合x发生了改变,特征向量集合x由x
ma
,x
pa
组成,表示x变化后tp模型对amt的预测值。
[0142]
以增加、减少特征的数值为例,ie方法更加详细的计算公式如下所示:
[0143][0144]
其中,i表示改变待分析特征的名称,n表示该公司可能拥有的n组特征向量数据,k表示tp模型的输出维度。趋势预测模型tp的输入为两个向量序列集合,一组为特征i增加数值的特征向量集另一组为特征i减小数值的特征向量集对这两个特征集经过tp模型后输出的三维向量集中的每一个维度均进行相减求绝对值运算。对每一组向量,每一个维度做平均处理,即可得到特征i的平均变化程度d
i

[0145]
分析:
[0146]
对于特征向量集x中的每一个维度都得到与之对应的d
i
,对这些d
i
按照其在所有d
i
之和的占比进行从大到小排序,根据排序结果观测专利数据在排序中的位次,分析是否重要。若某一个特征排在较前位置,则说明该特征对市场的影响程度较大,反之,则较小。对每一个d
i
的占比按大小排序并绘图。
[0147]
参见图5,本发明实施例提供的评估专利对于企业产生影响的系统,包括:
[0148]
目标数据获取模块100,用于获取目标专利信息集合和目标企业经营状况信息集合;
[0149]
在本实施例中,目标专利信息集合中包含有一段时间内的多件专利,目标企业经营状况信息集合中包含有企业营业额、纳税额、股票等信息。
[0150]
第一市场趋势预测模块200,用于将目标专利信息集合和目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合;
[0151]
具体地,在将目标专利信息集合和目标企业经营状况信息集合中的各信息分别输入到预先训练好的第一影响预测模型中,得到第一市场趋势集合之前,还包括:
[0152]
第一原始数据获取模块,用于获取原始目标专利信息集合、原始企业经营状况信息集合和原始企业市场趋势数据;
[0153]
第一影响预测模型训练模块,用于将原始目标专利信息集合和原始企业经营状况信息集合作为输入数据,将原始企业市场趋势数据作为输出数据,对第一原始预测模型进行训练,得到第一影响预测模型。
[0154]
第二市场趋势预测模块300,用于将目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合;
[0155]
具体地,在目标企业经营状况信息集合中的各信息分别输入到预先训练好的第二影响预测模型中,得到第二市场趋势集合之前,还包括:
[0156]
第二原始数据获取模块,用于获取原始企业经营状况信息集合和原始企业市场趋势数据;
[0157]
第二影响预测模型训练模块,用于将原始企业经营状况信息集合作为输入数据,将原始企业市场趋势数据作为输出数据,对第二原始预测模型进行训练,得到第二影响预测模型。
[0158]
增长特征数据计算模块400,用于通过公式计算得到企业在各阶段的增长特征数据gr;其中,p
t
表示企业在t时刻的增长数据,p
t+

t
表示企业在t+δt时刻的增长数据;
[0159]
在本实施例中,增长特征数据gr表示市场的增长率,它是由时间t+δt时刻的股票市场收盘价减去时间t时刻的股票市场收盘价除以时间t时刻的股票市场收盘价所获得的,它是一个比例数值,gr>0表示市场上涨,gr<0表示市场下跌,c表示公司。
[0160]
平均市场趋势计算模块500,用于通过公式计算得到平均市场趋势集合;其中,amt表示在一段时间内市场的平均趋势,它是对处于amt时间域中的gr进行平均,获得该时间区间内的一个波动值,t
i
表示处于[t,t+δt]中的i时刻,k表示t
i
∈[t,t+δt]中t
i
的个数,α表示判断阈值,通过判断阈值α对amt进行划分;具体地,按照gr的波动范围将这种趋势
划分为三类,即1表示上涨,0表示平稳,

1表示下跌。
[0161]
第一分析模块600,用于将第一市场趋势集合和第二市场趋势集合分别与平均市场趋势集合进行比较,判断出专利是否对于企业产生影响。
[0162]
具体地,第一分析模块600,包括:
[0163]
第一准确率计算单元,用于根据公式计算得到第一准确率acc1;其中,t1为第一市场趋势集合与平均市场趋势集合中相同元素的个数,f1为第一市场趋势集合与平均市场趋势集合中不同元素的个数;
[0164]
第二准确率计算单元,用于根据公式计算得到第二准确率acc2;其中,t2为第二市场趋势集合与平均市场趋势集合中相同元素的个数,f2为第二市场趋势集合与平均市场趋势集合中不同元素的个数;
[0165]
比较单元,用于比较第一准确率acc1和第二准确率acc2的大小;若第一准确率acc1大于第二准确率acc2,则说明专利对于企业产生了影响;若第一准确率acc1小于第二准确率acc2,则说明专利对于企业没有产生影响。
[0166]
为了判断具体是专利数据中的哪些专利特征对公司产生了影响,还包括:
[0167]
求差值模块,用于若专利对于企业产生了影响,将专利信息集合中增加一组目标特征元素的数值或所有特征元素不变情况下的第一市场趋势减去从专利信息集合中减少或去除目标特征元素情况下的第一市场趋势,得到与目标特征元素对应的差值;
[0168]
求绝对值模块,用于对得到的所有差值均取绝对值;
[0169]
第二分析模块,用于比较所有绝对值的大小,若绝对值越大,则说明与该绝对值对应的目标特征元素对于企业产生的影响越大。
[0170]
以下的真实实验包括:
[0171]
步骤一:爬取数据,共爬取2000家上市公司在2010

2020年的股票市场数据和专利数据。选取了属于制造业中的上市公司,在制造业中又选取了拥有专利数量处于200

1000区间的公司,并按照专利数量分为三类,即拥有专利数量在200

400之间的公司94家,拥有专利数量在400

700之间的公司48家,拥有专利数量在700

1000之间的公司43家,如图6、图7和图8所示。
[0172]
步骤二:转换数据,将每一特征数据组合为特征向量。
[0173]
步骤三:搭建模型,分割数据集,并对专利的每一类中的每一数据集训练趋势预测模型并测试,并统计和计算实验结果。
[0174]
按照步骤三中的方法计算各个结果,利用结果绘图并分析:
[0175]
按照准确率,统计数据中加上专利数据的探究组实验准确率大于不加专利数据的对照组实验准确率的公司个数。使用2016表示使用[2010

2016]数据集,2017表示使用[2011

2017]数据集,以此类推。
[0176]
分析:在所统计公司中,专利起作用(即加上专利数据的预测结果更贴合真实值,准确率更高)的公司占比处于20%

35%之间,说明在这些制造业企业中专利起作用的公司占比不是太高,大部分公司的市值波动不在于专利。
[0177]
对于平均召回率、平均精确率、平均f1指标、平均准确率的差值,实验结果如图9、图10、图11、图12所示。
[0178]
由图9、图10、图11、图12可知,虽然专利起了作用但是准确率整体逐年呈现下滑趋势,则表明我国制造业很有可能渡过了高速发展期,技术储备趋向于成熟。召回率、精确率、f1差值则进一步体现了在专利起作用公司中,加了专利数据的整体指标表现更好,则说明专利在这些公司中发挥了较大的作用。
[0179]
对于稳定性,结果如图13、图14和图15所示。由图13、图14和图15可知,大部分公司的稳定性良好,真正体现出专利起作用的公司中专利发挥作用并非是偶然的,上述三图均表现出在2018年后,专利起作用公司的稳定性越来越强,也体现出专利在一部分公司中发挥越来越重要的作用,也表明它们可能已经形成了技术壁垒。
[0180]
步骤四:根据步骤二中通过影响计算方法ie计算得到的每个指标的d,根据步骤三对它们进行排序,所得结果如图16所示。其中,横坐标表示特征名称,其与描述中特征对应关系如下表所示:
[0181]
符号含义

l1表示经过一次小波变换后的低频信号

l2表示经过二次小波变换后的低频信号

h1表示经过一次小波变换后的高频信号

h2表示经过二次小波变换后的高频信号fiji,j均为数字,表示专利内容的技术特征app专利申请量pub专利发表量
[0182]
上述重要性图只展示了重要程度排名前30%左右的特征,可以看出,虽然专利相关的特征没有处于前5,但在前10中存在,也表明了专利中的某一部分特征比较重要,对公司市场影响较大。
[0183]
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd

rom、光学存储器等)上实施的计算机程序产品的形式。
[0184]
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0185]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0186]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或
其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0187]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
[0188]
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1