一种碳捕获与封存技术路线图生成方法及系统与流程

文档序号:16146959发布日期:2018-12-05 16:36阅读:611来源:国知局
一种碳捕获与封存技术路线图生成方法及系统与流程

本发明涉及利用数据库开展技术预见领域,特别是涉及一种碳捕获与封存技术路线图生成方法及系统。

背景技术

绘制技术路线图的传统方法主要是依靠专家问卷调查,速度慢、客观性弱、准确性差、自动化程度低,远远不能满足大数据背景下的碳捕获与封存技术规划的需求。碳捕获与封存技术是重要的绿色技术,对于减少大气中二氧化碳发挥着重要作用,对于应对气候变化和实现可持续发展至关重要,目前没有绘制碳捕获与封存技术路线图的智能化技术方案,因此,研发碳捕获与封存技术路线图生成方法及系统,实现碳捕获与封存技术路线图的快速、高效、精准、自动化绘制,成为本领域研究人员亟待解决的技术问题。



技术实现要素:

本发明的目的是提供一种碳捕获与封存技术路线图生成方法及系统,来克服传统方法的速度慢、准确性低、自动化程度低等缺点。

为实现上述目的,本发明提供了如下方案:

一种碳捕获与封存技术路线图生成方法,所述方法包括:

获取与碳捕获与封存相关的专利申请文件;

根据所述专利申请文件,获取所述专利申请文件的题目、摘要以及关键词,得到专利数据库;

根据所述专利数据库通过机器学习识别专利空白及其特征向量;

根据所述专利空白及其特征向量,通过s型曲线拟合预测出专利空白的发展阶段时间点;

根据所述专利空白的发展阶段时间点通过甘特图绘制方法生成碳捕获与封存技术路线图。

可选的,所述获取与碳捕获与封存相关的专利申请文件具体包括:

获取包括二氧化碳、气体二氧化碳、存储、捕获以及再生的关键词的专利申请文件。

可选的,所述根据所述专利数据库通过机器学习识别专利空白及其特征向量具体包括:

根据所述专利申请文件的题目、摘要以及关键词,通过分词操作构建专利多维特征向量;

对所述专利多维特征向量进行降维,得到专利二维特征平面图;

根据所述专利二维特征平面图,通过定位空白区域的横纵坐标,识别专利空白及其特征向量。

可选的,所述构建专利多维特征向量具体包括:

根据所述专利数据库,通过分词操作构建语料库;

根据所述语料库提取高频词汇作为多维特征向量,所述高频词汇为出现次数大于设定阈值的词汇。

可选的,所述根据所述语料库提取高频词汇作为多维特征向量具体包括:

在所述专利数据库中进行检索,得到检索结果;

若所述检索结果表示所述专利申请文件中包含高频词汇,则对应的特征向量的元素值为1;

若所述检索结果表示所述专利申请文件中不包含高频词汇,则对应的特征向量的元素值为0。

可选的,在所述生成碳捕获与封存技术路线图之后还包括:

根据数据粒度,将所述专利空白的发展阶段时间点以雪花型数据结构输出并存储。

本发明另外提供一种碳捕获与封存技术路线图生成系统,所述系统包括:

专利申请文件获取模块,用于获取与碳捕获与封存相关的专利申请文件;

专利数据库获取模块,用于根据所述专利申请文件,获取所述专利申请文件的题目、摘要以及关键词,得到专利数据库;

专利空白及其特征向量识别模块,用于根据所述专利数据库通过机器学习识别专利空白及其特征向量;

专利空白的发展阶段时间点预测模块,用于根据所述专利空白及其特征向量,通过s型曲线拟合预测出专利空白的发展阶段时间点;

碳捕获与封存技术路线图生成模块,用于根据所述专利空白的发展阶段时间点通过甘特图绘制方法生成碳捕获与封存技术路线图。

存储模块,用于根据数据粒度,将所述专利空白的发展阶段时间点以雪花型数据结构输出并存储。

可选的,所述专利空白及其特征向量识别模块具体包括:

专利多维特征向量构建单元,用于根据所述专利申请文件的题目、摘要以及关键词,通过分词操作构建专利多维特征向量;

专利二维特征平面图生成单元,用于对所述专利多维特征向量进行降维,得到专利二维特征平面图;

专利空白及其特征向量识别单元,用于根据所述专利二维特征平面图,通过定位空白区域的横纵坐标,识别专利空白及其特征向量。

根据本发明提供的具体实施例,本发明公开了以下技术效果:

本发明中通过获取与碳捕获与封存相关的专利申请文件,并根据专利申请文件,获取专利申请文件的题目、摘要以及关键词,得到专利数据库;通过根据专利数据库通过机器学习识别专利空白及其特征向量,通过根据专利空白及其特征向量,用s型曲线拟合预测出专利空白的发展阶段时间点,通过根据所述专利空白的发展阶段时间点通过甘特图绘制方法最终生成碳捕获与封存技术路线图,具有快速、高效、精准、自动化程度高等优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例碳捕获与封存技术路线图生成方法流程图;

图2为本发明实施例碳捕获与封存技术路线图生成系统结构图。

图3(a)、图3(b)、图3(c)、图3(d)分别为本发明实施例雪花型数据结构输出图;

图4为本发明实施例碳捕获与封存的现有技术发展时间预测图;

图5为本发明实施例碳捕获与封存技术路线图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种碳捕获与封存技术路线图生成方法及系统,来克服传统方法的速度慢、准确性低、自动化程度低等缺点.

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例碳捕获与封存技术路线图生成方法流程图,如图1所示,所述方法包括:

步骤101:获取与碳捕获与封存相关的专利申请文件;

步骤102:根据所述专利申请文件,获取所述专利申请文件的题目、摘要以及关键词,得到专利数据库;

步骤103:根据所述专利数据库通过机器学习识别专利空白及其特征向量;

步骤104:根据所述专利空白及其特征向量,通过s型曲线拟合预测出专利空白的发展阶段时间点;

步骤105:根据所述专利空白的发展阶段时间点通过甘特图绘制方法生成碳捕获与封存技术路线图;

步骤106:根据数据粒度,将所述专利空白的发展阶段时间点以雪花型数据结构输出并存储。

下面对各步骤做详细介绍:

步骤101中,获取与碳捕获与封存相关的专利申请文件具体包括:

获取包括二氧化碳、气体二氧化碳、存储、捕获以及再生的关键词的专利申请文件。或者获取包括二氧化碳、气体二氧化碳、存储、捕获以及再生的关键词的论文、政府文件以及媒体报道等。

其中,对专利申请文件的获取是在世界知识产权库(wipo)数据库,美国专利商标局(uspto)数据库、欧洲专利局(epo)数据库以及中国国家知识产权局(sipo)数据库等。

检索采用国际专利分类(ipc)、联合专利分类(cpc)和关键词联合检索,其中,ipc代码包括“b63b035、c01b003、c01b031/20、c01b031/22、c02f001、c07c007/10、f01n003/10、f25j003/02、b01j020、b01d053、b01d011”,cpc代码包括“b01d2257/504、y02c10/00、y02c10/02、y02c10/04、y02c10/06、y02c10/08、y02c10/10、y02c10/12”,关键词包括“carbon-dioxide、gasdioxide、co2、storage、capture、recover、deliver、regenerate”等。此外,本发明中的该方法适用于任何主题的检索式。

步骤103中,根据所述专利数据库通过机器学习识别专利空白及其特征向量具体包括:

根据所述专利申请文件的题目、摘要以及关键词,通过分词操作构建专利多维特征向量;

对所述专利多维特征向量进行降维,得到专利二维特征平面图;

根据所述专利二维特征平面图,通过定位空白区域的横纵坐标,识别专利空白及其特征向量。

其中,所述降维处理,使用的方法包括非线性降维方法和线性降维方法。非线性降维方法为:t分布随机近邻嵌入(t-distributedstochasticneighborembedding,t-sne),生成拓扑映射(generativetopographicmapping,gtm);线性降维方法为:主成分分析(principalcomponentanalysis,pca)。

其中,构建专利多维特征向量具体包括:

根据所述专利数据库,通过分词操作构建语料库;

根据所述语料库提取高频词汇作为多维特征向量。

所述高频词汇为出现次数大于设定阈值的词汇。

其中,根据所述语料库提取高频词汇作为多维特征向量具体包括:

在所述专利数据库中进行检索,得到检索结果;

若所述检索结果表示所述专利申请文件中包含高频词汇,则对应的特征向量的元素值为1;

若所述检索结果表示所述专利申请文件中不包含高频词汇,则对应的特征向量的元素值为0。

具体的,步骤105中,利用所述的甘特图绘制方法,所述的碳捕获与封存技术路线图,包括单一碳捕获与封存技术的路线图、碳捕获与封存技术的组合路线图。

具体的,步骤106中,此处数据存储选择雪花型数据结构,是因为利用s型曲线拟合,预测所述专利空白的发展阶段时间点,我们可以设置时间粒度为“星期”、“月”、“季度”、“年”等,这样绘制出的路线图对应的横轴(时间轴)的分度值就不一样(即精细度不一样)。基于上述方案,数据结构中涉及了时间维度,所以存储为雪花型数据结构。对应的,如果不考虑时间粒度,数据存储为星型结构也可以。

图2为本发明实施例碳捕获与封存技术路线图生成系统结构图,如图2所示,所述系统包括:

专利申请文件获取模块201,用于获取与碳捕获与封存相关的专利申请文件;

专利数据库获取模块202,用于根据所述专利申请文件,获取所述专利申请文件的题目、摘要以及关键词,得到专利数据库;

专利空白及其特征向量识别模块203,用于根据所述专利数据库通过机器学习识别专利空白及其特征向量;

专利空白的发展阶段时间点预测模块204,用于根据所述专利空白及其特征向量,通过s型曲线拟合预测出专利空白的发展阶段时间点;

碳捕获与封存技术路线图生成模块205,用于根据所述专利空白的发展阶段时间点通过甘特图绘制方法生成碳捕获与封存技术路线图。

存储模块206,用于通过数据粒度,将所述专利空白的发展阶段时间点以雪花型数据结构输出并存储。

具体的,所述专利空白及其特征向量识别模块203具体包括:

专利多维特征向量构建单元2031,用于根据所述专利申请文件的题目、摘要以及关键词,通过分词操作构建专利多维特征向量;

专利二维特征平面图生成单元2032,用于对所述专利多维特征向量进行降维,得到专利二维特征平面图;

专利空白及其特征向量识别单元2033,用于根据所述专利二维特征平面图,通过定位空白区域的横纵坐标,识别专利空白及其特征向量。

具体的,所述专利多维特征向量构建单元2031具体包括:

语料库构建子单元20311,用于根据所述专利数据库,通过分词操作构建语料库;

多维特征向量提取子单元20312,用于根据所述语料库提取高频词汇作为多维特征向量;所述高频词汇为出现次数大于设定阈值的词汇。

图3(a)、图3(b)、图3(c)、图3(d)分别为本发明实施例雪花型数据结构输出图,如图3(a)、图3(b)、图3(c)、图3(d)所示,每个图中中空白部分(由四条线段圈起来的处于中间位置的矩形),即为专利发展的空白,表示此领域还未有相应的专利申请、论文发表、政府文件或媒体报道。本实施例使用的降维技术是t分布随机近邻嵌入(t-distributedstochasticneighborembedding,t-sne),降到2维投影(2dt-sneprojection),分别为维度1(dimension1)和维度2(dimension2)。

图4为本发明实施例碳捕获与封存的现有技术发展时间预测图,如图4所示,本实施例获取专利文件的来源是美国专利商标局(uspto)数据库,针对5种主要的碳捕获与封存现有技术,包括生物分离(biologicalseparation)、化学分离(chemicalseparation)、吸收(absorption)、膜分离或扩散(membranesordiffusion)、地下或海底co2封存(subterraneanorsubmarineco2storage),根据检索结果已知的第一个专利申请时间(firstapply)和专利样本分布情况,通过巴斯模型(bassmodel)进行非线性参数估计,即可获得技术开始时间(startpoint)和技术结束时间(endpoint),即可绘制出碳捕获与封存的现有技术发展时间预测图,其中技术开始时间对应专利样本累计概率分布5%的点,技术结束时间对应专利样本累计概率分布95%的点。本实施例的数据粒度为“季度”(以q表示),一年中的4个季度分别表示为1q、2q、3q、4q。

图5为本发明实施例碳捕获与封存技术路线图,如图5所示,本实施例获取专利文件的来源是美国专利商标局(uspto)数据库,在图4的基础上,利用本发明提出的技术方案,识别出4个专利空白,包括多孔渗水聚合物、含硫烟道气吸收膜、烟道气的蒸汽吸收法、碳氢化合物的蒸馏提取法。根据专利空白的周围相邻专利申请文件的信息,获得第一个专利申请时间(firstapply)和专利样本分布情况,通过巴斯模型(bassmodel)进行非线性参数估计,即可获得技术开始时间(startpoint)和技术结束时间(endpoint),即可绘制出碳捕获与封存技术路线图,其中技术开始时间对应专利样本累计概率分布5%的点,技术结束时间对应专利样本累计概率分布95%的点。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1