一种针对描述科技创新内容的智能比对评审方法与流程

文档序号:22047060发布日期:2020-08-28 18:52阅读:120来源:国知局
一种针对描述科技创新内容的智能比对评审方法与流程
本发明涉及技术文献识别对比
技术领域
,尤其是一种针对描述科技创新内容的智能比对评审方法。
背景技术
:我国科技型企业处于飞速发展阶段,为了提供更优的科技市场环境和鼓励企业研发具有自主知识产权的科研项目,制定了一系列的扶持政策,包括高薪企业认定等,可享受税收减免、资金补助、为企业上市等发展创造了便利条件,同时拥有自主知识产权的科技项目也是吸引投资方注资根本基础,对于一些科技项目的申报也少不了申报企业的知识产权情况说明。例如在科技项目、高新企业认定过程中,企业的知识产权申报量和知识产权运营能力往往是评审专家们认定企业是否符合高新企业特性的重要指标和加分项。有些企业以申报为目的,提供了大量与其自身产品项目无关的所属专利“充数”,不仅干扰了评审员的评审方向,也扰乱了高新企业认定市场。除高薪企业申报外,一些企业通过低品质专利“以次充好”套取投资人的资金,也是一种难以识别避免的现实情况。技术实现要素:本发明的目的在于提供一种针对描述科技创新内容的智能比对评审方法,技术文献在某一
技术领域
具体创新内容描述词组的排序、次比方面,具有高度的相似性,排序、次比相似范围越大,往往标志技术文献之间的相关性越大,本发明实现包括下列步骤:步骤一,从描述科技创新内容的文本中识别出作为科技成果的专利号,再通过专利号检索出所述专利文档,包括专利的申请、审查、授权文件;步骤二,把所述专利授权文件中摘要、权利要求书、说明书中出现的高频词组和/或词组组合按照出现次数由多至少进行排序,形成第一高频词组排序及排序范围;计算所述排序的高频词组和/或词组组合出现次数之间的比值,形成第一高频词组次比及次比范围;步骤三,把描述科技创新内容的文本中出现的高频词组和/或词组组合按照出现次数由多至少进行排序,形成第二高频词组排序及排序范围;计算所述排序的高频词组和/或词组组合出现次数之间的比值,形成第二高频词组次比及次比范围;步骤四,根据设定的排序范围和排序比较阈值,比较第二高频词组排序与第一高频词组排序是否相似,若相似,则进入步骤五;若不相似,则进入步骤六;步骤五,根据设定的次比范围和次比比较阈值,比较第二高频词组次比与第一高频词组次比是否相似,若相似,则进入步骤八;若不相似,则进入步骤七;步骤六,在第一高频词组排序范围内变更设定的排序范围,重新执行步骤四;步骤七,在第一高频词组次比范围内变更设定的次比范围,重新执行步骤五。步骤八,记录相应排序、次比范围及对应的词组和/或词组组合。所述步骤八还包括如下步骤:然后执行步骤六。本发明有如下优点:1、可智能识别描述科技创新内容文本与作为科技成果的专利文献之间的相关性以及相关性程度,快速筛除利用不相关专利技术支撑各类科技项目、高新企业资质的申报文件,避免人为因素的干扰;2、本发明特别适合各类科技项目技术评审的初审筛查,可以大大节省评审周期,节省评审人力资源,提高了评审效率;3、本发明中词组、词组组合的排序、排序范围、次比范围可以根据评审要求,灵活设置,具有高度的适应性,便于各类要求不同的科技项目评审使用。附图说明图1是本发明一种针对描述科技创新内容的智能比对评审方法流程图。具体实施方式实施例一,参见图1一种针对描述科技创新内容的智能比对评审方法,包括下列步骤:步骤一,从描述科技创新内容的文本中识别出作为科技成果的专利号,再通过专利号检索出所述专利文档,包括专利的申请、审查、授权文件;步骤二,把所述专利授权文件中摘要、权利要求书、说明书中出现的高频词组和/或词组组合按照出现次数由多至少进行排序,形成第一高频词组排序及排序范围;计算所述排序的高频词组和/或词组组合出现次数之间的比值,形成第一高频词组次比及次比范围;第一高频词组排序如下表,排序范围是1至10:第一高频词组次比如下表,以排序出现最多词组a出现次数为基数,计算其与其他排序词组出现次数之间的比值,次比范围1至10:排序词组次比1a12b0.93c0.84d0.75e0.66f0.57g0.48h0.39i0.210j0.1步骤三,把描述科技创新内容的文本中出现的高频词组和/或词组组合按照出现次数由多至少进行排序,形成第二高频词组排序及排序范围;计算所述排序的高频词组和/或词组组合出现次数之间的比值,形成第二高频词组次比及次比范围;第二高频词组排序如下表,排序范围是1至10:第二高频词组次比如下表,以排序出现最多词组a出现次数为基数,计算出其与其他排序词组出现次数之间的比值,次比范围1至10:排序词组次比1a12b0.93c0.84d0.65j0.56k0.47l0.38h0.29i0.110f0.09步骤四,根据设定的排序范围和排序比较阈值,比较第二高频词组排序与第一高频词组排序是否相似,若相似,则进入步骤五;若不相似,则进入步骤六;设定的排序范围1至10,排序比较阈值要求排序词组全部相同,经比较第二高频词组排序与第一高频词组排序不相同(相似)。步骤六,在第一高频词组排序范围内变更设定的排序范围,重新执行步骤四;设定的排序范围1至9,排序比较阈值要求排序词组全部相同,经比较第二高频词组排序与第一高频词组排序不相同(相似)。再执行步骤6。如此循环比较,直到设定的排序范围1至4,排序比较阈值要求排序词组全部相同,经比较第二高频词组排序与第一高频词组排序相同。步骤五,根据设定的次比范围和次比比较阈值,比较第二高频词组次比与第一高频词组次比是否相似,若相似,则进入步骤八;若不相似,则进入步骤七;设定的次比范围1至4,次比比较阈值要求词组之间次比全部相同,经比较第二高频词组次比与第一高频词组次比不相同(相似)。步骤七,在第一高频词组次比范围内变更设定的次比范围,重新执行步骤五。设定的次比范围1至3,次比比较阈值要求词组之间次比全部相同,经比较第二高频词组次比与第一高频词组次比相同。步骤八,记录相应排序、次比范围及对应的词组和/或词组组合。排序1至4的词组相同,参见下表:排序词组1a2b3c4d排序1至3的词组次比相同(出现次数比例),参见下表:排序词组次比1a12b0.93c0.8在上述步骤中,排序比较阈值、次比比较阈值还可以设定为至多有n个词组不同,n不大于设定的排序范围、次比。通过上述步骤获得的词组排序、次比相同、相似的信息,可以直观的展现描述科技创新内容文本与作为科技成果的专利文献之间的相关程度,排序、次比相同(相似)范围越大,往往标志技术文献之间的相关性越大。词组、词组组合的排序、排序范围、次比范围可以根据评审要求,灵活设置,具有高度的适应性,便于各类要求不同的科技项目评审使用。实施例二,其与实施例一不同之处在于,所述步骤八还包括如下步骤:然后执行步骤六,通过变更排序范围,再次对比核查两者相似程度,进一步确保对比结果的精确性。本发明并不局限于上述实施方式,任何本领域技术人员都可做多种修改和变化,在不脱离本发明的精神下,都在本发明所要求保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1