一种基于大数据的科技项目申报辅导系统的制作方法

文档序号:27909003发布日期:2021-12-11 07:19阅读:112来源:国知局
一种基于大数据的科技项目申报辅导系统的制作方法

1.本发明涉及科技项目申报技术领域,具体是一种基于大数据的科技项目申报辅导系统。


背景技术:

2.项目申报是指政府机关针对企业或其他研究单位作出的一系列优惠政策,企业或相关研究单位再根据政府的政策进行编写申报文件然后根据相关申报要求和流程进行申报。可申请的项目包括国家省市资助计划体系及各部委资助计划比如863计划,973计划,科技型中小企业创新基金,中小企业发展专项资金,企业科技新技术,国家社科基金,国家自科基金,省社科基金、省自科基金等不同级别的项目,申请时难度不同,申请人的资格和条件也各有不同。
3.随着我国科技项目规模的快速增长,其评审难度也在不断增大,科技项目的“多体系申报”与“重复立项”问题日益凸显。据不完全统计,我国历年的科技申报项目中,与国内历史申报项目的重复率超过40%,与国外历史申报项目及公开技术的重复率占比接近20%。科技项目的重复投入与重复研宄等问题将导致一些优质科技项目因国家科技项目资助计划的桎梏而无法获得资助,一方面造成了科研资源的浪费,另一方面也造成了科研计划的无序发展与低水平重复,不仅损害了科技研宄的宏观效益,而且导致了知识资产的流失。


技术实现要素:

4.本发明的目的在于提供一种基于大数据的科技项目申报辅导系统,以解决上述背景技术中提出的问题。
5.为实现上述目的,本发明提供如下技术方案:
6.一种基于大数据的科技项目申报辅导系统,包括服务器、申报模块、数据库、文本检测模块及审核模块;
7.所述申报模块用于用户提交科技项目申报书;
8.所述数据库用于存储不相似的文本数据;
9.所述文本检测模块用于对所提交的科技项目申报书进行相似性检测,并将检测结果反馈至审核模块;
10.所述审核模块用于将获取的检测结果进行进一步审核,并将审核后的数据上传至服务器;
11.所述服务器用于对接收到的科技项目申报书及审核后的数据进行数据交换。
12.作为本发明进一步的方案:所述数据库分别与文本检测模块及服务器建立数据共享。
13.作为本发明再进一步的方案:所述数据库包括数据存储模块,所述数据存储模块可对数据库的数据进行动态更新。
14.作为本发明再进一步的方案:所述文本检测模块包括文本预处理模块、相似度计算模块及分析模块,所述文本预处理模块将所提交的科技项目申报书与数据存储模块中的数据均发送至相似度计算模块中对所提交的科技项目申报书的相似性进行检测,所述分析模块用以对计算结果进行分析。
15.作为本发明再进一步的方案:所述文本预处理模块用于对所提交的科技项目申报书中的文本信息进行提取,并将其提取的结构采用文本表示模型进行显示。
16.作为本发明再进一步的方案:提取的文本信息包括对文本分词的提取、关键词的提取以及文本有效句子的提取。
17.作为本发明再进一步的方案:所述相似度计算模块包括对文本的基本内容相似度计算、详细内容相似度计算机文本语义相似度计算。
18.作为本发明再进一步的方案:所述分析模块用于对计算结果进行判断分析,对于不相似的文本进行数据库存储,并返回给审核模块,进入后续的评审阶段,对于相似性高的文本,提取相似度高的文本片段进行对比显示,以查看它们具体的相似情况,提供决策支持。
19.作为本发明再进一步的方案:所述分析模块中设置有文本阈值及句子阈值,所述文本阈值用于显示最终的相似度文本,所述句子阈值用于显示两篇对比的申报书详细的比对信息。
20.作为本发明再进一步的方案:所述数据库中设置有不同领域的数据对比库。
21.与现有技术相比,本发明的有益效果是:
22.本发明进一步提高科技项目的相似性评估精度,有效缓解重复立项的问题,以确保科研经费的有效利用,同时,可辅助审查人员做出合理的决策,且大大提高了审核的效率,进而推动我国科技项目审查工作的智能化管理。
附图说明
23.图1为一种基于大数据的科技项目申报辅导系统的结构示意图。
24.图2为一种基于大数据的科技项目申报辅导系统中文本检测模块的结构示意图。
25.图3为一种基于大数据的科技项目申报辅导系统中文本检测模块的流程图。
具体实施方式
26.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
27.请参阅图1~3,本发明实施例中,一种基于大数据的科技项目申报辅导系统,包括服务器、申报模块、数据库、文本检测模块及审核模块;所述申报模块用于用户提交科技项目申报书;所述数据库用于存储不相似的文本数据;所述文本检测模块用于对所提交的科技项目申报书进行相似性检测,并将检测结果反馈至审核模块;所述审核模块用于将获取的检测结果进行进一步审核,并将审核后的数据上传至服务器;所述服务器用于对接收到的科技项目申报书及审核后的数据进行数据交换。
28.所述数据库分别与文本检测模块及服务器建立数据共享。
29.所述数据库包括数据存储模块,所述数据存储模块可对数据库的数据进行动态更新。
30.所述文本检测模块包括文本预处理模块、相似度计算模块及分析模块,所述文本预处理模块将所提交的科技项目申报书与数据存储模块中的数据均发送至相似度计算模块中对所提交的科技项目申报书的相似性进行检测,所述分析模块用以对计算结果进行分析。
31.所述文本预处理模块用于对所提交的科技项目申报书中的文本信息进行提取,并将其提取的结构采用文本表示模型进行显示。
32.提取的文本信息包括对文本分词的提取、关键词的提取以及文本有效句子的提取。
33.所述相似度计算模块包括对文本的基本内容相似度计算、详细内容相似度计算机文本语义相似度计算。
34.所述分析模块用于对计算结果进行判断分析,对于不相似的文本进行数据库存储,并返回给审核模块,进入后续的评审阶段,对于相似性高的文本,提取相似度高的文本片段进行对比显示,以查看它们具体的相似情况,提供决策支持。
35.所述分析模块中设置有文本阈值及句子阈值,所述文本阈值用于显示最终的相似度文本,所述句子阈值用于显示两篇对比的申报书详细的比对信息。
36.所述数据库中设置有不同领域的数据对比库。
37.科技项目申报书的查重是项目评审阶段一个重要的环节,对于评审工作组来说也是一项重要的工作,本系统的设计科达到实现一个对科技项目申报书的自动检测,这种检测是在语义分析的基础上并提供相似对比文本的目的,以方便工作人员进行决策,本系统主要针对科技项目申报书做中文文本信息处理,支持对数据库的动态更新,把不相似的文本存储到数据库中,增加比对库,其次,可对对输入的文本进行自动处理,转化为计算机识别的文本,再次,对结果显示进行相似度高的文本片段进行对比显示,方便查看抄袭情况,提供决策支持,基于以上特点本系统采用c/s架构进行搭建,当项目申报者向服务器提交项目申报书,服务器便会感知有数据更新,并通过文本检测模块对所提交的项目申报书进行相似性检测,根据检测结果及相似详情,将结果反馈给审核模块。
38.在文本检测模块中,对已立项项目申报书按照项目所属领域,分别对不同领域的申报书进行文本抽取,分别提取出项目基本情况中包含的“项目名称”和“主题词”及“项目简介”、“立项背景”、“国内外比较”、“主要科学技术”、“创新点”等内容,读入到内存中,然后再插入到相应领域的数据库中的相应字段中,这样需要的对比库就建好了,当系统得到待检测文本时,首先对待检测文本进行提取与读入,然后利用相应的相似度计算方法分别计算项目基本情况字段的相似度和详细内容的不同字段的相似度,将得到的计算结果进行计算得到文本的相似度,最后利用系统中的分析模块对计算结果进行判断分析,对于不相似的文本进行数据库存储,返回给审核模块,进入后续的评审阶段,对于相似性高的文本,提取相似度高的文本片段进行对比显示,以查看它们具体的相似情况,提供决策支持。
39.分析模块主要是对经过相似度计算模块得到的相似度集合中的结果进行比较与分析。具体方法如下:首先将相似度集合中的值与预先设定的文本相似度阈值θ1进行比较,
如果集合中的相似度值高于或等于设定的阈值,则暂判定该项目申报书与已有项目申报书属于相似项目,进一步通过两项目句子相似度高于某一片段阈值θ2的相似度句子进行对比显示以实现相似性的裁定;如果相似度集合中没有大于或等于文本相似度阈值θ1的申报书,说明带检测申报书与已有申报书无相关性。
40.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1