一种可研评审报告自动生成方法及存储介质与流程

文档序号:17741026发布日期:2019-05-24 20:06阅读:649来源:国知局
一种可研评审报告自动生成方法及存储介质与流程

本发明涉及自然语言处理领域,尤其涉及一种电力行业中专业词库的生成方法及存储介质。



背景技术:

目前可研内容的评审大部分可研报告上传到系统,依靠人工下载进行线下人工评审,省市基层单位项目数量多,可研文档内容复杂,基层人员业务专业素质参差不齐,评审专家资源有限,因此,可研内容评审环节一直以来比较薄弱,导致可研评审效率低,工作质量不高,可研深度难于把控。为了解决可研经济性审核难落地、投入产出缺乏实践论证,合规性审核质效不佳等问题,利用文本分析和自然语言处理等技术,结合业务专家评审的规则深入的审查和理解相关报告文件,精准指出报告中的缺点及潜在的问题,通过提供自动化的审核帮助用户解决耗时费力的审核问题,结合评审报告模板自动化生成可研评审报告,从而提高可研报告的编制质量及评审的效率。



技术实现要素:

为此,需要提供一种可研评审报告自动生成方法,解决现有技术中对于项目评审的辅助信息解析技术确实,可研报告均需要手动生成的问题;

为实现上述目的,发明人提供了一种可研评审报告自动生成方法,包括如下步骤,对获取的项目资料进行解析,通过机器学习算法提取项目资料中的投入信息,过程信息、产出信息及效果信息进行识别、从项目资料中提取分离,其中,投入信息包括项目的名称、目标资金或资金来源相关描述;过程信息包括项目工期,预算执行相关描述,产出信息包括实物资产、如产出物的名称、规格、数量或形成有效资产的价值;效果信息包括技术效果、经济效益、管理经验、社会影响的相关描述,

将所述投入信息、过程信息、产出信息及效果信息分类呈现,生成项目可研报告。

具体地,还包括步骤,结合项目知识元模型,实现数据及指标句群上下文信息,抽取时间、主体、指标、谓词、数值、单位,然后结合地域库、行业词表或机构特征词表,同时构造指标库采用人工监督的机器学习方法辅助主体抽取策略进行指标信息的抽取与识别,同时结合项目的结构化的基本信息,实现结构化数据指标的抽取。

一种可研评审报告自动生成存储介质,存储有计算机程序,所述计算机程序在被执行时进行以下步骤,对获取的项目资料进行解析,通过机器学习算法提取项目资料中的投入信息,过程信息、产出信息及效果信息进行识别、从项目资料中提取分离,其中,投入信息包括项目的名称、目标资金或资金来源相关描述;过程信息包括项目工期,预算执行相关描述,产出信息包括实物资产、如产出物的名称、规格、数量或形成有效资产的价值;效果信息包括技术效果、经济效益、管理经验、社会影响的相关描述,

将所述投入信息、过程信息、产出信息及效果信息分类呈现,生成项目可研报告。

优选地,所述计算机程序在被执行时还进行包括步骤,结合项目知识元模型,实现数据及指标句群上下文信息,抽取时间、主体、指标、谓词、数值、单位,然后结合地域库、行业词表或机构特征词表,同时构造指标库采用人工监督的机器学习方法辅助主体抽取策略进行指标信息的抽取与识别,同时结合项目的结构化的基本信息,实现结构化数据指标的抽取。

区别于现有技术,本发明通过将项目资料分成“投入、过程、产出、效益”四方面的描述,解决事前审查与事中监控、事后评价衔接不够紧密的问题。方便了可研报告的自动生成,提高了项目资料审查的效率。

附图说明

图1为本发明一实施方式涉及的可研评审报告自动生成方法流程图。

具体实施方式

为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。

围绕公司预算信息化提升与全业务数据中心工作内容,以项目可研经济性、财务合规性审核的问题为切入点,引入预算绩效管理理念,创新智能评审工具,实现项目在线审核“四个可以”,即“投入产出可评价、投资领域可归集、智能评审可应用、单体效益可测算”。

1、建立绩效评价机制,生成评审模型

依托资料完整性、可研经济性及财务合规性评价工作的机制,进行绩效目标编制和评审。其中绩效目标主要从投入、过程、产出、效果四个方面进行评审,投入主要关注投入目标的方向是否合理、资金利用效率、融资方案是否可行;过程主要关注项目工期,预算执行均衡性等,体现资产形成的及时性;产出主要关注实物资产,产出物的名称、规格、数量,形成有效资产的价值;效果主要关注效益效果,从技术、经济、管理、社会四方面的效果进行综合考量。

2、结合机器学习和自然语言处理技术生成分析模型,模板引擎结合评审指标结果生成评审报告。

在图1所示的一下实施例中,为本发明方案的一种可研评审报告自动生成方法,包括如下步骤,s100对获取的项目资料进行解析,通过机器学习算法提取项目资料中的投入信息,过程信息、产出信息及效果信息进行识别、从项目资料中提取分离,其中,投入信息包括项目的名称、目标资金或资金来源相关描述;过程信息包括项目工期,预算执行相关描述,产出信息包括实物资产、如产出物的名称、规格、数量或形成有效资产的价值;效果信息包括技术效果、经济效益、管理经验、社会影响的相关描述,

s102将所述投入信息、过程信息、产出信息及效果信息分类呈现,生成项目可研报告。

具体还可以通过如下步骤实现:

1)、根据储备项目的全过程管理及评审模型建立知识元及知识体系。

2)、结合知识库,实现项目相关知识元的抽取及识别,二次加工。

步骤如下:

(1)、构建非结构化文档解析引擎,支撑读取word、excel、pdf、wps等非结构化文档内容,并进行图文分析,实现文本内容及表格、图片内容的识别。

(2)、在非结构化文本内容中中抽取含有指标相关的的句群组成数值句群库,包括指标句群识别与抽取、过滤、排重等。

(3)、结合项目知识元模型,实现数据及指标句群上下文信息,抽取时间、主体、指标、谓词、数值、单位,然后结合地域库、行业词表、机构特征词表,同时构造指标库辅助主体抽取策略进行指标信息的抽取与识别(采用基于规则的机器学习算法,不断学习与调整各类场景,同时采用人工监督模式学习,使抽取规则达到更优),同时结合项目的结构化的基本信息,实现结构化数据指标的抽取,实现整个项目知识体系的建立。

(4)、根据评审模型实现各项评审指标的评价及分析,根据分值权重实现评审指标打分。

(5)、模板引擎结合评审报告模板及各项指标评审结果,生成评审报告,同时提供在线查看及人工修订。

一种可研评审报告自动生成存储介质,存储有计算机程序,所述计算机程序在被执行时进行以下步骤,对获取的项目资料进行解析,通过机器学习算法提取项目资料中的投入信息,过程信息、产出信息及效果信息进行识别、从项目资料中提取分离,其中,投入信息包括项目的名称、目标资金或资金来源相关描述;过程信息包括项目工期,预算执行相关描述,产出信息包括实物资产、如产出物的名称、规格、数量或形成有效资产的价值;效果信息包括技术效果、经济效益、管理经验、社会影响的相关描述,

将所述投入信息、过程信息、产出信息及效果信息分类呈现,生成项目可研报告。

优选地,所述计算机程序在被执行时还进行包括步骤,结合项目知识元模型,实现数据及指标句群上下文信息,抽取时间、主体、指标、谓词、数值、单位,然后结合地域库、行业词表或机构特征词表,同时构造指标库采用人工监督的机器学习方法辅助主体抽取策略进行指标信息的抽取与识别,同时结合项目的结构化的基本信息,实现结构化数据指标的抽取。

需要说明的是,尽管在本文中已经对上述各实施例进行了描述,但并非因此限制本发明的专利保护范围。因此,基于本发明的创新理念,对本文所述实施例进行的变更和修改,或利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接地将以上技术方案运用在其他相关的技术领域,均包括在本发明的专利保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1