ESG评分体系的生成方法、装置、设备及可读存储介质与流程

文档序号:19310550发布日期:2019-12-03 23:28阅读:510来源:国知局
ESG评分体系的生成方法、装置、设备及可读存储介质与流程

本发明涉及金融科技(fintech)技术领域,尤其涉及金融行业的esg评分体系的生成方法、装置、设备及可读存储介质。



背景技术:

随着计算机技术的发展,越来越多的技术(如分布式、区块链blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(fintech)转变,越来越多的技术应用于金融行业。金融行业通常会用到esg评价体系,esg(environment、socialresponsibility、corporategovernance),即环境,社会和公司治理,是指衡量公司或企业投资的可持续性和道德影响的三个核心因素。目前市场应用的esg评价体系,都依赖于行业专家和分析师的经验制定esg指标和权重,这种传统的模式有以下几个缺陷:

1、esg分析所用的数据来自公司的主动披露,评分结果依赖信息披露程度;

2、esg分析所用的数据有滞后性,评分不能及时反映公司当下的状态;

3、不同的esg分析机构或者同一esg分析机构在不同时间段,使用的评分指标集不同,相同的指标也会有不同的定义,从而导致同一家公司会有不一致、不稳定的评分结果。



技术实现要素:

本发明的主要目的在于提出一种esg评分体系的生成方法、装置、设备及可读存储介质,旨在解决现有技术中esg评分体系过于依赖人为分析而导致评分结果不稳定的问题。

为实现上述目的,本发明提供一种esg评分体系的生成方法,所述esg评分体系的生成方法包括如下步骤:

将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;

将当前获取的第一舆情数据及所述第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度;

基于所述历史热度、当前热度及当前指标,获得esg最新评分卡。

可选地,所述将历史数据放入esg指标生成器处理,得到历史指标对应的历史热度的步骤之前,所述esg评分体系的生成方法包括:

从网络上采集数据信息,且基于所述数据信息构建海量语料库;

根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库;

确定行业对应的一级种子词汇,将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度;

通过所述主题提取器对所述二级指标及二级热度进行迭代处理,得到esg指标生成器。

可选地,所述根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库的步骤包括:

根据预设行业标准,利用文本分析技术对所述海量语料库中的数据信息进行分类处理,得到行业语料库。

可选地,所述将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度的步骤包括:

利用自然语言处理技术及主题模型,确定主题提取器;

将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度。

可选地,所述基于所述历史热度、当前热度及当前指标,获得esg最新评分卡的步骤包括:

基于esg指标体系库,获取所述历史热度及历史权重;

基于所述历史热度、当前热度,调节所述历史权重,得到esg最新评分卡。

可选地,所述基于esg指标体系库,获取所述历史热度及历史权重的步骤之前,所述esg评分体系的生成方法包括:

将所述历史热度进行归一化处理,得到历史权重;

基于所述历史指标、历史热度及历史权重,得到esg基础评分卡;

将所述esg基础评分卡放入esg指标体系库。

可选地,所述基于所述历史热度、当前热度及当前指标,获得esg最新评分卡的步骤之后,所述esg评分体系的生成方法包括:

获取企业当前的第二舆情数据;

基于所述esg指标体系库,获取所述历史指标;

通过自然语言处理技术,基于所述第二舆情数据、历史指标及所述esg最新评分卡,得到所述企业的esg得分;

将所述esg得分进行可视化处理。

此外,为实现上述目的,本发明还提供一种esg评分体系的生成装置,所述esg评分体系的生成装置包括:

第一处理模块,用于将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;

第二模块,用于将当前获取的第一舆情数据及所述第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度;

评分模块,用于基于所述历史热度、当前热度及当前指标,获得esg最新评分卡。

此外,为实现上述目的,本发明还提供一种esg评分体系的生成设备,所述esg评分体系的生成设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的esg评分体系的生成程序,所述esg评分体系的生成程序被所述处理器执行时实现如上所述的esg评分体系的生成方法的步骤。

此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有esg评分体系的生成程序,所述esg评分体系的生成程序被处理器执行时实现如上所述的esg评分体系的生成方法的步骤。

本发明提出的esg评分体系的生成方法,将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;获取当前的第一舆情数据,第一舆情数据可以利用ai技术获得,不依赖于专家和分析师团队;使用广泛的舆情数据代替公司披露,数据全面而且独立;将第一舆情数据及第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度,并基于所述历史热度、当前热度及当前指标,获得esg最新评分卡,使得评分卡能够及时有效更新,评分结果可以达到预警的效果。本发明的方法,减少了人为因素的影响,使得结评分果更客观、一致及稳定。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图;

图2为本发明esg评分体系的生成方法第一实施例的流程示意图;

图3为本发明esg评分体系的生成方法第一实施例的流程框图;

图4为本发明esg评分体系的生成方法第二实施例的流程示意图;

图5为本发明esg评分体系的生成方法第三实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

本发明实施例esg评分体系的生成设备可以是pc机或服务器设备。

如图1所示,该esg评分体系的生成设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及esg评分体系的生成程序。

在图1所示的设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的esg评分体系的生成程序,并执行下述esg评分体系的生成方法各个实施例中的操作。

基于上述硬件结构,提出本发明esg评分体系的生成方法实施例。

参照图2,图2为本发明esg评分体系的生成方法第一实施例的流程示意图,所述方法包括:

步骤s10,将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;

本实施例中,esg(environmental,socialandgovernance)通常代表环境、社会和公司治理三大因素,是社会责任投资中投资决策的重要考量因子,而社会责任投资选择的投资对象就是除了企业基本面表现外,一般在这三大因素下表现更为优秀的企业。

esg指标生成器的构建过程为:从网络上采集数据信息,且基于所述数据信息构建海量语料库;根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库;确定行业对应的一级种子词汇,将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度;通过所述主题提取器对所述二级指标及二级热度进行迭代处理,得到esg指标生成器。

通过将历史数据及历史数据对应的第一种子词汇放入esg指标生成器中,得到历史指标对应的历史热度,在esg评分体系中,一级指标为环境、社会和公司治理三个维度。二级指标为环境、社会和公司治理下的13项分类议题,如环境下的二级指标包括环境目标、环境管理、环境披露及负面事件等。三级指标将会涵盖具体的esg指标,共有127项三级指标,例如社会方面的三级指标包括劳工政策、员工政策、女性员工、多样化、供应链责任管理等30多项指标。评估体系分为通用指标和行业特定指标。通用指标适用于所有上市公司,行业特定指标是指各行业特有的指标,只适用于本行业分类内的公司。

本案中的历史指标,是指构建esg基础评分卡时的各级指标,例如,n级指标f1,f2……fn,即历史指标包括历史一级指标f1,历史二级指标f2等,对应的历史热度,即历史一级热度h1,历史二级热度h2等。并且,将n级指标作为种子词汇,即,历史一级指标f1对应一级种子词汇,且历史数据中存在对应的一级种子词汇。

热度是指指标出现次数,历史热度对应的历史指标出现的次数,如历史一级指标f1在历史时间段出现的次数。

例如,在构建esg基础评分卡的时间是2019年8月1日,采用数据爬虫或者是政府机构网站提供的方式,获取到一些公告、新闻,即可得到构建esg基础评分卡对应的历史数据为2019年8月1日及以前的新闻和公告数据,按行业分类,比如历史数据化工的第一种子词汇为“污水排放”,那么,将2019年8月以前的化工数据及“污水排放”放入esg指标生成器处理,得到历史指标对应的历史热度,即污水排放的热度。

通过将历史数据及历史数据对应的第一种子词汇放入esg指标生成器中,得到历史指标对应的历史热度,由于历史指标及其对应的历史热度,不会再改变,因此,能够构建一个稳定的esg指标体系。

步骤s20,将当前获取的第一舆情数据及所述第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度;

该步骤中,将当前(例如每期中的天、周、月、季度等)获取的第一舆情数据及第一舆情数据对应的第二种子词汇放入esg指标生成器处理,得到当前指标及当前热度。舆情数据,可以是新媒体数据、网络舆情数据、政务数据、公安政法数据、金融监管数据、股债行情数据、企业经营数据、企业财务数据、工商数据等,第二种子词汇,也是种子词汇,为第一舆情数据对应的第二种子词汇,与历史数据对应的第一种子词汇区别开。

为了保证得到的指标及热度是最新的,在评分前,需要对评分体系进行更新,因此,在得到历史指标对应的历史热度这一稳定的esg指标体系下,获取最新的第一舆情数据及对应的第二种子词汇。

比如,历史数据是2019年8月1日之前的化工数据,此时为2019年9月1号,然后,各大新闻网站刊登关于化工方面的新闻,对应更多的新闻与空气质量相关,此时,第一舆情数据为化工数据,对应的第二种子词汇为空气质量。因此,为了更新到最新的评分结果,将2019年8月1日至2019年8月31日之间的化工数据,即第一舆情数据,以及,化工数据对应的空气质量这一第二种子词汇,放入到esg指标生成器处理,从而得到当前指标及当前热度。

通过将第一舆情数据及所述第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度,避免舆情数据缺失,保证评分的准确度。

步骤s30,基于所述历史热度、当前热度及当前指标,获得esg最新评分卡。

该步骤中,具体为:在得到历史热度后,将所述历史热度进行归一化处理,得到历史权重;基于所述历史指标、历史热度及历史权重,得到esg基础评分卡;将所述esg基础评分卡放入esg指标体系库;基于esg指标体系库,获取所述历史热度及历史权重;基于所述历史热度、当前热度,调节所述历史权重,得到esg最新评分卡,即匹配esg指标体系,根据指标历史热度和每期的热度变化、调节指标的权重,如此获取最新esg评分卡。

历史权重,是指历史指标的权重。

例如n级指标f1,f2……fn及历史热度h1,h2……hn,对于每一个i=1,……,n,热度归一化计算成历史权重从而得到esg基础评分卡,再将esg基础评分卡放进esg指标体系库中,很明显,esg指标体系库中存储有计算历史权重的时间,指标,热度,权重。

如图3所示,根据历史热度、当前热度及当前指标,对历史权重进行调整,从而得到esg最新评分卡,有效保证评分卡的高度精准,并且,整个过程无需人为参与,智能化程度高,且评分卡能够及时有效更新,评分结果可以达到预警的效果。

本发明提出的esg评分体系的生成方法,将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;获取当前的第一舆情数据,第一舆情数据可以利用ai技术获得,不依赖于专家和分析师团队;使用广泛的舆情数据代替公司披露,数据全面而且独立;将第一舆情数据及第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度,并基于所述历史热度、当前热度及当前指标,获得esg最新评分卡,使得评分卡能够及时有效更新,评分结果可以达到预警的效果。本发明的方法,减少了人为因素的影响,使得结评分果更客观、一致及稳定。

进一步地,基于本发明esg评分体系的生成方法的第一实施例,提出本发明esg评分体系的生成方法的第二实施例;如图4所示,步骤s10之前,esg评分体系的生成方法可以包括:

从网络上采集数据信息,且基于所述数据信息构建海量语料库;

根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库;

确定行业对应的一级种子词汇,将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度;

通过所述主题提取器对所述二级指标及二级热度进行迭代处理,得到esg指标生成器。

本实施例中,在将历史数据及对应的第一种子词汇放入esg指标生成器之前,需要构建esg指标生成器,esg指标生成器的构建过程为:从网络上采集数据信息,且基于所述数据信息构建海量语料库;根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库;确定行业对应的一级种子词汇,将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度;通过所述主题提取器对所述二级指标及二级热度进行迭代处理,得到esg指标生成器。

具体地,网络可以是政府机构网站,也可以是各大官方媒体网站,可以采用数据爬虫方式,或者是请政府机构网站主动提供的方式,获取数据信息,比如,构建esg指标生成器是2019年6月1号,则获取当时的数据信息,比如获取对一篇化工方面的报道。

该信息数据的获取,不依赖于公司的主动披露,主动从各大公开网站获得。

在获得数据信息后,基于数据信息构建海量语料库,然后,制定行业分类标准,根据制定的标准,即预设行业标准,对海量语料库中的数据信息进行分类处理,得到行业语料库,例如,得到金融行业语料库、科技行业语料库、交通运输业语料库等。接着,对每一个行业,制定一级种子词汇,例如对于化工行业,污水排放可以作为一级种子词汇。再将行业语料库和一级种子词汇放进ai技术主题提取器中处理,得到二级指标及其热度。

最后,ai技术主题提取器可以迭代使用,将n级指标作为种子词汇,通过提取器可以得到n+1级指标及其热度,从而得到esg指标生成器。

通过构建esg指标生成器,以便于对历史数据及对应的第一种子词汇进行处理,得到稳定的esg指标体系,并且,以便于对当前获取的第一舆情数据及所述第一舆情数据对应的第二种子词汇进行处理,得到最新的指标及当前热度。

进一步地,对所述海量语料库中的数据信息进行分类处理可以利用文本分析技术,对海量语料库中的数据信息进行分类处理,得到行业语料库。

在本实施例中,文本分析法是指从文本的表层深入到文本的深层,从而发现那些不能为普通阅读所把握的深层意义。

通过文本分析技术,对海量语料库中的数据信息进行分类处理,得到行业语料库,例如,得到的行业语料库如金融行业语料库、科技行业语料库、交通运输业语料库等。

进一步地,所述将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度的步骤可以包括:

利用自然语言处理技术及主题模型,确定主题提取器;

将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度。

本实施例中,自然语言处理技术((naturallanguageprocessing,nlp)是人工智能(ai)的一个子领域,采用深度学习方法有助于开发全新的模型,深度学习方法具有学习特征表示的能力,不必要求专家从自然语言中人工指定和提取特征,并且,在挑战性问题上持续快速改进。

主题模型(topicmodel),就是对文字中隐含主题的一种建模方法,首先,需要定义主题是什么,主题是一个概念,一个方面,表现为一系列相关的词语,是词汇表上词语的条件概率分布,与主题关系越密切的词语,它的条件概率越大,反之则越小。

比如,一级指标可以是esg,二级指标通过主题模型可以得到环境、社会、公司治理,然后把环境作为关键词放进去,得到三级指标、水质、空气质量等。

通过自然语言处理技术及主题模型,确定主题提取器,实现对行业语料库及一级种子词汇的智能处理,从而得到二级指标及二级热度。

进一步地,步骤s30可以包括:

基于esg指标体系库,获取所述历史热度及历史权重;

基于所述历史热度、当前热度,调节所述历史权重,得到esg最新评分卡。

在本实施例中,基于所述历史热度、当前热度及当前指标,获得esg最新评分卡具体为:基于esg指标体系库,获取所述历史热度及历史权重;基于所述历史热度、当前热度,调节所述历史权重,得到esg最新评分卡。

其中,esg指标体系库,相当于一个数据库,用于存储历史指标、历史热度及历史权重,甚至是当前时间。

由于需要参考历史热度,因此,需要从esg指标体系库中提取出历史热度及历史权重,并根据历史热度、当前热度,对历史权重进行调节,更新历史权重,从而得到esg最新评分卡。

进一步地,所述基于esg指标体系库,获取所述历史热度及历史权重的步骤之前,所述esg评分体系的生成方法包括:

将所述历史热度进行归一化处理,得到历史权重;

基于所述历史指标、历史热度及历史权重,得到esg基础评分卡;

将所述esg基础评分卡放入esg指标体系库。

本实施例中,例如n级指标f1,…,fn及历史热度h1,…,hn,对于每一个i=1,……,n,热度归一化计算成历史权重从而得到esg基础评分卡,再将esg基础评分卡放进esg指标体系库中,很明显,esg指标体系库中存储有计算历史权重的时间,指标,热度,权重。

进一步地,基于本发明esg评分体系的生成方法的第二实施例,提出本发明esg评分体系的生成方法的第三实施例;如图5所示,在步骤s30之后,esg评分体系的生成方法可以包括:

获取企业当前的第二舆情数据;

基于所述esg指标体系库,获取所述历史指标;

通过自然语言处理技术,基于所述第二舆情数据、历史指标及所述esg最新评分卡,得到所述企业的esg得分;

将所述esg得分进行可视化处理。

本实施例中,在得到esg最新评分卡后,可进行对单个公司的esg评分,具体为:获取企业当前的第二舆情数据;基于所述esg指标体系库,获取所述历史指标;通过自然语言处理技术,基于所述第二舆情数据、历史指标及所述esg最新评分卡,得到所述企业的esg得分;将所述esg得分进行可视化处理,得到可视化图形。

对单个公司/企业的评分,首先汇集公司/企业的舆情数据,通过nlp技术(自然语言处理技术),匹配esg指标体系库中的指标,结合最新的评分卡权重,得到单个公司的esg得分。

可视化公司得分,提供预警信号、趋势图和影响得分的关键舆情数据,方便用户直观地认识风险并做出决策。

本发明还提供一种esg评分体系的生成装置。本发明所述esg评分体系的生成装置包括:

第一处理模块,用于将历史数据及所述历史数据对应的第一种子词汇放入esg指标生成器处理,得到历史指标对应的历史热度;

第二模块,用于将当前获取的第一舆情数据及所述第一舆情数据对应的第二种子词汇放入所述esg指标生成器处理,得到当前指标及当前热度;

评分模块,用于基于所述历史热度、当前热度及当前指标,获得esg最新评分卡。

进一步地,esg评分体系的生成装置还包括构建模块,用于:

从网络上采集数据信息,且基于所述数据信息构建海量语料库;

根据预设行业标准,对所述海量语料库中的数据信息进行分类处理,得到行业语料库;

确定行业对应的一级种子词汇,将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度;

通过所述主题提取器对所述二级指标及二级热度进行迭代处理,得到esg指标生成器。

进一步地,所述构建模块还用于:

根据预设行业标准,利用文本分析技术对所述海量语料库中的数据信息进行分类处理,得到行业语料库。

进一步地,构建模块还用于:

利用自然语言处理技术及主题模型,确定主题提取器;

将所述行业语料库及所述一级种子词汇输入主题提取器中处理,得到二级指标及二级热度。

进一步地,所述评分模块还用于:

基于esg指标体系库,获取所述历史热度及历史权重;

基于所述历史热度、当前热度,调节所述历史权重,得到esg最新评分卡。

进一步地评分模块还用于:

将所述历史热度进行归一化处理,得到历史权重;

基于所述历史指标、历史热度及历史权重,得到esg基础评分卡;

将所述esg基础评分卡放入esg指标体系库。

进一步地,esg评分体系的生成装置还包括得分模块,用于:

获取企业当前的第二舆情数据;

基于所述esg指标体系库,获取所述历史指标;

通过自然语言处理技术,基于所述第二舆情数据、历史指标及所述esg最新评分卡,得到所述企业的esg得分;

将所述esg得分进行可视化处理。

本发明还提供一种计算机可读存储介质。

本发明计算机可读存储介质上存储有esg评分体系的生成程序,所述esg评分体系的生成程序被处理器执行时实现如上所述的esg评分体系的生成方法的步骤。

其中,在所述处理器上运行的esg评分体系的生成程序被执行时所实现的方法可参照本发明esg评分体系的生成方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个可读存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台esg评分体系的生成设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1