言论数据处理方法、装置、设备及可读存储介质与流程

文档序号:19376367发布日期:2019-12-10 23:54阅读:141来源:国知局
言论数据处理方法、装置、设备及可读存储介质与流程

本发明涉及科技金融领域,尤其涉及一种言论数据处理方法、装置、设备及可读存储介质。



背景技术:

责任投资理念逐渐得到投资者的广泛认同,责任投资通过分析企业对环境的影响、社会责任的履行情况以及公司治理结构三大要素(environmental、socialandgovernance,简称esg)来决定选择投资对象。企业为了提高对投资者的吸引力,需要提高自身治理,改善在上述三个要素上的表现。目前esg评级机构主要依据企业主动披露的数据进行评级,但未给出评级的标准,使得企业并不能够通过esg评级获得对企业自身治理的具体指导。虽然企业可以通过邀请esg专家提供改进的指导意见,但是聘请专家的方式存在许多问题,诸如聘请专家费用昂贵,企业对专家的选择只依据少量有限的信息,人为因素影响较大,专家也不能长期驻场,提供的建议以后得不到及时更新,一方专家意见会存在偏差,采用多方专家意见会增加成本。



技术实现要素:

本发明的主要目的在于提供一种言论数据处理方法、装置、设备及可读存储介质,旨在解决目前企业缺乏获取esg方面具体指导以提高自身治理的较佳途径的问题。

为实现上述目的,本发明提供一种言论数据处理方法,所述言论数据处理方法包括以下步骤:

在各网络平台获取关于esg关注问题的言论集;

根据所述言论集中各言论数据之间的数据关系构建言论网络;

对所述言论网络进行分析得到言论分析结果,并按照预设可视化方式输出所述言论分析结果。

可选地,所述在各网络平台获取关于esg关注问题的言论集的步骤包括:

获取预先采集的esg领域的智库名单和/或专家名单;

按照所述智库名单和/或专家名单在各网络平台抓取各智库和/或各专家的言论数据;

按照预设关注问题对所述言论数据进行筛选,得到关于esg关注问题的言论集。

可选地,所述根据所述言论集中各言论数据之间的数据关系构建言论网络的步骤包括:

以所述言论集中各言论数据对应的智库和/或专家为网络的节点,以所述言论集中各言论数据之间的数据关系为网络的边构建言论网络。

可选地,所述言论分析结果包括权威力分析结果和处于领导地位的智库和/或专家的社交账号,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

采用预设权威力分析算法对所述言论网络进行分析,得到所述言论网络中各智库和/或专家的权威力分析结果;

根据所述权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家;

获取所述处于领导地位的智库和/或专家在各网络平台中的社交账号。

可选地,所述言论分析结果包括智库分类和/或专家分类,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

对所述言论网络中的各个节点进行向量化处理,得到各个所述节点的特征向量;

按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类。

可选地,所述言论分析结果还包括观点分析结果,所述按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类的步骤之后,还包括:

按照预设观点分析算法分别对每个智库类别和/或专家类别下的智库言论数据和/或专家言论数据进行分析,得到观点分析结果,其中,所述观点分析结果包括观点主题词汇、观点的相关性和观点的演变过程中的一项或多项。

可选地,所述言论分析结果包括社群识别结果和/或社群演变结果,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

按照预设社群识别算法对所述言论网络进行社群识别,得到智库和/或专家的社群识别结果;和/或,

按照预设社群演变算法对所述言论网络进行社群演变分析,得到智库和/或专家的社群演变结果。

为实现上述目的,本发明还提供一种言论数据处理装置,所述言论数据处理装置包括:

获取模块,用于在各网络平台获取关于esg关注问题的言论集;

网络构建模块,用于根据所述言论集中各言论数据之间的数据关系构建言论网络;

分析模块,用于对所述言论网络进行分析得到言论分析结果,并按照预设可视化方式输出所述言论分析结果。

为实现上述目的,本发明还提供一种言论数据处理设备,所述言论数据处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的言论数据处理程序,所述言论数据处理程序被所述处理器执行时实现如上所述的言论数据处理方法的步骤。

此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有言论数据处理程序,所述言论数据处理程序被处理器执行时实现如上所述的言论数据处理方法的步骤。

本发明中,通过在各个网络平台中获取关于esg关注问题的言论集,并根据言论集中各个言论数据的数据关系构建言论网络,对言论网络进行分析得到言论分析结果,并按照预设可视化方式将言论分析结果输出,使得企业能够根据可视化展现的言论分析结果,直观地获取到esg方面的言论意见,从而根据获取到的言论意见进行自身治理决策的制定和更新。

附图说明

图1是本发明实施例方案涉及的硬件运行环境的结构示意图;

图2为本发明言论数据处理方法第一实施例的流程示意图;

图3为本发明实施例涉及的一种言论数据处理流程示意图;

图4为本发明实施例涉及的一种言论数据处理流程示意图;

图5为本发明言论数据处理装置较佳实施例的功能示意图模块图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。

需要说明的是,本发明实施例言论数据处理设备可以是智能手机、个人计算机和服务器等设备,在此不做具体限制。

如图1所示,该言论数据处理设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。

本领域技术人员可以理解,图1中示出的设备结构并不构成对言论数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及言论数据处理程序。其中,操作系统是管理和控制设备硬件和软件资源的程序,支持言论数据处理程序以及其它软件或程序的运行。

在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于与各参与设备建立通信连接;而处理器1001可以用于调用存储器1005中存储的言论数据处理程序,并执行以下操作:

在各网络平台获取关于esg关注问题的言论集;

根据所述言论集中各言论数据之间的数据关系构建言论网络;

对所述言论网络进行分析得到言论分析结果,并按照预设可视化方式输出所述言论分析结果。

进一步地,所述在各网络平台获取关于esg关注问题的言论集的步骤包括:

获取预先采集的esg领域的智库名单和/或专家名单;

按照所述智库名单和/或专家名单在各网络平台抓取各智库和/或各专家的言论数据;

按照预设关注问题对所述言论数据进行筛选,得到关于esg关注问题的言论集。

进一步地,所述根据所述言论集中各言论数据之间的数据关系构建言论网络的步骤包括:

以所述言论集中各言论数据对应的智库和/或专家为网络的节点,以所述言论集中各言论数据之间的数据关系为网络的边构建言论网络。

进一步地,所述言论分析结果包括权威力分析结果和处于领导地位的智库和/或专家的社交账号,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

采用预设权威力分析算法对所述言论网络进行分析,得到所述言论网络中各智库和/或专家的权威力分析结果;

根据所述权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家;

获取所述处于领导地位的智库和/或专家在各网络平台中的社交账号。

进一步地,所述言论分析结果包括智库分类和/或专家分类,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

对所述言论网络中的各个节点进行向量化处理,得到各个所述节点的特征向量;

按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类。

进一步地,所述言论分析结果还包括观点分析结果,所述按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类的步骤之后,处理器1001可以用于调用存储器1005中存储的言论数据处理程序,还执行以下操作

按照预设观点分析算法分别对每个智库类别和/或专家类别下的智库言论数据和/或专家言论数据进行分析,得到观点分析结果,其中,所述观点分析结果包括观点主题词汇、观点的相关性和观点的演变过程中的一项或多项。

进一步地,所述言论分析结果包括社群识别结果和/或社群演变结果,所述对所述言论网络进行分析得到言论分析结果的步骤包括:

按照预设社群识别算法对所述言论网络进行社群识别,得到智库和/或专家的社群识别结果;和/或,

按照预设社群演变算法对所述言论网络进行社群演变分析,得到智库和/或专家的社群演变结果。

基于上述的结构,提出言论数据处理方法的各个实施例。

参照图2,图2为本发明言论数据处理方法第一实施例的流程示意图。

本发明实施例提供了言论数据处理方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。本发明言论数据处理方法的各个实施例的执行主体可以是智能手机、个人计算机和服务器等设备,为便于描述,以下各实施例中以系统为执行主体进行阐述。在本实施例中,言论数据处理方法包括:

步骤s10,在各网络平台获取关于esg关注问题的言论集;

在本实施例中,为解决目前企业缺乏获取esg方面的具体指导来提高自身治理的途径的问题,提供一种言论数据处理方法,通过在各个网络平台上收集企业对esg的关注问题方面的言论数据,对言论数据进行大数据分析,得到可视化的展示结果,使得企业能够获取到直观的esg方面的言论意见,从而实现辅助企业治理。

具体地,系统可以预先在各个网络平台上抓取关于esg关注问题的言论数据,采用各个言论数据构建言论集。具体地,各个网络平台可以是微博、微信公众号、知乎等等。esg关注问题可以是在系统中预先设置的企业对esg的关注问题,如环境、员工生产力、董事会结构等等。应当理解的是,关于esg关注问题的言论数据的抓取方式有多种,在本实施例中对抓取方式不作限制,如可以是:系统将预先设置的esg关注问题作为关键词,在各个网络平台抓取各社交账号发表的言论,将抓取到的言论内容以及言论相关的数据作为言论数据,用于构建言论集。言论集可以是以数据库的形式进行存储。其中,言论相关的数据可以包括发表言论的社交账号信息、言论的引用信息、言论的转发信息等等。应当理解的是,本实施例中涉及到的言论是指通过网络平台发表的意见言论、观点文章等的统称。需要说明的是,系统可预先设置言论集的更新频率,根据更新频率在各个网络平台抓取最新的言论数据,以更新言论集。

步骤s20,根据所述言论集中各言论数据之间的数据关系构建言论网络;

系统根据获取到的关于esg关注问题的言论集,根据言论集中各个言论数据之间的数据关系构建言论网络。其中,系统可根据各个言论数据中言论相关的数据,来确定各个言论数据之间的数据关系,如根据言论数据中的社交账号信息,确定发表各个言论的社交账号之间的关注关系,又如,根据言论数据中言论的引用信息,确定各个言论之间的引用关系。系统根据各言论数据之间的数据关系,可以以各个言论为网络的节点,构建言论网络,也可以以发表言论的社交账号为网络的节点,构建言论网络,如可以构建知识图谱。

步骤s30,对所述言论网络进行分析得到言论分析结果,并按照预设可视化方式输出所述言论分析结果。

当系统构建得到言论网络后,对言论网络进行分析得到言论分析结果。需要说明的是,系统对言论网络进行分析所采用的方式有多种,在本实施例中,系统可通过网络表示学习(networkrepresentationlearning)技术对言论网络进行分析。具体地,系统可通过网络表示学习技术将言论网络中的节点表示成低维、实值、稠密的向量形式,该向量形式可以在向量空间中具有表示以及推理的能力,系统将各节点的向量形式作为机器模型的输入,通过机器模型输出言论分析结果。如当机器模型是分类模型,言论网络是以言论为网络的节点时,系统得到的言论分析结果可以是言论集中各言论的分类结果,类别可以是预先设置的企业对esg的多个小关注点,如环境问题中的污水排放问题。

系统在得到言论分析结果后,可将言论分析结果按照预设可视化方式输出。其中,预设可视化方式可以是预先设置的可视化方式,根据言论分析结果不同,预先设置的可视化方式可以不同,如当言论分析结果是对言论的分类结果时,可视化方式可以是将各个类别以列表的形式展现,并支持对类别中各个言论的展开显示,此外,还可以在系统中设置查询控件,供用户对查询各个类别或查询各类别中的言论。

在本实施例中,通过在各个网络平台中获取关于esg关注问题的言论集,并根据言论集中各个言论数据的数据关系构建言论网络,对言论网络进行分析得到言论分析结果,并按照预设可视化方式将言论分析结果输出,使得企业能够根据可视化展现的言论分析结果,直观地获取到esg方面的言论意见,从而根据获取到的言论意见进行自身治理决策的制定和更新。并且,在本实施例中,言论集来自于各个网络平台,减少了人为因素的影响,使得言论分析结果涉及多方专家的观点意见、更客观一致,从而更有利于企业制定完善的治理决策;系统搭建成功后,能够实现企业的个性化、自动化查询,相比于聘请专家,系统只需要较低的维护费用,降低了企业的成本。系统中的言论数据可及时更新,从而能够实现广泛的专家观点可以快速反映在企业的治理决策上。

进一步地,基于上述第一实施例,提出本发明言论数据处理方法第二实施例,在本发明言论数据处理方法第二实施例中,所述步骤s10包括:

步骤s101,获取预先采集的esg领域的智库名单和/或专家名单;

可以预先采集esg领域的智库名单或专家名单,或者是采集智库名单和专家名单。需要说明的是,以下各实施例中采用“a和/或b”来表述“a和b”,以及“a或b”的关系。其中,专家是指个人,智库主要是指以公共政策为研究对象,以影响政府决策为研究目标,以公共利益为研究导向,以社会责任为研究准则的专业研究机构。esg领域的智库名单和/或专家名单可以是通过研究智库的机构提供、预先积累整理等方式采集。并将预先采集的智库和/或专家名单上传至系统。系统获取预先采集的esg领域的智库名单和/或专家名单。

步骤s102,按照所述智库名单和/或专家名单在各网络平台抓取各智库和/或各专家的言论数据;

系统获取到智库名单和/或专家名单后,在各个网络平台抓取各智库和/或各专家的言论数据。具体地,系统可通过社交平台梳理提供的方式在各个网络平台抓取名单中的各个智库和/或专家的言论数据,也可以通过将名单中的智库和/或专家的全称和中英文简称作为搜索关键词的方式,在各个网络平台抓取各智库和/或各专家的言论数据。其中,系统可以通过名单中各智库和/或专家的搜索关键词,在各社交网络平台获取智库和/或专家的各个社交账号,一个专家和一个智库可能在各个网络平台上注册了多个账号,系统可获取每个专家和/或每个智库的所有账号,并对所有账号下的言论数据进行抓取,得到每个专家和/或智库在各个网络平台上所有言论数据。

步骤s103,按照预设关注问题对所述言论数据进行筛选,得到关于esg关注问题的言论集。

系统中可预先设置一个或多个esg关注问题,如环境问题、员工生产力问题、董事会结构问题等。系统按照预设esg问题对抓取到的各智库和/或专家的言论数据进行筛选,得到关于esg关注问题的言论集。具体地,系统可以通过自然语言处理(nlp,naturallanguageprocessing)技术中的文本分析技术,对言论数据中言论内容是关于esg关注问题的言论数据进行筛选,将筛选出的言论数据作为关于esg关注问题的言论集。也即,系统按照智库和/或专家名单抓取到的言论数据,可能是关于esg关注问题的言论数据,也可能不是关于esg关注问题的,因此,需要对抓取到的所有言论数据进行筛选,使得最终得到的言论集中的言论数据均是关于esg关注问题的言论数据,从而提高了最终分析得到的言论分析结果的准确性。进一步地,当预设关注问题为多个时,系统还可以对筛选出的言论数据按照预设关注问题进行分类,得到环保影响语料库、员工生产力语料库、董事会结构语料库等。

在本实施例中,通过获取预先采集的esg领域的智库名单和/或专家名单,按照智库名单和/或专家名单在各网络平台抓取各智库和/或专家的言论数据,实现了自动为企业用户获取最全面的esg方面的言论数据,并按照预设关注问题对言论数据进行筛选,得到关于esg关注问题的言论集,实现自动为企业用户获取最准确的esg方面的言论数据,从而给企业用户提供更准确地esg方面的言论分析结果,使得企业能够得到最全面、最准确的企业治理方面的指导。

进一步地,基于上述第二实施例,提出本发明言论数据处理方法第三实施例,在本发明言论数据处理方法第三实施例中,所述步骤s20包括:

步骤s201,以所述言论集中各言论数据对应的智库和/或专家为网络的节点,以所述言论集中各言论数据之间的数据关系为网络的边构建言论网络。

系统在获取得到关于esg关注问题的言论集后,以言论集中各言论数据对应的智库和/或专家为网络的节点,以言论集中各言论数据之间的数据关系为网络的边构建言论网络。其中,言论集中各言论数据对应的智库和/或专家是指发表该言论数据中言论的智库或专家,由于智库或专家可能对应多个社交账号,智库或专家可能在每个社交账号下发表多个言论,因此,多个言论数据可能对应同一个智库或专家,以一个智库或一个专家为网络的节点,节点对应其发表言论的言论数据。各个言论数据之间的数据关系可包括:关注、引用和转发等等,以这些数据关系作为各个节点之间的边,如a专家节点和b专家节点,a专家的一条言论引用了b专家的一条言论,则a专家节点和b专家节点之间有一条以引用关系为基础构建的边。

在本实施例中,通过对以言论数据对应的智库和/或专家为网络的节点,以言论数据之间的数据关系为网络的边构建言论网络,通过将言论数据以网络的形式进行组织,使得系统能够对言论数据进行准确有效的分析,得到有利于企业治理的esg方面的言论分析结果。

进一步地,所述言论分析结果包括权威力分析结果和处于领导地位的智库和/或专家的社交账号,步骤s30包括:

步骤a10,采用预设权威力分析算法对所述言论网络进行分析,得到所述言论网络中各智库和/或专家的权威力分析结果;

在得到以智库和/或专家为网络节点,以言论数据之间的数据关系为网络的边构建的言论网络后,系统可采用预设权威力分析算法对言论网络进行分析,得到言论网络中各个智库和/或专家的权威力分析结果。其中,预设权威力分析算法可以是预先设置的能够对网络中节点的影响力进行分析的算法,如pagerank、influencemaximization等算法。权威力分析结果可以是作为网络节点的各个智库和/或专家的权威力分数,权威力分数越高,表示该智库或专家的权威力越大。

步骤a20,根据所述权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家;

系统根据权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家。具体地,处于领导地位的智库和/或专家是指权威力大的智库和/或专家。当权威力分析结果是各个智库和/或专家的权威力分数时,系统可以根据权威力分数对各个智库和/或专家进行排名,将权威力大的智库和/或专家排在前面,并从排名中截取预设数量的智库和/或专家作为处于领导地位的智库和/或专家。其中,预设数量可以根据需要进行设置,如设置为10个。

步骤a30,获取所述处于领导地位的智库和/或专家在各网络平台中的社交账号。

当系统获取到处于领导地位的智库和/或专家后,获取该智库和/或专家在各个网络平台中的社交账号。系统可通过预先存储的智库和/或专家与社交账号之间的关联关系,根据智库和/或专家查找其对应关联的社交账号。在获取到处于领导地位的智库和/或专家的社交账号后,系统可将智库和/或专家的名称以及对应的社交账号以可视化的方式输出。

在本实施例中,通过将采用权威力分析算法对言论网络中各个节点的权威力进行分析,得到权威力分析结果,并根据权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家,并获取该智库和/或专家的社交账号,按照可视化方式输出,使得企业可以直观地获取到在esg关注问题中处于领导地位的智库和/或专家名称,并能够依据社交账号在各个网络平台对智库和/或专家进行关注,通过关注其发表的言论,来制定和更新企业的治理决策。

进一步地,所述言论分析结果包括智库分类和/或专家分类,步骤s30还包括:

b10,对所述言论网络中的各个节点进行向量化处理,得到各个所述节点的特征向量;

在得到以智库和/或专家为网络节点,以言论数据之间的数据关系为网络的边构建的言论网络后,系统可对言论网络中的各个节点进行向量化处理,得到各个节点的特征向量。其中,向量化处理是指采用向量化处理算法,提取节点的多个特征,对每个特征进行量化,将得到的多维特征的量化结果组成向量形式的特征向量。具体地,系统可预先设置向量化处理算法,如networkembedding算法,对言论网络中的各个节点进行向量化处理,得到每个智库和/或专家的特征向量。

b20,按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类。

系统在得到每个节点的特征向量后,按照预设分类模型,对各个特征向量进行分类。其中,预设分类模型可以是预先设置的分类模型,如k近邻算法、supportvectormachine算法等。分类的类别可以是预先进行设置,如预先设置多个esg关注问题的小关注点,通过分类模型,将各个智库和/或专家按照这些小关注点进行分类,即,每个智库和/或专家在esg关注问题上所研究的小方向是不同的,如a专家主要是发表了一些关于空气污染问题的言论,b专家主要是发表了以下关于水污染问题的言论,则a专家和b专家被分到不同的类别。分类的类别也可以是预先不进行设置,通过聚类算法,如k邻近算法对各个特征向量进行聚类,将相似的各个特征向量分为一类,不相似的各个特征向量分在不同类,最终得到智库分类和/或专家分类。

进一步地,所述言论分析结果还包括观点分析结果,所述步骤b20之后还包括:

步骤b30,按照预设观点分析算法分别对每个智库类别和/或专家类别下的智库言论数据和/或专家言论数据进行分析,得到观点分析结果,其中,所述观点分析结果包括观点主题词汇、观点的相关性和观点的演变过程中的一项或多项。

在系统得到智库分类和/或专家分类后,每个智库类别下,包括至少一个智库,每个专家类别下包括至少一个专家,每个智库或专家对应至少一个言论数据。系统可按照预设观点分析算法分别对每个智库类别和/或专家类别下的智库言论数据和/或专家言论数据进行分析,得到每个智库类别和/或专家类别的观点分析结果,观点分析结果可包括观点主题词汇、观点的相关性和观点的演变过程中的一项或多项。其中,预设观点分析算法可以是预先设置的算法,如结构主题模型、概率潜在语义分析算法等。观点主题词汇是指从言论数据中提取出的代表观点的主题词汇,观点的相关性是指各个观点主题词汇之间的相关性,观点的演变过程是指各个观点主题词汇随时间的演变过程。

在系统得到观点分析结果后,可通过可视化方式输出智库分类和/或专家分类,如通过列表的方式输出各个类别,并可基于对各个类别的查看操作,将各个类别的观点分析结果输出,如可将观点主题词汇以词汇云的方式输出显示,将观点的相关性和演变过程以网络图的方式输出显示,网络图中的节点可以是各个观点主题词汇,各个节点之间的连线,表示各个观点之间的相关性和演变关系。

在本实施例中,通过将言论网络中的各个节点进行向量化处理,得到各个智库和/或专家的特征向量,并按照预设分类模型对各个特性向量进行分类,得到智库分类和/或专家分类,并对每个类别下的言论数据进行观点分析,得到观点分析结果,将观点分析结果进行展示,使得企业可以直观地获取到esg关注问题中各个智库、专家所关注的小关注点,以及在各个小关注点上的主要观点,以及各个观点之间的相关性和演变过程,使得企业可以快速地获取到关于自己所关注的问题的专家观点,从而依据专家观点制定和更新企业的治理决策。

进一步地,基于上述第二或第三实施例,提出本发明言论数据处理方法第四实施例,在本发明言论数据处理方法第四实施例中,所述言论分析结果包括社群识别结果和/或社群演变结果,所述步骤s30包括:

步骤c10,按照预设社群识别算法对所述言论网络进行社群识别,得到智库和/或专家的社群识别结果;

在得到以智库和/或专家为网络节点,以言论数据之间的数据关系为网络的边构建的言论网络后,系统可按照预设社群识别算法对言论网络进行社群识别,得到智库和/或专家的社群识别结果。举一个极端的例子对社群进行说明:如果言论网络中包含15个节点,其中10个节点相互连接的边比较多,另5个节点相互连接的边比较多,而前面10个节点和后面5个节点之间没有连线,则前面10个节点被识别为一个社群,后面5个节点被识别为一个社群。其中,预设社群识别算法可预先进行设置,如采用fastunfolding算法、labelpropagation算法等。在系统得到社群识别结果后,系统可以将社群识别结果进行可视化输出,如将言论网络以网络图的方式输出,并对属于不同社群的节点渲染不同的颜色,以便于企业用户区分言论网络中的各个智库和/或专家所属的社群。

步骤c20,按照预设社群演变算法对所述言论网络进行社群演变分析,得到智库和/或专家的社群演变结果。

或者,系统还可以按照预设社群演变算法对言论网络进行社群演变分析,得到智库和/或专家的社群演变结果。其中,预设社群演变算法可以是预先进行设置,如采用preferentialattachmentmodel算法。社群演变是指各个智库和/或专家所组成的社群在时间顺序上的演变过程。系统在得到社群演变结果后,可将社群演变结果进行可视化输出,如以动态变化图的方式输出随时间变化而呈现不同社群划分的言论网络图,使得企业用户能够直观地根据展示结果获知各智库和/或专家在esg领域的关注重点的演变过程,从而根据演变过程指定符合当下情势的治理决策。

需要说明的是,第二实施例步骤a10、a20、a30中对言论网络进行分析的方案,步骤b10、b20、b30中对言论网络进行分析的方案,与本实施例步骤c10、c20中对言论网络进行分析的方案,可单独实施,也可以结合实施。结合实施的方式有多种,如系统可将先对言论网络进行社群识别和社群演变分析;根据社群识别和社群演变的结果,对每个社群中的智库和/或专家进行分类处理,得到每个社群中智库和/或专家的分类;再对每个类别下的言论数据进行观点分析,对每个类别下的智库和/或专家进行权威力分析。

在一实施例中,言论分析结果可包括权威力分析结果、处于领导地位的智库和/或专家的社交账号、智库和/或专家分类、观点分析结果、社群识别结果和社群演变结果中的任意一项或多项。在一实施例中,系统可按照如图3和图4所示的处理流程图,对言论数据进行获取、分析。首先,如图3所示,系统获取智库和/或专家名单,并根据名单在各网络平台抓取智库和/或专家发布的言论,得到言论数据;系统根据预先设置的企业对esg的关注问题,从所有言论数据中筛选出关于esg关注问题的言论数据,构成言论集;然后系统对言论集构建言论网络,如知识图谱;然后系统对言论网络进行分析,如按照网络表示学习技术对言论网络进行分析,得到智库/专家的权威力分析结果、社群识别结果、分类结果、社群演变结果。如图4所示,系统根据智库和/或专家的分类结果和社群演变结果,通过结构主体模型算法,对每个类别的智库和/或专家的言论数据进行观点分析,得到观点主题词汇、观点相关性、观点演变结果,并将这些结果进行可视化输出,用于支持企业在esg方面的治理决策的制定和更新。

在本实施例中,通过对言论网络进行社群识别和社群演变分析,得到社群识别结果和社群演变结果,并将结果进行可视化的输出,使得企业用户能够直观地获知esg领域的各智库和专家在esg关注问题上的言论动态,从而更有利于企业用户准确地从大数据中寻找到自己所关注的问题的言论、观点,从而制定或更新有利于企业发展的治理决策。

此外,此外本发明实施例还提出一种言论数据处理装置,参照图5,所述言论数据处理装置包括:

获取模块10,用于在各网络平台获取关于esg关注问题的言论集;

网络构建模块20,用于根据所述言论集中各言论数据之间的数据关系构建言论网络;

分析模块30,用于对所述言论网络进行分析得到言论分析结果,并按照预设可视化方式输出所述言论分析结果。

进一步地,所述获取模块10包括:

获取单元,用于获取预先采集的esg领域的智库名单和/或专家名单;

抓取单元,用于按照所述智库名单和/或专家名单在各网络平台抓取各智库和/或各专家的言论数据;

筛选单元,用于按照预设关注问题对所述言论数据进行筛选,得到关于esg关注问题的言论集。

进一步地,所述网络构建模块20用于以所述言论集中各言论数据对应的智库和/或专家为网络的节点,以所述言论集中各言论数据之间的数据关系为网络的边构建言论网络。

进一步地,所述言论分析结果包括权威力分析结果和处于领导地位的智库和/或专家的社交账号,所述分析模块30包括:

第一分析单元,用于采用预设权威力分析算法对所述言论网络进行分析,得到所述言论网络中各智库和/或专家的权威力分析结果;

确定单元,用于根据所述权威力分析结果确定在esg关注问题中处于领导地位的智库和/或专家;

获取单元,用于获取所述处于领导地位的智库和/或专家在各网络平台中的社交账号。

进一步地,所述言论分析结果包括智库分类和/或专家分类,所述分析模块30包括:

向量化处理单元,用于对所述言论网络中的各个节点进行向量化处理,得到各个所述节点的特征向量;

分类单元,用于按照预设分类模型对各所述特征向量进行分类,得到智库分类和/或专家分类。

进一步地,所述言论分析结果还包括观点分析结果,所述分析模块30还包括:

第二分析单元,用于按照预设观点分析算法分别对每个智库类别和/或专家类别下的智库言论数据和/或专家言论数据进行分析,得到观点分析结果,其中,所述观点分析结果包括观点主题词汇、观点的相关性和观点的演变过程中的一项或多项。

进一步地,所述言论分析结果包括社群识别结果和/或社群演变结果,所述分析模块30包括:

识别单元,用于按照预设社群识别算法对所述言论网络进行社群识别,得到智库和/或专家的社群识别结果;和/或,

第三分析单元,用于按照预设社群演变算法对所述言论网络进行社群演变分析,得到智库和/或专家的社群演变结果。

本发明言论数据处理装置的具体实施方式的拓展内容与上述言论数据处理方法各实施例基本相同,在此不做赘述。

此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有言论数据处理程序,所述言论数据处理程序被处理器执行时实现如下所述的言论数据处理方法的步骤。

本发明言论数据处理设备和计算机可读存储介质的各实施例,均可参照本发明言论数据处理方法各个实施例,此处不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1