政策力度分析的方法、装置、计算机设备和存储介质与流程

文档序号:17442903发布日期:2019-04-17 05:02阅读:258来源:国知局
政策力度分析的方法、装置、计算机设备和存储介质与流程

本申请涉及大数据技术领域,特别是涉及一种政策力度分析的方法、装置、计算机设备和存储介质。



背景技术:

随着大数据技术的发展,出现了情感分析技术。情感分析指的是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,根据文本所表达的含义和情感信息将文本分为褒扬或贬义的两种或多种类型。

情感分析技术可应用于多个场景,但对于政策领域,目前常用的情感分析技术无法满足需求。



技术实现要素:

基于此,有必要针对上述技术问题,提供一种能够在政策领域实现基于情感分析的政策力度分析的方法、装置、计算机设备和存储介质。

一种政策力度分析的方法,所述方法包括:

获取预设的各政策类型的情感词库;

获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

在其中一个实施例中,在获取预设的各政策类型的情感词库之前,包括:

获取历史政策数据集合、预设的政策维度以及预设的政策维度的种子词;

根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合;

根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数;

根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库。

在其中一个实施例中,根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合包括:

获取历史政策数据集合中的词语,并生成与词语对应的词向量;

确定与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合;

根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合;

其中,根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合包括:

将历史政策数据集合中的历史政策数据拆分为完整语句;

根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句;

统计目标语句中各词语的出现次数,确定出现次数大于预设的次数阈值的词语作为第二类词语;

根据第二类词语,确定第二类词语集合;

根据第一类词语集合和第二类词语集合,确定各政策维度的情感词集合。

在其中一个实施例中,根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数包括:

确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离;

根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

在其中一个实施例中,根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库包括:

根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型;

生成与各政策维度对应的政策类型的情感词库;

将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。

在其中一个实施例中,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型包括:

获取待处理政策数据,提取待处理政策数据的特征;

根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型;

根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

在其中一个实施例中,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度包括:

根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据;

统计情感词库中的政策维度情感词在待处理政策数据中出现的次数;

根据出现的次数,确定待处理政策数据的分数;

根据待处理政策数据的分数,确定政策力度。

一种政策力度分析的装置,所述装置包括:

第一获取模块,用于获取预设的各政策类型的情感词库;

第二获取模块,用于获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

第一处理模块,用于根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

第二处理模块,用于根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取预设的各政策类型的情感词库;

获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

获取预设的各政策类型的情感词库;

获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

上述政策力度分析的方法、装置、计算机设备和存储介质,获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,在政策领域,通过情感词库确定待处理政策的分数,根据待处理政策的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

附图说明

图1为一个实施例中政策力度分析的方法的应用场景图;

图2为一个实施例中政策力度分析的方法的流程示意图;

图3为一个实施例中图2中步骤s202之前的步骤的流程示意图;

图4为一个实施例中图3中步骤s304的子流程示意图;

图5为一个实施例中图4中步骤s406的子流程示意图;

图6为一个实施例中图3中步骤s306的子流程示意图;

图7为一个实施例中图3中步骤s308的子流程示意图;

图8为一个实施例中图2中步骤s204的子流程示意图;

图9为一个实施例中图2中步骤s208的子流程示意图;

图10为一个实施例中政策力度分析的装置的结构框图;

图11为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请提供的政策力度分析的方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。服务器104获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,根据预设的各政策类型的情感词库,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,推送待处理政策数据的分数以及政策力度至终端102。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中,如图2所示,提供了一种政策力度分析的方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:

s202:获取预设的各政策类型的情感词库。

各政策类型的情感词库指的是与各政策类型对应的各政策维度的情感词集合的集合,各政策类型以及各政策维度可按照需要自行对应设置,各政策维度的情感词集合中包括多个已按照预定的评分标准,确定分数的政策维度情感词。

s204:获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型。

服务器获取待处理政策数据,确定待处理政策数据的政策类型,根据待处理政策数据的政策类型匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

s206:根据预设的各政策类型的情感词库,确定目标政策类型的情感词库。

根据目标政策类型遍历预设的各政策类型,查找到与目标政策类型对应的政策类型,进而确定目标政策类型的情感词库。

s208:根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

服务器根据对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据,根据情感词库中政策维度情感词在待处理政策数据中出现的次数,确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。其中,根据政策维度情感词出现的次数,确定待处理政策数据的分数包括:根据政策维度情感词的分数、出现的次数以及预设的次数权重算法,确定待处理政策数据的分数。当政策维度情感词出现的次数越多时,根据预设的次数权重算法,其对应的分数也会越高,预设的次数权重算法可按照需要自行设置。

上述政策力度分析的方法,获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,在政策领域,通过情感词库确定待处理政策的分数,根据待处理政策的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

在其中一个实施例中,如图3所示,在s202之前,包括:

s302:获取历史政策数据集合、预设的政策维度以及预设的政策维度的种子词。

历史政策数据集合指的是搜集的已公开的政策数据的集合,预设的政策维度指的是政策方向,不同的政策类型会有不同的政策方向,政策维度的种子词指的是能说明政策方向的政策力度的词语。举例说明,当政策类型为财政政策时,若政策维度为利率政策,对应的政策维度的种子词可以为上涨或者下跌,若政策维度为货币政策,对应的政策维度的种子词可以为稳健、宽松以及紧缩。

s304:根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合。

各政策维度的情感词集合中包括政策维度情感词,政策维度情感词指的是与政策维度的种子词对应的能体现政策方向的政策力度的词语。服务器获取历史政策数据集合中的词语,并生成与词语对应的词向量,根据政策维度的种子词,遍历历史政策数据集合,根据历史政策数据集合中各词语与政策维度的种子词的词向量距离以及共同出现在同一个句子中的次数,确定各政策维度的政策维度情感词,进而根据各政策维度的政策维度情感词,确定各政策维度的情感词集合。举例说明,当政策维度的种子词为稳健时,在政策数据中与稳健共同出现的词语可能为中性、合理、均衡以及基本等。

s306:根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

服务器首先确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离,根据词向量距离和预设的评分标准,确定各政策维度的情感词的分数。其中,预设的评分标准可按照需要自行设置。

s308:根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库。

各政策维度携带有预设的政策类型标识,服务器可以根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型,生成与各政策维度对应的政策类型的情感词库,将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。其中,各政策维度携带的预设的政策类型标识是根据预设的政策类型数据库中的政策类型确定的,每个政策维度都有对应的政策类型,根据预设的政策类型标识可以确定政策维度归属的政策类型。举例说明,货币政策和利率政策就携带有财政政策的预设的政策类型标识。

下面通过一个实施例,来说明本申请的方案。

服务器获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型为财政政策,根据预设的各政策类型的情感词库,获取财政政策的情感词库,根据财政政策的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定财政政策的政策力度,财政政策可能为紧缩的财政政策或者宽松的财政政策。其中,各政策类型的情感词库可以通过以下步骤生成:获取历史财政政策数据集合,预设的政策维度为货币政策,货币政策的种子词为“稳健”,根据政策维度的种子词“稳健”,遍历历史政策数据集合,确定货币政策的情感词集合,货币政策的情感词集合中包括经常与“稳健”一词共同出现在历史财政政策数据集合中的“中性”、“合理”、“均衡”以及“基本”等词语,根据预设的评分标准,确定各政策维度情感词的分数,根据货币政策的情感词集合,生成与货币政策对应的财政政策的情感词库。

在其中一个实施例中,如图4所示,s304包括:

s402:获取历史政策数据集合中的词语,并生成与词语对应的词向量;

s404:确定与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合;

s406:根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合。

服务器获取历史政策数据集合中的词语,并生成与词语对应的词向量,根据政策维度的种子词的词向量以及历史政策数据集合中的词语的词向量,确定在历史政策数据集合的词语中,与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合,根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合。其中,预设的距离阈值范围可按照需要自行设置,各政策维度的情感词集合中包括政策维度的种子词和第一类词语集合。

上述实施例,根据政策维度的种子词的词向量以及历史政策数据集合中各词语的词向量,实现了对第一类词语集合的获取,进而根据第一类词语集合和政策维度的种子词,遍历历史政策数据集合,实现了对各政策维度的情感词的获取。

在其中一个实施例中,如图5所示,s406包括:

s502:将历史政策数据集合中的历史政策数据拆分为完整语句;

s504:根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句;

s506:统计目标语句中各词语的出现次数,确定出现次数大于预设的次数阈值的词语作为第二类词语;

s508:根据第二类词语,确定第二类词语集合;

s510:根据第一类词语集合和第二类词语集合,确定各政策维度的情感词集合。

服务器将历史政策数据集合中的历史政策数据拆分为完整语句,根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句,目标语句中包含政策维度的种子词和/或第一类词语,统计目标语句中各词语的出现次数,确定目标语句中出现次数大于预设的次数阈值的词语作为第二类词语,根据第二类词语,确定第二类词语集合,获取第一类词语集合中的形容词以及第二类词语集合中的形容词,根据第一类词语集合中的形容词以及第二类词语集合中的形容词,确定各政策维度的情感词集合。其中,预设的次数阈值可按照需要自行设置,各政策维度的情感词集合中包括第二类词语的形容词。举例说明,当政策维度的种子词为稳健时,与稳健一词共同出现在目标语句中的形容词可以为中性、合理、均衡以及基本等。

上述实施例,根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定与政策维度的种子词和第一类词语集合中的第一类语句的共同出现次数大于预设的次数阈值的词语,作为第二类词语,根据第二类词语,确定第二类词语集合,进而根据第一类词语集合和第二类词语集合,实现了对各政策维度的情感词集合的获取。

在其中一个实施例中,如图6所示,s306包括:

s602:确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离;

s604:根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

服务器确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离,根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。其中,预设的评分标准可按照需要自行设置。举例说明,可设置各政策维度情感词的分数范围为0分-10分,与政策维度情感词对应的政策维度的种子词的分数为10分,确定各政策维度情感词与对应的政策维度的种子词之间的词向量距离,词向量距离越小的政策维度情感词的分数就越高。进一步的,可将词向量距离设置为十一个不同的等级,对应0分-10分的分数,在确定各政策维度情感词的分数之后,可将各政策维度情感词的分数标记在政策维度情感词上,方便后续的分数统计工作。

上述实施例,根据各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离以及预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数,实现了对各政策维度的情感词集合中各政策维度情感词的分数的合理制定。

在其中一个实施例中,如图7所示,s308包括:

s702:根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型;

s704:生成与各政策维度对应的政策类型的情感词库;

s706:将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。

服务器获取各政策维度携带的预设的政策类型标识,根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型,生成与各政策维度对应的政策类型的情感词库,将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。其中,多个政策维度的情感词集合可属于同一个政策类型的情感词库。

上述实施例,根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库,实现了对各政策类型的情感词库的获取。

在其中一个实施例中,如图8所示,s204包括:

s802:获取待处理政策数据,提取待处理政策数据的特征;

s804:根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型;

s806:根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

目标政策类型指的是与待处理政策数据的政策类型对应的,包含情感词库的政策类型。服务器获取待处理政策数据,提取待处理政策数据的特征,根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型,根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。其中待处理政策数据的特征可以为待处理政策数据中出现次数最多的项目名称以及待处理政策数据对应的技术领域,根据项目名称、技术领域以及预设的特征数据库,即可确定待处理政策数据的政策类型。

上述实施例,获取待处理政策数据,提取待处理政策数据的特征,根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型,根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型,实现了对目标政策类型的获取。

在其中一个实施例中,如图9所示,s208包括:

s902:根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据;

s904:统计情感词库中的政策维度情感词在待处理政策数据中出现的次数;

s906:根据出现的次数,确定待处理政策数据的分数;

s908:根据待处理政策数据的分数,确定政策力度。

服务器根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据,统计情感词库中的政策维度情感词在待处理政策数据中出现的次数,根据政策维度情感词出现的次数,确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。其中,根据政策维度情感词出现的次数,确定待处理政策数据的分数包括:根据政策维度情感词的分数、出现的次数以及预设的次数权重算法,确定待处理政策数据的分数。当政策维度情感词出现的次数越多时,根据预设的次数权重算法,其对应的分数也会越高,预设的次数权重算法可按照需要自行设置。举例说明,次数权重算法可以为:政策维度情感词的出现次数与次数系数成对应关系,第一次出现的系数为1,第二次出现的系数为0.9,第三次出现的次数为0.8,依次类推,通过政策维度情感词的出现次数以及次数系数计算政策维度情感词的分数权重,再根据政策维度情感词的分数以及分数权重,确定政策维度情感词在待处理政策数据中的分数,通过计算各政策维度情感词在待处理政策数据中的分数,确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,分数越高,说明政策力度越大。

上述实施例,根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据,统计情感词库中政策维度情感词在待处理政策数据中出现的次数,根据出现的次数,确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

应该理解的是,虽然图2-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-9中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图10所示,提供了一种政策力度分析的装置,包括:第一获取模块102、第二获取模块104、第一处理模块106以及第二处理模块108,其中:

第一获取模块102,用于获取预设的各政策类型的情感词库;

第二获取模块104,用于获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

第一处理模块106,用于根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

第二处理模块108,用于根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

上述政策力度分析的装置,获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,在政策领域,通过情感词库确定待处理政策的分数,根据待处理政策的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

在其中一个实施例中,政策力度分析的装置还包括词库生成模块,词库生成模块用于获取历史政策数据集合、预设的政策维度以及预设的政策维度的种子词,根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合,根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数,根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库。

在其中一个实施例中,词库生成模块还用于获取历史政策数据集合中的词语,并生成与词语对应的词向量,确定与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合,根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合。

在其中一个实施例中,词库生成模块还用于将历史政策数据集合中的历史政策数据拆分为完整语句,根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句,统计目标语句中各词语的出现次数,确定出现次数大于预设的次数阈值的词语作为第二类词语,根据第二类词语,确定第二类词语集合,根据第一类词语集合和第二类词语集合,确定各政策维度的情感词集合。

在其中一个实施例中,词库生成模块还用于确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离,根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

在其中一个实施例中,词库生成模块还用于根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型,生成与各政策维度对应的政策类型的情感词库,将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。

在其中一个实施例中,第二获取模块还用于获取待处理政策数据,提取待处理政策数据的特征,根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型,根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

在其中一个实施例中,第二处理模块还用于根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据,统计情感词库中的政策维度情感词在待处理政策数据中出现的次数,根据出现的次数,确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

关于政策力度分析的装置的具体限定可以参见上文中对于政策力度分析的方法的限定,在此不再赘述。上述政策力度分析的装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储历史政策数据、情感词库、特征数据以及政策类型数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种政策力度分析的方法。

本领域技术人员可以理解,图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

获取预设的各政策类型的情感词库;

获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

上述政策力度分析的计算机设备,获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,在政策领域,通过情感词库确定待处理政策的分数,根据待处理政策的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取历史政策数据集合、预设的政策维度以及预设的政策维度的种子词;

根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合;

根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数;

根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取历史政策数据集合中的词语,并生成与词语对应的词向量;

确定与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合;

根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

将历史政策数据集合中的历史政策数据拆分为完整语句;

根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句;

统计目标语句中各词语的出现次数,确定出现次数大于预设的次数阈值的词语作为第二类词语;

根据第二类词语,确定第二类词语集合;

根据第一类词语集合和第二类词语集合,确定各政策维度的情感词集合。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离;

根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型;

生成与各政策维度对应的政策类型的情感词库;

将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

获取待处理政策数据,提取待处理政策数据的特征;

根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型;

根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

在一个实施例中,处理器执行计算机程序时还实现以下步骤:

根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据;

统计情感词库中的政策维度情感词在待处理政策数据中出现的次数;

根据出现的次数,确定待处理政策数据的分数;

根据待处理政策数据的分数,确定政策力度。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

获取预设的各政策类型的情感词库;

获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型;

根据预设的各政策类型的情感词库,确定目标政策类型的情感词库;

根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度。

上述政策力度分析的存储介质,获取预设的各政策类型的情感词库,获取待处理政策数据,确定与待处理政策数据的政策类型对应的目标政策类型,确定目标政策类型的情感词库,根据目标政策类型的情感词库确定待处理政策数据的分数,根据待处理政策数据的分数,确定政策力度,在政策领域,通过情感词库确定待处理政策的分数,根据待处理政策的分数,确定政策力度,通过分数实现对政策力度的数值化评价,实现基于情感分析的政策力度分析。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取历史政策数据集合、预设的政策维度以及预设的政策维度的种子词;

根据政策维度的种子词,遍历历史政策数据集合,确定各政策维度的情感词集合;

根据预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数;

根据各政策维度的情感词集合,生成与各政策维度对应的政策类型的情感词库。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取历史政策数据集合中的词语,并生成与词语对应的词向量;

确定与政策维度的种子词的词向量距离在预设的距离阈值范围内的第一类词语集合;

根据政策维度的种子词和第一类词语集合,遍历历史政策数据集合,确定各政策维度的情感词集合。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

将历史政策数据集合中的历史政策数据拆分为完整语句;

根据政策维度的种子词和第一类词语集合中的第一类词语,遍历拆分后的完整语句,确定目标语句;

统计目标语句中各词语的出现次数,确定出现次数大于预设的次数阈值的词语作为第二类词语;

根据第二类词语,确定第二类词语集合;

根据第一类词语集合和第二类词语集合,确定各政策维度的情感词集合。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

确定各政策维度的情感词集合中各政策维度情感词与对应的政策维度的种子词之间的词向量距离;

根据词向量距离和预设的评分标准,确定各政策维度的情感词集合中各政策维度情感词的分数。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据各政策维度携带的预设的政策类型标识,确定与各政策维度对应的政策类型;

生成与各政策维度对应的政策类型的情感词库;

将各政策维度的情感词集合,存入与各政策维度对应的政策类型的情感词库。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

获取待处理政策数据,提取待处理政策数据的特征;

根据待处理政策数据的特征匹配预设的特征数据库,确定待处理政策数据的政策类型;

根据待处理政策数据的政策类型,匹配预设的政策类型数据库,确定与待处理政策数据的政策类型对应的目标政策类型。

在一个实施例中,计算机程序被处理器执行时还实现以下步骤:

根据目标政策类型的情感词库中的政策维度情感词,遍历待处理政策数据;

统计情感词库中的政策维度情感词在待处理政策数据中出现的次数;

根据出现的次数,确定待处理政策数据的分数;

根据待处理政策数据的分数,确定政策力度。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1