1.一种基于强化学习的文本情感分析方法,其特征在于,所述方法包括:
获取待情感分析文本,利用双向最大匹配法对待情感分析文本进行分词处理,得到待情感分析文本的分词文本;
利用依存关系图来计算分词文本中词语之间的关联强度;
根据词语之间的关联强度,利用textrank算法迭代算出词语的重要度得分,从而得到分词文本中的关键词;
利用哈夫曼树将分词文本关键词转化为词向量;
利用基于强化学习的情感分类模型对词向量进行情感分类,并在情感分类模型中加入情感因子,进行模型的优化。
2.如权利要求1所述的一种基于强化学习的文本情感分析方法,其特征在于,所述利用双向最大匹配法对待情感分析文本进行分词处理,包括:
1)将待情感分析文本句子反转生成逆序句;
2)构建逆序词典,词典中包含了所有可能出现的词,并均以反向顺序进行存储;
3)从逆序句的左侧到右侧进行扫描,以贪心的方式进行词语匹配,若逆序句中的某个字串与逆序词典中的某个词匹配,则在当前位置切分出长度最大的词,并将无法匹配的词单独分开,得到待情感分析文本的分词文本。
3.如权利要求2所述的一种基于强化学习的文本情感分析方法,其特征在于,所述利用依存关系图来计算分词文本中词语之间的关联强度,包括:
根据句子的依存句法分析结果对分词文本中的词语构造无向图;
利用词语之间的引力值以及依存关联度计算求得边的权重,所述任意两词wi和wj的依存关联度为:
其中:
len(wi,wj)表示词语wi和wj之间的依存路径长度;
b为超参数;
所述分词文本中词语wi和wj的引力计算公式:
其中:
tfidf(w)是词w的tf-idf值;
d是词wi和wj的词向量之间的欧式距离;
分词文本中两个词语wi和wj之间的关联度为:
weight(wi,wj)=dep(wi,wj)*fgrav(wi,wj)
其中:
dep(wi,wj)为词语wi和wj之间的依存关联度;
fgrav(wi,wj)为词语wi和wj之间的引力值。
4.如权利要求3所述的一种基于强化学习的文本情感分析方法,其特征在于,所述利用textrank算法迭代算出词语的重要度得分,包括:
利用textrank算法建立一个无向图g=(v,e),其中v是顶点的集合,e是边的集合,根据下列式子算出顶点wi的得分,并选取得分最高的t个词语作为关键词:
其中:
η为阻尼系数;
weight(wi,wj)为词语wi和wj之间的关联度。
5.如权利要求4所述的一种基于强化学习的文本情感分析方法,其特征在于,所述利用哈夫曼树将关键词转化为词向量,包括:
取一个5个词大小的窗口当做语境,将所述分词输入到窗口中,并将它们的k维向量加和在一起,形成隐藏层k个节点;
输出层是一个巨大的二叉树,叶节点代表文本关键词中所有的词,语料含有v个独立的词,则二叉树有|v|个叶节点,而这整颗二叉树构建的算法就是哈夫曼树,进一步地,隐层的每一个节点都会跟二叉树的内节点有连边,二叉树的每一个内节点有k条连边,每条边有权值;
对于叶节点的每一个字,有一个全局唯一的编码,本发明记左子树为1,右子树为0,哈夫曼树将分词文本关键词中的所有字利用二进制编码的形式进行表征,得到词向量。
6.如权利要求1所述的一种基于强化学习的文本情感分析方法,其特征在于,所述利用基于强化学习的情感分类模型对词向量进行情感分类,包括:
1)对于所述词向量,使用状态函数模拟强化学习中智能体的状态变化,上一层的状态会作为一组数据,输入到下一时刻的动作选择和动作评价过程,所述状态函数为:
st=ht
其中:
ct-1为t-1时刻动作评价层细胞单元的参数,该参数在训练阶段进行训练;
ht为t时刻动作评价层细胞隐藏状态,并由智能体状态st进行保存;
xt为t时刻的输入词向量;
2)使用情感动作选择器,以当前词语的词向量作为输入,执行情感动作选择策略:
h′t-1=st-1
outt=f(w,ht-1,xt)
其中:
h′t-1为当前动作选择器的状态;
outt为t时刻所输出的动作;
w′为情感动作选择器的参数;
xt为t时刻的输入词向量;
所述情感动作选择器的输出值为一个三维向量,分别代表消极、中性以及积极的情感,本发明选择评分最大的情感作为词向量的情感动作;
通过建立了一个积极词典和一个消极词典,未命中词典的词则默认为中性情感,针对每一个词语,模型以1-ε的概率从己知词典中查找词语并选择对应情感极性,以ε的概率随机选择一个情感:
at=dict[t],p=1-ε
at=random(neg,neu,pos)
其中:
at代表t时刻的情感动作;
neg,neu,pos分别表示消极、中性以及积极的情感动作;
p表示概率;
dict[t]表示第t个词语在情感因子中的极性;
且ε的值会随着迭代次数的增加进行逐步下降;
3)利用评价层对所选择的情感动作进行评价,针对三种不同的情感动作,本发明设计了三个不同的通道:{cneg,cneu,cpos},根据情感动作的倾向性,选择相应的通道进行情感动作的评价,选取其中评分最高的情感动作作为文本情感分析结果,所述评分函数为:
其中:
v表示neg,neu,pos三种情感动作;
ht-1为t-1时刻智能体状态;
4)基于强化学习建立学习策略损失函数,并使用反向传播的方法优化模型中的参数,所述学习策略损失函数为:
l=π(a|st,xt;θ)
其中:
θ为模型的参数;
st表示t时刻模型的状态;
xt为t时刻模型的输入;
a为基于当前状态的情感动作。
7.一种基于强化学习的文本情感分析系统,其特征在于,所述系统包括:
文本获取装置,用于获取待情感分析的文本;
文本处理器,用于利用双向最大匹配法对待情感分析文本进行分词处理,并利用依存关系图来计算分词文本中词语之间的关联强度,同时利用textrank算法迭代算出词语的重要度得分,从而得到分词文本中的关键词;
文本情感分析装置,用于利用哈夫曼树将分词文本关键词转化为词向量,并利用基于强化学习的情感分类模型对词向量进行情感分类。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有文本情感分析程序指令,所述文本情感分析程序指令可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的一种基于强化学习的文本情感分析的实现方法的步骤。