技术特征:
技术总结
本发明公开了一种可自动更新的用于金融文本分析的情感字典构建方法,包括利用知识库中的现有情感词典构成基础词典Dinitial,通过机器添加以及人工添加的方式扩展基础情感词典,得到扩展情感词典Dextend,通过计算前后缀信息熵提高提取新词的准确性,然后利用朴素贝叶斯分类器和情感倾向概率对语料库中提取的新词进行概率计算,通过设置阀值将满足条件的具有正向或负向情感的情感词添加到情感词典中。同现有技术相比有如下优点:(1)新词提取更为准确,减少噪音和后续计算量;(2)情感分析计算量小,通过参数优化,可以得到更为准确的情感分析结果;(3)情感词典可根据需要不断更新,从而提高了基于情感词典的金融文本情感分析方法的准确性。
技术研发人员:孙运传;王欣宇;沈岩;方梦婷;别荣芳;崔学刚
受保护的技术使用者:北京师范大学
技术研发日:2019.03.19
技术公布日:2019.06.28