一种基于依存句法和泛化因果网络进行情感原因挖掘方法与流程

文档序号:19892624发布日期:2020-02-11 12:53阅读:来源:国知局

技术特征:

1.一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,该方法主要步骤为:首先根据依存句法抽取因果关系,然后利用抽取的因果关系构建泛化因果关系网络;具体如下:

1)利用爬虫框架,爬取新闻数据,输入数据;

2)对输入数据进行预处理;

3)根据二元关系模型和语义分析,对文本进行语义模式提取;

4)判断提取的语义模式是否属于因果关系语义模式;

5)输出语句中的原因事件,结果事件与事件之间的因果关系;

6)利用因果关系连接词来识别成对的因果关系事件;

7)从确定的事件中提取更具体的因果事件;

8)把因果事件抽取成为由一系列动词名词联合组成的事件;

9)利用原因事件和结果事件构建因果关系网络,原因事件和结果事件建立连边;

10)对事件做泛化处理;

11)对因果事件进行预测;

12)评估因果关系网络预测的结果,采用计算精确率p值,召回率r值和f值进行评估。

2.根据权利要求1所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述步骤1)中爬虫框架选自heritrix、jspider、webmagic、webcollector中任一种。

3.根据权利要求1所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述步骤2)中预处理步骤包括断句、分词、词性标注或语义分析。

4.根据权利要求3所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述断句处理主要是利用现有的分词器实现。

5.根据权利要求4所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述分词器主要包括word分词器、ansj分词器、斯坦福分词、lucene&nutch分词器、斯坦福分词器或lucene&nutch分词器。

6.根据权利要求1所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述步骤9)具体是:边代表事件之间的关系,箭尾指向原因事件,箭头指向结果事件;因果有传递性,即链式特性,多个匹配的因果头尾相接组成一个长链条。

7.根据权利要求1所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述步骤10)具体是:同一类的事件归为一个事件,泛化后的事件常表征一类事件,即抽象事件。

8.根据权利要求1所述的一种基于依存句法和泛化因果网络进行情感原因挖掘方法,其特征在于,所述步骤11)具体是:预测导致a事件发生的原因事件,通过泛化的因果关系网络,找到a事件的结点,找到与其相关联的原因事件;然后找到一系类导致a事件发生的原因事件。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1