基于观点语句可信度的话题观点强度计算方法与流程

文档序号:11155181阅读:来源:国知局

技术特征:

1.一种基于观点语句可信度的话题观点强度计算方法,其特征在于:首先通过网页的多个关键属性计算出网页的可信程度,接着通过计算网页中观点语句和网页主题的关联性,获得网页主题对于观点语句的支持度,然后综合网页可信度和观点语句支持度得到观点语句的可信度,最后通过对隶属于给定观点类的所有观点语句的可信度进行求和,计算得到该话题观点类的观点强度。

2.如权利要求1所述的基于观点语句可信度的话题观点强度计算方法,其特征在于:假设围绕某话题的观点共分为n类,由这n个观点类所构成的集合记为VCS={VC1,VC2,VC3,...,VCn},其中任一观点类VCi(VCi∈VCS)包含Ci个观点语句,即上述n个观点类中的所有观点语句来源于m个网页,这m个网页所构成的集合记为VCD={d1,d2,d3,...,dm},其中任一网页dk(dk∈VCD)包含Dk个观点语句,这Dk个观点语句构成网页dk的观点语句集合

网页可信度计算;对m个网页中的每一个网页dk(dk∈VCD),综合考虑网页dk的多个关键属性,主要包括网页dk的NPR因子、网页dk的NTR因子、以及网页dk的时间因子,计算出网页dk的网页可信度。

3.如权利要求2所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,观点语句支持度计算:对于VCi中任一观点语句(即),假定满足则首先采用余弦相似度计算方法,计算观点语句和网页dk的标题间的相似度;接着,采用余弦相似度计算方法,计算观点语句和网页dk的关键词间的相似度;最后,在前述两种相似度中,选择取值较大的相似度,作为网页dk对观点语句的支持度。

4.如权利要求2所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,话题观点强度值计算:综合步骤1得到的网页dk的网页可信度,以及步骤2得到的网页dk对观点语句的支持度,获得观点类VCi中任一观点语句的可信度;最后,通过对观点类VCi中的所有观点语句的可信度进行求和,计算得到话题观点的强度值。

5.如权利要求2所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,对于网页集合VCD中的每一个网页dk,综合考虑网页dk的多个关键属性,采用公式(1)计算出网页dk的网页可信度DRW(dk);

DRW(dk)=λ1NPR(dk)+λ2NTR(dk)+λ3T(dk) 公式(1)

公式(1)中的3个系数λ1、λ2和λ3满足:NPR(dk)表示网页dk的NPR因子,NTR(dk)表示网页dk的NTR因子,T(dk)表示网页dk的时间因子。

6.如权利要求5所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,网页dk的NPR因子计算如公式(2)所示,其中PR(dk)表示网页dk的PageRank值(即PR值):

网页dk的NTR因子的计算如公式(3)所示,其中AP表示权威专业网站的集合:

网页dk的时间因子计算如公式(4)所示:

其中,td表示网页dk的最后修改时间,而tmax表示集合VCD中修改时间最晚的网页的修改时间。

7.如权利要求2所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,观点语句支持度计算:使用网页标题和网页关键词来表征网页的主题,网页标题可以通过对网页源码的<title>标签获得,而网页关键词则通过对网页正文用TF-IDF算法得到;假设为VCi中的任一观点语句(即),且满足网页dk的标题经过分词、去停用词之后,所得的词语集合记为取网页dk的所有关键词构成集合而观点语句经过分词、去停用词之后,所得的词语集合记为并且令

利用余弦相似度计算方法,计算观点语句和网页dk的标题之间的相似度的过程,观点语句和网页dk的关键词之间的相似度的计算过程与此类似;首先,计算网页dk的标题词语集合W1相对于词语集合WTS的词语向量其中元素的取值满足公式(5):

接着,计算观点语句的词语集合W3相对于词语集合WTS的词语向量其中元素的取值满足公式(6):

然后,利用公式(7)计算VT1和VS1之间的余弦相似度:

类似地,计算网页dk的关键词集合W2相对于词语集合WKS的词语向量以及观点语句的词语集合W3相对于词语集合WKS的词语向量进而计算VT2和VS2之间的余弦相似度Cos(VT2,VS2);

在此基础上,采用公式(8)网页dk的对观点语句的支持度:

8.如权利要求2所述的基于观点语句可信度的话题观点强度计算方法,其特征在于,话题观点强度值计算:首先,根据步骤1得到的网页dk的网页可信度DRW(dk),以及步骤2得到的网页dk的对观点语句的支持度采用公式(9)计算观点语句的可信度:

然后,采用公式(10)对观点类VCi中的所有观点语句的可信度进行求和,计算得到话题观点类VCi的强度值:

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1