基于修正余弦相似度的冲突度量方法及设备与流程

文档序号:19376494发布日期:2019-12-10 23:55阅读:404来源:国知局
基于修正余弦相似度的冲突度量方法及设备与流程

本申请涉及传感器数据传输相关技术,具体来说,涉及基于修正余弦相似度的冲突度量方法及设备。



背景技术:

由于传感器在实际的应用环境中通常会受到各种因素的干扰以及传感器自身的问题,从而导致输出的数据常常是不一致甚至相互矛盾。针对高冲突证据的组合问题,现有的众多融合方法忽略了对证据冲突本身的研究。到目前为止,有关衡量证据冲突程度的研究仅发表了少量成果。在新的冲突度量方法中考虑了角度和向量长度等多种因素,可以有效地表整证据之间的冲突程度。可以有效的解决信息融合中存在的问题;

很显然,在对冲突的证据融合之前,准确地判断证据之间是否存在冲突以及合理地度量冲突的大小是一个非常关键的问题。但是,到目前为止尚未有一个统一的测度来表征证据之间的冲突程度。



技术实现要素:

本申请的一个实施例公开了:一种基于修正余弦相似度的冲突度量方法,其包括:将证据1和证据2的基本概率赋值bpa的信任函数和似然函数分别表示成第一信任函数向量bel1和第二信任函数向量bel2以及第一似然函数向量pl1和第二似然函数向pl2;计算bel1和bel2的第一修正余弦相似度si(bel1,bel2)以及pl1和pl2的第二修正余弦相似度si(pl1,pl2);以及基于所述第一修正余弦相似度si(bel1,bel2)以及所述第二修正余弦相似度si(pl1,pl2)来计算bpa相似度;其中根据下述公式来计算所述修正余弦相似度:

其中a和b是n维向量,a=[a1,a2,l,an]且b=[b1,b2,l,bn],n为正整数,α-d是基于距离的相似度,d是向量a和b之间的欧氏距离,α是大于1的常数,min(|a|/|b|,|b|/|a|)是|a|/|b|和|b|/|a|中的最小值,以及sicos(a,b)是向量a和b的余弦相似度。

本申请的另一个实施例公开了:一种基于修正余弦相似度的冲突度量设备,其包括:存储器,其经配置以存储指令;以及处理器,其经配置以执行所述存储器里存储的指令,所述指令致使所述处理器以:将证据1和证据2的基本概率赋值bpa的信任函数和似然函数分别表示成第一信任函数向量bel1和第二信任函数向量bel2以及第一似然函数向量pl1和第二似然函数向pl2;计算bel1和bel2的第一修正余弦相似度si(bel1,bel2)以及pl1和pl2的第二修正余弦相似度si(pl1,pl2);以及基于所述第一修正余弦相似度si(bel1,bel2)以及所述第二修正余弦相似度si(pl1,pl2)来计算bpa相似度;其中根据下述公式来计算所述修正余弦相似度:

其中a和b是n维向量,a=[a1,a2,l,an]且b=[b1,b2,l,bn],n为正整数,α-d是基于距离的相似度,d是向量a和b之间的欧氏距离,α是大于1的常数,min(|a|/|b|,|b|/|a|)是|a|/|b|和|b|/|a|中的最小值,以及sicos(a,b)是向量a和b的余弦相似度。

附图说明

图1展示了根据本申请的五对bpas对应的不同冲突测度k、dj和sibpa(m1,m2)值的对比。

图2展示了根据本申请的证据m1和m2之间的不同冲突测度的变化曲线图。

图3展示了根据本申请的当子集变化时,20种情况下和之间不同冲突测度的变化。

图4展示了根据本申请的不同证据冲突测度随子集变化的趋势。

具体实施方式

为了解决上述技术问题,本申请公开了一种基于修正余弦相似度的冲突度量方法及设备。

经典冲突系数k常常被用来度量证据之间的冲突程度,经典冲突系数k的定义如下:

假设在同一辨识框架θ下有两组证据e1和e2,其相应的基本概率分配函数为m1和m2,焦元分别为a1,a2,l,ak,b1,b2,l,bl。

设0≤k<1,则d-s组合规则如下:

其中

虽然经典冲突系数k可以表征证据之间的冲突程度,但是k仅仅反映出了证据之间的一种非包容性。假设在同一辨识框架下有两组证据,其基本概率赋值(basicprobabilityassignment,bpa)分别为:m1(abc)=1,m2(cde)=1,此时两组证据只有一个相容元素c,两证据具有较大的冲突。然而根据上述公式可得k=0,其表示证据之间是完全没有冲突的,显然这不符合人的直觉推理。因此,经典冲突系数k在很多情况下无法有效度量证据之间的冲突程度。

为了解决经典冲突系数k存在的问题,在文献w.r.liu.analyzingthedegreeofconflictamongbelieffunctions中liu对证据之间的冲突进行了深入的分析,认为经典的冲突系数k不能有效地度量证据之间的冲突程度,进而引入了博弈概率距离,并利用博弈概率距离和经典冲突系数组成一个二元变量,来共同度量证据之间的冲突程度pignistic距离difbetp,并提出用二元数组<k,difbetp>来表征证据之间的冲突程度。pignistic距离difbetp的定义如下:

假设m是辨识框架θ上的一组bpa,对应的pignistic概率函数betpm:θ→[0,1]的定义如下:

其中,|a|为子集a中所含有的元素的个数。betpm描述了m对幂集2θ上各子集的支持程度。

假设m1,m2为辨识框架θ上的两组bpas,分别对应这两组bpas的pignistic概率,pignistic概率距离的定义如下:

表示两个证据体对命题a的pignistic概率的差值的绝对值。pignistic概率距离是所有的单元素命题的pignistic概率中相差最大的值。本申请中将简化为difbetp。

liu以二元变量<k,difbetp>作为度量证据间冲突程度的评判准则,并讨论了以下4种情形:

(1)当k和difbetp的值都比较小时,这对参数值表明证据m1和m2之间存在较小的冲突,可以使用dempster组合规则。

(2)当k值较大而difbetp值比较小时,这对参数值表明证据m1和m2之间没有明显的区别,dempster组合规则的使用需要谨慎。

(3)当k值较小而difbetp值比较大时,这对参数值表明证据m1和m2之间有明显的区别,不建议使用dempster组合规则。

(4)当k值和difbetp的值都比较大时,这对参数值表明证据m1和m2之间是高度冲突的,不能使用dempster组合规则。

但不足的是,liu并没有提出一个能把两个变量统一起来的参数。然而,实际上通常需要一个符合直观感觉的数值来衡量证据之间的冲突程度。此外,jousselme证据距离dj也通常被用来度量证据之间的冲突程度,但证据距离仅反映了证据间的差异性方面。

目前的在有关表征向量之间相似程度的研究成果中,通常只考虑了向量之间的距离或角度对相似度的影响。但是,基于角度的相似度和基于距离的相似度都不能准确、全面地表征向量之间的相似程度。在目前有关证据冲突程度方面的研究成功都存在一定程度的不足,但是如何准确、有效地表征证据之间的冲突程度却常常被忽视。只有恰当地表征证据间的冲突程度,并发现冲突与导致冲突原因之间的相互关系,才能从根本上解决证据理论中存在的问题。

相比其它多源信息融合方法,证据理论具有很多优点,因而在信息融合领域中已成为一种基本的、重要的、不可或缺的算法。然而,对于冲突证据尤其是高度冲突的证据,若利用dempster组合规则进行融合,融合结果可能会与人的直观感觉相悖,甚至会产生一票否决的问题。基于修正余弦相似度的冲突度量方法可以相对准确、有效地表征证据之间的冲突程度。恰当地表征证据间的冲突程度,并发现冲突与导致冲突原因之间的相互关系,避免一票否决的问题,能在一定程度上上解决证据理论中存在的问题。

为了更好的表征证据之间的冲突大小,本申请提出了一种新的bpa相似度。

假设a=[a1,a2,l,an]和b=[b1,b2,l,bn]为n维向量,则向量a和b的修正余弦相似度的定义如下:

式中α-d表示基于距离的相似度,d代表向量a和b之间的欧氏距离,参数α是大于1的常数。α的值越大,欧氏距离d对向量相似度的影响越大;参数min(|a|/|b|,|b|/|a|)表示|a|/|b|和|b|/|a|中的最小值;sicos(a,b)为向量a和b的余弦相似度。

接着,本申请计算基于修正余弦相似度的bpa相似度。

假设在辨识框架θ={w1,w2,l,wn}下有两组证据e1和e2,m1和m2分别为这两组证据源的bpa函数。m1和m2可以分别表示成信度区间[bel1(wj),pl1(wj)],j=1,2,l,n和[bel2(wj),pl2(wj)],j=1,2,l,n的形式。

根据上述的信度区间,可将bpa的信任函数和似然函数分别表示成两个向量的形式,分别称之为信任函数向量和似然函数向量,其数学表示分别如下:

beli=[beli(w1),beli(w2),l,beli(wn)],i=1,2(2)

pli=[pli(w1),pli(w2),l,pli(wn)],i=1,2(3)

根据修正余弦相似度的公式(1),可以分别求出两个信任函数向量的修正余弦相似度和两个似然函数向量的修正余弦相似度,本文分别称这两个相似度为信任函数相似度si(bel1,bel2)和似然函数相似度si(pl1,pl2)。基于求出的两个相似度,本申请提出一种基于修正余弦相似度的bpa相似度。

sibpa=(1-β)*si(bel1,bel2)+β*si(pl1,pl2),0≤β≤1(4)

其中参数β表示两组bpa的整体不确定度,其定义如下:

由于pli(wj)≥beli(wj),所以β≥0。如果pli(wj)=beli(wj),i=1,2,j=1,2,l,n,则β的值为最小值0;如果beli(wj)=0,i=1,2,j=1,2,l,n,则β的值为最大值1。

pl(wi)-bel(wi)表示证据对单子集焦元wi的不确定度。显然,不确定度β越大,似然函数相似度对bpa相似度的影响越大,反之信任函数相似度对bpa相似度的影响越大。当不确定度β=1时,信任函数相似度对bpa相似度不起任何作用,完全由似然函数相似度决定bpa的相似度;当不确定度β=0时,似然函数相似度对bpa相似度不起任何作用,完全由信任函数相似度决定bpa的相似度。

bpa相似度sibpa(m1,m2)具有相似度的基本特征,且和证据m1、m2的分布相一致。因而,sibpa(m1,m2)可以用来表征证据m1和m2的冲突程度(相似度)。由于修正的余弦相似度si考虑了向量模这一重要因素克服了复合相似度的不足。此外,基于修正余弦相似度的bpa相似度同时考虑了信任函数、似然函数以及不确定度β三个重要因素,可以有效地表征证据之间的冲突程度。

基于上述计算方法,本申请借以下两个例子来说明本申请所得到的技术效果。

算例1:假设在辨识框架θ={w1,w2,w3,w4,w5}下有来自三组不同信息源的bpa,m1、m2和m3,具体分布如下:

m1:m1(w1)=m1(w2)=m1(w3)=m1(w4)=m1(w5)=0.2

m2:m2(w1)=m2(w2)=m2(w3)=m2(w4)=m2(w5)=0.2

m3:m3(w1)=m3(w2)=m3(w3)=m3(w4)=0.25

如果用经典冲突系数k来衡量证据之间的冲突程度,可得k(m1,m2)=k(m1,m3)=0.8,表示m1和m2之间的冲突程度和m1和m3之间的冲突程度一样,且它们都处于高度冲突状态。事实上,由于m1和m2两组证据完全一样,它们之间没有任何冲突,证据m1和m3之间存在较小的冲突。因此,证据m1和m3之间的冲突程度应该大于证据m1和m2之间的冲突程度。若利用liu的方法来表征证据之间的冲突程度,可得cf(m1,m2)=<k(m1,m2),difbetp(m1,m2)>=<0.8,0>,此结果认为证据m1和m2之间的冲突不明显,dempster组合规则需要谨慎使用。利用本申请提出的bpa相似度sibpa,可得:

1-sibpa(m1,m2)=0<1-sibpa(m1,m3)=0.1707

上述结果表明,证据m1和m2之间完全没有冲突,而m1和m3之间存在一定的冲突,与直观分析的结果一致。

以上结果表明k不能有效表示证据间的冲突大小,现有技术中的方法不能较好的表征证据之间的冲突大小。而本文提出的bpa相似度能更为准确的表征证据间的冲突大小。

算例2:假设在辨识框架θ={w1,w2,w3,w4,w5,w6,w7,w8}下,m1和m2为来自不同证据源的bpa,五对bpas具体如下:

第一对:m1(w1,w2,w3)=1,m2(w1,w2,w4)=1

第二对:m1(w1,w2,w3,w4)=1,m2(w1,w2,w3,w5)=1

第三对:m1(w1,w2,w3,w4,w5)=1,m2(w1,w2,w3,w4,w6)=1

第四对:m1(w1,w2,w3,w4,w5,w6)=1,m2(w1,w2,w3,w4,w5,w7)=1

第五对:m1(w1,w2,w3,w4,w5,w6,w7)=1,m2(w1,w2,w3,w4,w5,w6,w8)=1

五对bpas的不同冲突测度结果的对比如图1所示。由上述五对bpas可知,从第一对bpas到第五对bpas,每对bpas都只有一个不相容的元素,但是相容元素的个数却由2个增加到6个。从直觉上来讲,每对bpas都存在一定的冲突,且冲突程度应该小于相似程度。此外,从第一对bpas到第五对baps,证据之间的冲突程度应该是越来越小。

图1展示了根据本申请的五对bpas对应的不同冲突测度k、dj和sibpa(m1,m2)值的对比。对于五对bpas来说,经典冲突系数k一直是常数0,表示五对bpas都是没有任何冲突的。尽管从第一对bpas到第五对bpas证据距离dj的值在不断减小,即冲突程度越来越小,但是五对bpas的dj值都大于或等于0.5表示bpas之间是处于高度冲突状态,冲突程度都大于等于相似程度。显然,k和dj都与上述的直觉分析相悖。由于k仅仅反映了证据之间的一种非包容性,因此,对于五对bpas来说经典冲突系数k=0为一常数,无法用来表征证据之间的冲突程度。从结果看,dj也不能准确地表征证据之间的冲突程度。

若利用本申请提出的bpa相似度sibpa(m1,m2)来表征证据之间的冲突程度,从图1可以看出,从第一对bpas到第五对bpas,sibpa(m1,m2)的值从0.5909逐渐递增到0.7957。

结果表明五对证据都存在一定程度的冲突,但不处于高度冲突状态且冲突程度越来越小,此外,证据的冲突程度小于相似程度。总之,sibpa(m1,m2)的结果和上述直觉分析是一致的。因此,相比k和dj,bpa相似度sibpa(m1,m2)更能准确地表征证据之间的冲突程度。

算例3:假设在辨识框架θ={w1,w2,l,w2n}下,m1和m2为来自不同信息源的bpa,bpa具体如下:

m1:m1(w1)=m1(w2)=,l,=m1(wn)=1/n

m2:m2(wn+1)=m2(wn+2)=,l,=m2(w2n)=1/n

由于证据m1和m2分别支持不同的命题,因此两组bpas是完全冲突的。当n=1,2,l,20时,证据m1和m2之间的不同冲突测度的变化曲线图如图2所示。

从图2可以看出,当n=1时,dj,difbetp和0.5*(k+dj)的值都是1,γ=0,这些值均表示证据之间是完全冲突的,即这些冲突度量方法和上述的直觉分析是一致的。但是当n>1时,冲突测度dj,difbetp和0.5*(k+dj)的值都小于1,且随着n值的增加dj值收敛于0,0.5*(k+dj)值收敛于0.5,γ(m1,m2)值收敛于1。这些参数值均表示随着n值的增加,两组证据之间的冲突程度越来越小,显然这与直觉分析是不一致的。但是,当n=1,2,l,20时,k=1,sibpa(m1,m2)=0,表明两组证据一直是完全冲突的,这和上述的直觉分析相一致。

算例4:假设在辨识框架θ={1,2,l,20}下有两组证据m1和m2,其bpa分别如下所示:

证据1:m1(2,3,4)=0.05,m1(5)=0.05,m1(θ)=0.1,m1(a)=0.8

证据2:m2(1,2,3,4,5)=1

其中a按照{1},{1,2},{1,2,3},l,{1,2,l,20}的规律变化。

图3展示了根据本申请的当子集变化时,20种情况下和之间不同冲突测度的变化。图4展示了根据本申请的不同证据冲突测度随子集变化的趋势。

当a由{1}变化为{1,2,3,4,5}时,证据1与证据2支持的命题{1,2,3,4,5}越来越相似,即冲突应该越来越小;当a由{1,2,3,4,5}变化为a={1,2,l,20}时,证据1变的越来越不确定和证据2支持的命题{1,2,3,4,5}越来越不同,即冲突越来越大;a={1,2,3,4,5}时,其和证据2支持的命题完全一样,此时两组证据之间的冲突最小。

从图4中可以看出,随着子集a的不断变化,冲突测度dj,0.5(k+dj)和difbetp的变化是一致的。尽管dj和0.5(k+dj)呈现出相同的变化趋势,但是0.5(k+dj)值一直小于相应的dj值。因此,相比0.5(k+dj),dj能更好地表征证据之间的冲突程度。从情况2到情况20,difbetp的值一直都小于0.25,且从情况6到情况8,difbetp的值甚至在逐渐减小,这和直觉推理相悖。对于20种情况,k一直等于0,表示证据之间是没有冲突,这也和直觉分析相违背。从情况2到情况20,由于k=0且difbetp的值都比较小,因此liu的方法<k,difbetp>表示证据m1和m2之间存在较小的冲突。也就是说,当a变化时,<k,difbetp>不能有效地度量证据之间的冲突程度。与此同时,由于关联系数γ和bpa相似度sibpa值越大,表示证据之间的冲突越小,因此γ、sibpa和dj应该有相反的曲线,这和图中的曲线描述一致。但是当γ达到最大值时,n=4,与上述分析的n=5是不一致的,该算例表明利用bpas相似度sibpa来表征证据之间的冲突程度是可行的。

根据以上四个算例可知,相比已有的冲突测度,本申请提出的bpa相似度sibpa能更有效地度量证据之间的冲突大小。

虽然本文中描述的实施例可具有各种修改及替代形式,但是特定实施例已在图式中通过实例展示且已在本文中予以详细描述。本发明并不限于所揭示的特定形式。本发明涵盖落于如由权利要求书定义的本发明的精神及范围内的所有修改、等效物及替代。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1