一种基于学习算法采样网络识别感兴趣节点的方法与流程

文档序号:12667532阅读:365来源:国知局
一种基于学习算法采样网络识别感兴趣节点的方法与流程

本发明涉及图像检索领域,尤其是涉及了一种基于学习算法采样网络识别感兴趣节点的方法。



背景技术:

识别感兴趣节点常用于智能视频监控、人物检索等领域,利用特定兴趣定位网络中“感兴趣的人”(POI),具体地,例如在参加过特定规划会议或参与组织过特别袭击的人员中,将使用某种媒介进行通信的所有人被标记为POI,凭此锁定嫌疑人员。再者也可应用于在社交网络中找寻具有特定兴趣的一类人的情况。研究特定某种活动的参与范围是人物检索领域重要的研究方向之一,在此种情境中,人们可能不会公开甚至是提供真实准确的信息,如何识别出真实具有特定属性的人,显得尤为重要。

本发明提出了一种基于学习算法采样网络识别感兴趣节点的方法,目的是识别出尽可能多的感兴趣节点。首先利用基于网络结构特征来学习红色节点(表示POI的节点即“红色”节点,其他节点即为“蓝色”)之间的连接模式(如同质性与非同质性),利用基于相邻应答的特征来学习一个节点对其邻居节点颜色的描述与其真实颜色之间的关系,然后基于对两种特征的观察成功地预测节点v为红色的概率P(v=R),在此概率最高的节点上放置下一个监视器,最终在POI表现出同质性的情况下(即可能关联其他POI),选择带最多POI的节点即为感兴趣节点。本发明突破了取决于节点邻居节点所报信息的局限,通过提供一种基于学习的监视器放置策略,最大化所能观察到的红色节点的总数,使得定位POI更准确有效,推动了人物检索工作的研究和发展。



技术实现要素:

针对现有方法多需要更有效的对比推动研究的问题,本发明的目的在于提供一种基于学习算法采样网络识别感兴趣节点的方法,基于观察到的网络结构和节点v的邻居节点关于v的描述,成功地预测节点v为红色的概率P(v=R),从而识别网络中的POI,使得定位POI更准确有效,推动了人物检索工作的研究和发展。

为解决上述问题,本发明提供一种基于学习算法采样网络识别感兴趣节点的方法,其主要内容包括:

(一)分类特征;

(二)度量可信度;

(三)预测概率;

(四)放置监视器;

(五)识别感兴趣节点。

其中,所述的分类特征,是在基于学习的监视器放置算法中所使用的一组特征,有两种类型:(a)基于网络结构的特征(b)基于相邻应答的特征。

进一步地,所述的监视器,为增强对网络的观察,在节点上放置监视器,监视器可以反馈三个信息:该节点的真实颜色、该节点的真实邻居节点、该节点的邻居节点的颜色;

假设给定b个监视器的预算,并且可以在已经观察到的所有节点上放置这些监视器,那么第一步,必须在最初观察到的节点上放置监视器,因为当前没有观察到其他节点,而在后续步骤中,可以将监视器放置在所有已被观察为先前所监视节点的邻居节点上。

进一步地,所述的基于网络结构的特征,被用于学习红色节点之间的连接模式(例如同质性与反同质性),包括三种类型,分别是:

(1)红色邻居节点的数目:|{u∈N(v)|cu=R}|;

(2)蓝色邻居节点的数目:|{u∈N(v)|cu=B}|;

(3)v为红色时红色三角的数目:|{u,w∈N(v)|u∈N(w)∩w∈N(u)∩cu=cw=R}|。

进一步地,所述的基于相邻应答的特征,旨在学习一个节点对其邻居节点颜色的描述和其真实颜色之间的关系,包括五种类型,分别是:

(1)红色报红的数目:|{u∈N(v)|(usaysR)∩cu=R}|;

(2)红色报蓝的数目:|{u∈N(v)|(usaysB)∩cu=R}|;

(3)蓝色报红的数目:|{u∈N(v)|(usaysR)∩cu=B}|;

(4)蓝色报蓝的数目:|{u∈N(v)|(usaysB)∩cu=B}|;

(5)推断为红色的概率:PI(v=R)。

其中,所述的度量可信度,利用四种不同的概率来度量由不同颜色的节点所给出颜色的可信度(即被监视的节点对其邻居节点的颜色的报告是真或假),使用在放置监视器之前收集到的信息计算这些概率,节点v由节点u上的监视器所发现,四种概率为:

若给定一个节点v,使用等式(1)计算其推断概率PI(v=R)如上。

其中,所述的预测概率,为找到每个未监测节点v为红色节点的概率P(v=R),即预测概率而非简单的分配二值标签,采用逻辑回归分类器,因学习模型必须经常更新,这种分类器还有利于更快的训练。

进一步地,所述的学习模型,目标是基于观察到的网络结构和节点v的邻居节点关于v的描述,成功地预测节点v为红色的概率P(v=R),将其模型化为一个二值分类问题,但不是看分配的标签(红色或蓝色),而是预测概率找到P(v=R),模型的训练集在放置有n个监视器的环境下,由n个被监视节点的真实颜色及其相应特征值组成,再利用此数据来训练学习模型,确定第(n+1)个监视器应放置在何处。

其中,所述的放置监视器,给定n个监视器的放置、决定放置第(n+1)个监视器,将所有到目前为止未监视的节点都计算在内,接着计算与这些未监视节点相关联的特征向量,并将分类器应用于这些特征向量,给出每个未监视节点为红色的概率,选择具有最高概率的节点来放置下一个监视器。

其中,所述的识别感兴趣节点,根据目标特征及感兴趣点对目标网络进行抽样,已知节点的颜色(由直接放置在那些节点上的监视器观察所得),和所监视节点的邻居节点的描述颜色(即对于每个被监视节点的邻居节点,被监视节点的邻居节点是红色或蓝色),给定监视器预算,确定将下一个监视器放在哪里可以发现最多的红色节点,最终在感兴趣的人(POI)表现出同质性的情况下(即可能关联其他POI),选择带最多POI的节点即为感兴趣节点。

附图说明

图1是本发明一种基于学习算法采样网络识别感兴趣节点的方法的系统流程图。

图2是本发明一种基于学习算法采样网络识别感兴趣节点的方法的同构及异构体制网络概要图。

图3是本发明一种基于学习算法采样网络识别感兴趣节点的方法的评估流程图。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互结合,下面结合附图和具体实施例对本发明作进一步详细说明。

图1是本发明一种基于学习算法采样网络识别感兴趣节点的方法的系统流程图。主要包括分类特征、度量可信度、预测概率、放置监视器、识别感兴趣节点。

其中,所述的分类特征,是在基于学习的监视器放置算法中所使用的一组特征,有两种类型:(a)基于网络结构的特征(1,2,3)和(b)基于相邻应答的特征(4,5,6,7,8):

(1)红色邻居节点的数目:|{u∈N(v)|cu=R}|;

(2)蓝色邻居节点的数目:|{u∈N(v)|cu=B}|;

(3)v为红色时红色三角的数目:|{u,w∈N(v)|u∈N(w)∩w∈N(u)∩cu=cw=R}|;

(4)红色报红的数目:|{u∈N(v)|(usaysR)∩cu=R}|;

(5)红色报蓝的数目:|{u∈N(v)|(usaysB)∩cu=R}|;

(6)蓝色报红的数目:|{u∈N(v)|(usaysR)∩cu=B}|;

(7)蓝色报蓝的数目:|{u∈N(v)|(usaysB)∩cu=B}|;

(8)推断为红色的概率:PI(v=R)。

基于网络结构的特征被用于学习红色节点之间的连接模式(例如同质性与反同质性),而基于邻居节点应答的特征旨在学习一个节点对其邻居节点颜色的描述和那些邻居节点的真实颜色之间的关系。

其中,所述的度量可信度,利用四种不同的概率来度量由不同颜色的节点所给出颜色的可信度(即被监视的节点对其邻居节点的颜色的报告是真或假),使用在放置监视器之前收集到的信息计算这些概率,节点v由节点u上的监视器所发现,四种概率为:

若给定一个节点v,使用等式(1)计算其推断概率PI(v=R)如上。

其中,所述的预测概率,为找到每个未监测节点v为红色节点的概率P(v=R),即预测概率而非简单的分配二值标签,采用逻辑回归分类器,因学习模型必须经常更新,这种分类器还有利于更快的训练。学习模型,目标是基于观察到的网络结构和节点v的邻居节点关于v的描述,成功地预测节点v为红色的概率P(v=R),将其模型化为一个二值分类问题,但不是看分配的标签(红色或蓝色),而是预测概率找到P(v=R),模型的训练集在放置有n个监视器的环境下,由n个被监视节点的真实颜色及其相应特征值组成,再利用此数据来训练学习模型,确定第(n+1)个监视器应放置在何处。

其中,所述的放置监视器,给定n个监视器的放置、决定放置第(n+1)个监视器,将所有到目前为止未监视的节点都计算在内,接着计算与这些未监视节点相关联的特征向量,并将分类器应用于这些特征向量,给出每个未监视节点为红色的概率,选择具有最高概率的节点来放置下一个监视器。

其中,所述的识别感兴趣节点,根据目标特征及感兴趣点对目标网络进行抽样,已知节点的颜色(由直接放置在那些节点上的监视器观察所得),和所监视节点的邻居节点的描述颜色(即对于每个被监视节点的邻居节点,被监视节点的邻居节点是红色或蓝色),给定监视器预算,确定将下一个监视器放在哪里可以发现最多的红色节点,最终在感兴趣的人(POI)表现出同质性的情况下(即可能关联其他POI),选择带最多POI的节点即为感兴趣节点。

图2是本发明一种基于学习算法采样网络识别感兴趣节点的方法的效果比较图。基于NoodinComs4网络对五种监视器放置策略进行比较,其中最上方黑线表示网络中红色节点的总数,其中线3为本方法。

其中线1为最多红色邻居节点(MRN),MRN放置策略将监视器放置在具有最多红色邻居节点的节点上。此策略忽略了被监视节点对其邻居节点的描述,可能在具有高同质性的网络中表现最好。蓝色邻居节点在确定给定节点是否为红色的似然性上是不重要的。

其中线2为最红报红(MRSR),MRSR策略是在具有最多红色邻居节点的节点上放置一个监视器,报告它为一个红色的节点。它不影响蓝色节点信息,并且仅取决于由相邻的红色节点给出信息的准确性。蓝色节点在这个策略中本质上是无用的。在这种放置策略下,没有红色邻居节点的红色节点几乎不可能被发现。

其中线4为红色分数(RS),红色分数策略受邻居节点报告的颜色指导。若节点v将其邻居节点u报告为红色,则节点u对应的分数增加1,使它可能性更大。此策略选择具有最高红色分数的节点来放置下一个监视器。对于这种方法,红色分数容易受邻近节点所给出信息的准确性的影响。此外,由于同时使用红色和蓝色两种节点信息,此策略在与其他基准战略相比时采用的信息量最大。

其中线5为智能随机抽样(SR),在每个步骤中,智能随机放置策略将监视器放置在随机未监视的节点上。

结果表明对比五种策略,本方法表现最佳,具体地,可以学习模式和红色节点的结构化特征,并且由于囊括了邻居节点对节点的描述使得性能更优且稳定。

图3是本发明一种基于学习算法采样网络识别感兴趣节点的方法的识别流程图。首先根据分类特征预测节点v为红色的概率P(v=R),在此概率最高的节点上放置下一个监视器,最终在POI表现出同质性的情况下(即可能关联其他POI),选择带最多POI的节点即为感兴趣节点并将结果输出。

对于本领域技术人员,本发明不限制于上述实施例的细节,在不背离本发明的精神和范围的情况下,能够以其他具体形式实现本发明。此外,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围,这些改进和变型也应视为本发明的保护范围。因此,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1