一种适用于大数据分发的Q-learning拥塞控制方法

文档序号：8459179阅读：392来源：国知局

一种适用于大数据分发的Q-learning拥塞控制方法
【技术领域】
[0001] 本发明涉及计算机网络技术，特别地涉及一种在对等网络中查找资源的方法和装置。
【背景技术】
[0002] 近年来，对等（Peer-t〇-Peer，P2P)网络已逐渐发展成一种重要的网络模式。这是因为与传统的客户机/服务器（Client/S erver，C/S)模式相比，对等网络具有容错性好、可扩展性强、成本低廉、可以充分利用分布资源等优势。对等网络在文件共享、分布式计算、流媒体服务等发面已有广泛的应用。对等网络分为两种：有结构的和无结构的，有结构的对等网络对节点的连接有严格的限制，而无结构的对等网络节点的连接有很大的自由度。由于无结构对等网络节点的分布式特点，节点只知道其邻居节点的资源，却并不知道网络中其它节点上资源的分布情况，因此无结构对等网络中一个极大的难题是网络中的资源定位问题。为此已经提出许多搜索方法来实现无结构对等网络上资源的有效定位，如洪泛法、 random walks、APS(Adaptive Probability Search)等。然而以上方法在资源查找过程中由于查找消息的转发，导致网络中部分节点在查找过程中需要处理的消息过多而出现消息拥塞，进而严重影响搜索的继续进行，造成搜索性能的下降。因而如何在对等网络中实现负载均衡就显得尤为重要。

【发明内容】

[0003] 有鉴于此，本发明提供一种在对等网络中查找资源的方法和装置，能够使非结构化P2P网络中的资源查找时间明显降低，并具有更低的网络拥塞，以及提高了查找成功率。
[0004] 为实现上述目的，根据本发明的一个方面，提供了一种在对等网络中查找资源的方法。
[0005] 本发明的在对等网络中查找资源的方法包括：使用Q-学习方法计算对等网络中各节点的Q值；在对等网络中，判断发起资源查找的当前节点是否有邻居节点包含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。
[0006] 可选地，由该Q值最大的节点发起资源查找的步骤包括：所述该Q值最大的节点确认收到的资源查找消息的存活时间不为〇,然后发起资源查找。
[0007] 可选地，所述Q-学习方法中，求Q值的公式如下：
[0008] Qnew (s, a) = Q (s, a) + a Qlocal (s, a) + β X I (U-CLi (t)) X CLi (t)；
[0009] 其中，Qmw(s，a)表示Q的新值，Q(s，a)表示Q的老值，α表示学习速率，Q ltreal (s，a) 表示被学习的值，β表示拥塞因素，函数Ι(χ)在χ<〇时取值-1，χ>〇时取值1，函数CL的计算公式为：
[0011] 其中，G表示节点Pj处理一条查找消息所需的时间；α" (〇表示时刻t节点缓存队列中待处理的消息数；
【主权项】
1. 一种在对等网络中查找资源的方法，其特征在于，包括：使用Q-学习方法计算对等网络中各节点的Q值；在对等网络中，判断发起资源查找的当前节点是否有邻居节点包含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。
2. 根据权利要求1所述的方法，其特征在于，由该Q值最大的节点发起资源查找的步骤包括：所述该Q值最大的节点确认收到的资源查找消息的存活时间不为〇,然后发起资源查找。
3. 根据权利要求1所述的方法，其特征在于，所述Q-学习方法中，求Q值的公式如下： Qnew(s, a) =Q(s, a)+aQlocal(s, a)+ 0XI(U-CLj(t))XCLj(t)；其中，Qn?(s，a)表示Q的新值，Q(s，a)表示Q的老值，a表示学习速率，Q1()c;al(s，a)表示被学习的值，0表示拥塞因素，函数I(x)在x<0时取值-l，x>0时取值1，函数CL的计算公式为：
其中，Cp,表示节点匕处理一条查找消息所需的时间；表示时刻t节点匕的缓存队列中待处理的消息数； Q1(X：al(s，a)的计算公式为：Q1<K：al(s，a) =R(s) +ymaxa,Q(s' ，a' ）；其中，y表示折扣因子，maxa，Q(s'，a')表示当前状态的下一状态所获得的最大Q值，其中s'和a'分别为下一状态和对应的行为；R表示奖赏值，其计算公式为：
其中，k为搜索到拥有资源段的节点需要的次数，化为节点Pi的吸引能力，ni为节点Pi上的资源数。其中A计算公式为：
其中A是节点i的处理能力，N(i，h)是与节点Pi相距h跳的节点个数，S是控制因数，k。表示计算连通度的半径，h6用来控制不同距离节点对节点吸引能力影响的比权重。
4. 根据权利要求3所述的方法，其特征在于，a的取值范围是[〇. 28, 0. 32]。
5. 根据权利要求3所述的方法，其特征在于，0的取值范围是[0. 48, 0. 52]。
6. 根据权利要求3所述的方法，其特征在于，Y的取值范围是[〇. 28, 0. 32]。
7. 根据权利要求3所述的方法，其特征在于，S的取值范围是[0.8, 1.2]。
8. 根据权利要求3所述的方法，其特征在于，k。的取值范围是[1. 8, 2. 2]。
9. 一种在对等网络中查找资源的装置，其特征在于，包括：计算模块，用于使用Q-学习方法计算对等网络中各节点的Q值；判断模块，用于判断发起资源查找的当前节点是否有邻居节点包含所述资源；资源获取模块，用于在发起资源查找的当前节点有邻居节点包含所述资源的情况下，向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；消息发送模块，用于在发起资源查找的当前节点没有邻居节点包含所述资源的情况下，将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点。
10.根据权利要求9所述的方法，其特征在于，还包括判断模块，用于在收到资源查找消息的情况下，判断所述资源查找消息的存活时间是否为〇,若否，则发起资源查找。
【专利摘要】一种适用于大数据分发的Q-learning拥塞控制方法。本发明提供一种在对等网络中查找资源的方法和装置，能够使非结构化P2P网络中的资源查找时间明显降低，并具有更低的网络拥塞，以及提高了查找成功率。本发明的在对等网络中查找资源的方法包括：使用Q-学习方法计算对等网络中各节点的Q值；在对等网络中，判断发起资源查找的当前节点是否有邻居节点包含所述资源；若是，则向包含所述资源的邻居节点中的Q值最大的节点发送资源查找消息；否则将资源查找消息发送给该当前节点的所有邻居节点中Q值最大的节点然后由该Q值最大的节点发起资源查找。
【IPC分类】H04L29-08, H04L12-801
【公开号】CN104780113
【申请号】CN201510213928
【发明人】崔凯
【申请人】北京智芯原动科技有限公司
【公开日】2015年7月15日
【申请日】2015年4月29日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔凯;
技术所有人：北京智芯原动科技有限公司;
我是此专利的发明人

上一篇：基于蝶形网络编码的无线多核阵列热点消除方法及架构的制作方法
上一篇：基于pon带显示的无线路由器的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。