一种基于HCA卡的误码率测试装置及方法与流程

文档序号:11388731阅读:734来源:国知局
本发明涉及服务器测试领域,具体地说是一种基于hca卡的误码率测试装置及方法。
背景技术
::hca卡是一种infiniband主机通道适配器整个测试是依据ieee802.3标准,结合infiniband误码率定义,在hca卡通信过程中利用测试软件生成bit的误码率(即在一段时间内,传输错误的比特占所有传输比特总数的比率)测试数据,通过误码率测试数据与测试标准对比,来评测hca卡的通信质量。目前,hca卡广泛应用于企业数据中心、高性能计算和嵌入式环境等领域,为服务器/存储的集群应用提供了高带宽、低延迟的解决方案。在集群数据库、并行应用、处理服务和高性能嵌入式i/o等应用中,hca卡可使其性能实现最大程度的提高,此时hca的通信传输质量就显得格外重要,误码率是衡量数据在规定时间内数据传输精确性的指标,如果数据传输过程中误码率较高则将包含该误码的包丢掉而不传给接收终端,那么接收终端接收到的数据就只会出现整个包丢失的情况而不会出现一个包中某个比特出错的情况,所以这个时候接收终端感受到的就是丢包、无法通信以及性能下降;如何能够消除hca卡误码率对通信传输质量的影响是目前急需解决的技术问题。技术实现要素:本发明的技术任务是提供一种基于hca卡的误码率测试装置及方法,来解决如何能够消除hca卡误码率对通信传输质量的影响的问题。本发明的技术任务是按以下方式实现的,一种基于hca卡的误码率测试装置,包括两台服务器和至少两张hca卡,其中一台服务器作为client端,另一台作为server端,client端和server端上分别安装hca卡,hca卡通过fabric线缆连接到client端和server端。作为优选,所述hca卡采用qdrhca卡或fdrhca卡。一种基于hca卡的误码率测试方法,该方法包括如下步骤:(1)、将hca卡分别安装到server端和client端并在server端和client端安装linux操作系统;(2)、清除cmos,启动两台server端和client端,确保hca卡在bios下被识别;(3)、在server端和client端安装rhel6.7os以及hca卡驱动;(4)、配置hca卡测试软件,确认server端和client端可以互相ping通;(5)、重启server端和client端,进入bios下,禁用speedstepping、c3andc6states、turboboot以及hyper-threading;(6)、测试前使用mstdump–full/dev/mst/mt4099_pciconfx命令检查server端和client端的hca卡的状态:(7)、执行整个光纤网络诊断检查;(a)、运行#ibdiagnet;(b)、进入/usr/tmp/ibdiagnet/ibdiagnet2.pm.检查hca卡端口是否存在错误;(8)、在server端和client端执行各种大小的双向数据包(1028,2048,4096,512and8192)传输;(9)、在步骤(8)数据传输过程中,在server端和client端linux操作系统执行命令(a)和命令(b),并查看测试结果:命令(a)、#perfquery–a(产看所有端口运行信息);命令(b)、#perfquery–e(查看发送和接收错误);(10)、对于qdrhca卡运行42小时测试或者fdrhca卡运行25小时测试后,查看测试结果,并判断测试结果是否符合测试标准:①、若符合测试标准,则测试结果为pass;②、若不符合测试标准,则测试结果为fail。作为优选,所述步骤(3)中hca卡采用qdrhca卡。更优地,所述qdrhca卡安装驱动包括如下步骤:(a)、将驱动mlnx_ofed_linux-2.0-3.0.0-rhel6.2-x86_64.iso拷贝到rhel系统下;(b)、挂载驱动镜像mount-olooplnx_ofed_linux-2.0-3.0.0-rhel6.2-x86_64.iso/mnt;(c)、到/mnt目录下运行#./mlnxofedinstall安装驱动,看到installationfinishedsuccessfully即安装成功,重启服务器;作为优选,所述步骤(4)中配置hca卡测试软件包括如下步骤:(a)、待测server端关闭防火墙并设置静态ip地址假设机器的地址为:192.168.3.1;(b)、在client端,参考待测server端的ip设置方法,设置client端ip,关闭防火墙、设置静态ip地址、启动ib服务以及测试连通性;假设机器的地址为:192.168.3.2;(c)、系统启动后,启动ib服务,此时查看hca卡的指示灯,提示两种颜色的指示灯;(d)、测试连通性:ping192.168.3.2;(e)、在client端和server端配置数据包双向传输测试环境;(f)、配置client端和server端环境变量;(g)、重启系统,检查mpirun路径是否正确;本发明的基于hca卡的误码率测试装置及方法具有以下优点:本发明通过hca卡误码率测试,有效的评测hca卡与服务器搭配在数据传输过程中数据传输和接收质量,提前检验和规避客户应用丢包/无法通信/性能下降问题,消除hca卡误码率对通信传输质量的影响,提高hca卡应用质量和性能,为客户对高带宽、低延迟的解决方案提供了有力的后端保障,提高客户满意度和产品竞争力。附图说明下面结合附图对本发明进一步说明。附图1为基于hca卡的误码率测试装置的结构框图。图中:1、client端,2、server端,3、hca卡,4、fabric线缆。具体实施方式参照说明书附图和具体实施例对本发明的基于hca卡的误码率测试装置及方法作以下详细地说明。实施例1:如附图1所示,本发明的基于hca卡的误码率测试装置,包括两台服务器和至少两张hca卡,其中一台服务器作为client端1,另一台作为server端2,client端1和server端2上分别安装hca卡3,hca卡3通过fabric线缆4连接到client端1和server端2。hca卡3采用qdrhca卡。实施例2:采用实施例1的误码率测试装置的测试方法,该方法包括如下步骤:(1)、将hca卡分别安装到server端和client端并在server端和client端安装linux操作系统;(2)、清除cmos,启动两台server端和client端,确保hca卡在bios下被识别;(3)、在server端和client端安装rhel6.7os以及hca卡驱动;以qdrhca卡为例,qdrhca卡安装驱动包括如下步骤:(a)、将驱动mlnx_ofed_linux-2.0-3.0.0-rhel6.2-x86_64.iso拷贝到rhel系统下;(b)、挂载驱动镜像mount-olooplnx_ofed_linux-2.0-3.0.0-rhel6.2-x86_64.iso/mnt;(c)、到/mnt目录下运行#./mlnxofedinstall安装驱动,看到installationfinishedsuccessfully即安装成功,重启服务器;(4)、配置hca卡测试软件,确认server端和client端可以互相ping通;配置hca卡测试软件包括如下步骤:(a)、待测server端关闭防火墙并设置静态ip地址假设机器的地址为:192.168.3.1;①、关闭防火墙:iptables–f;②、设置静态ip地址:vi/etc/sysconfig/network-script/ifcfg-ib0device=ib0bootproto=staticipaddr=192.168.3.1netmask=255.255.255.0onboot=yes按esc键,输入“:wq"回车保存退出;(b)、在client端,参考待测server端的ip设置方法,设置client端ip,关闭防火墙、设置静态ip地址、启动ib服务以及测试连通性;假设机器的地址为:192.168.3.2;(c)、系统启动后,启动ib服务,此时查看hca卡的指示灯,提示两种颜色的指示灯;serviceopensmdstartchkconfigopensmdon;(d)、测试连通性:ping192.168.3.2;(e)、在client端和server端配置数据包双向传输测试环境;vi/etc/sysconfig/networkclient端修改hostname=clientserver端修改hostname=servertouch/root/.mpd.confchmod600/root/.mpd.confecho"mpd_secretword=mr45-j9z">>/root/.mpd.conftouch/etc/mpd.confchmod600/etc/mpd.confecho"mpd_secretword=111111">>/etc/mpd.confvi/etc/hosts新增下面两行内容192.168.3.2client192.168.3.1servervi/root/.mpd.hosts新增下面两行内容clientserver保存退出;(f)、配置client端和server端环境变量;find/-namempirunvi/root/.bashrc在最后新增下面一行内容path=/usr/mpi/gcc/mvapich2-1.9/bin:$path;(g)、重启系统,检查mpirun路径是否正确;执行:whichmpirun;结果:/usr/mpi/gcc/mvapich2-1.9/bin/mpirun;(5)、重启server端和client端,进入bios下,禁用speedstepping、c3andc6states、turboboot以及hyper-threading;(6)、测试前使用mstdump–full/dev/mst/mt4099_pciconfx命令检查server端和client端的hca卡的状态:(7)、执行整个光纤网络诊断检查;(a)、运行#ibdiagnet;(b)、进入/usr/tmp/ibdiagnet/ibdiagnet2.pm.检查hca卡端口是否存在错误;(8)、在server端和client端执行各种大小的双向数据包(1028,2048,4096,512and8192)传输;以当前被测机台ip地址为192.168.3.1,client端ip地址为192.168.3.2为例(a)、#ib_read_bw–b–s4096–n10000000{在被测机台上运行};(b)、#ib_read_bw–a–s4096–n10000000192.168.3.1;(c)、#ib_read_bw–b–s2048–n10000000{在client上运行};(d)、#ib_read_bw–b–s2048–n10000000192.168.56.2;(9)、在步骤(8)数据传输过程中,在server端和client端linux操作系统执行命令(a)和命令(b),并查看测试结果:命令(a)、#perfquery–a(产看所有端口运行信息);命令(b)、#perfquery–e(查看发送和接收错误);(10)、对于qdrhca卡运行42小时测试或者fdrhca卡运行25小时测试后,查看测试结果,并判断测试结果是否符合测试标准:①、若符合测试标准,则测试结果为pass;②、若不符合测试标准,则测试结果为fail。测试标准如下表所示:hcatypeminimumtimesymbolerrorsberbpsqdr42hrs≤1≤1e-1532gb/sfdr25hrs≤1≤1e-1554gb/s表中:hcatype:hca卡类型(当前常用的分为两种,qdr,fdr);minimumtime:最小运行时间;symbolerrors:符号错误;ber:二进制误码率;bps:数据传输率bitperseconds。通过上面具体实施方式,所述
技术领域
:的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的2种具体实施方式。在公开的实施方式的基础上,所述
技术领域
:的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。除说明书所述的技术特征外,均为本专业技术人员的已知技术。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1