一种服务器设备机内测试bit设计方法

文档序号:9579163阅读:2378来源:国知局
一种服务器设备机内测试bit设计方法
【技术领域】
[0001]本发明涉及加固服务器及测试技术领域,具体涉及一种服务器设备机内测试BIT设计方法,设计了一种服务器的机内测试设计方法,大大提高了设备的可靠性和可测试性。
【背景技术】
[0002]在服务器应用领域,高可靠性要求机载设备、舰载设备、车载设备,如卫星、飞船及海军舰艇,不允许出现故障。为了确保设备和系统的可靠性,一般都要求设备具有较高的故障诊断能力,并能将故障隔离到各单元(LRU);且能够进行充分测试,通过测试覆盖设备电路系统所有可能发生的故障来确保设备的可靠性和安全性。
[0003]为了实现上述技术要求,必须将服务器从系统结构、功能两方面对测试性设计进行层次划分和设计,从设计之初就全面考虑测试性能的需求,通过芯片级BIT、模块级BIT和系统级BIT的层次化检测和故障隔离,提高设备的可靠性。
[0004]机内测试BIT (Built-1n Test)是一种能显著提高系统测试性和诊断能力的重要技术,是实现可测试性设计的重要技术手段之一。介绍了机内测试技术的定义、特点、分类、设计内容以及设计流程等,详细阐述了机内测试技术的发展历程,并对测试性技术的新趋势进行了探讨和展望。
[0005]BIT是指系统和设备内部提供的检测、隔离故障的自动测试能力,是指系统主装备不用外部测试设备就能完成对系统、分系统或设备的功能检查、故障诊断与隔离以及性能测试,它是联机检测技术的新发展。

【发明内容】

[0006]本发明要解决的技术问题是:提供一种磁吸式小门,能够满足电磁兼容要求,同时结构简单可靠,加工成本低,安装也较为方便。
[0007]加固计算机小门通常在小门关闭后,要求能对起到密封和电磁屏蔽的屏蔽材料保持一定的压紧力,该压紧力使密封材料发生弹性变形,从而填充接触面间隙,起到密封(防水)和导电连续(电磁兼容)的作用。
[0008]本发明所采用的技术方案为:
一种服务器设备机内测试BIT设计方法,所述服务器在系统结构上按照整机及单元划分为两个层次:模块级现场可更换单元LRU和芯片级功能电路,每个功能单元可独立进行测试;服务器各功能单元之间主要通过网络电缆进行连接,可通过管理单元对各单元的电压、温度及其工作状态进行监控和管理;
所述方法按框架结构分为三级:分布式测试及采集处理、信息状态集中处理、显示及操作,实现过程如下:
第一级、分布式测试及采集处理:通过自测试及采集电路,直接嵌入各单元(LRU)中实现;
第二级、信息状态集中处理,通过整机的采集处理电路,管理单元通过管理总线(网络、串口等方式)实时采集自测试及采集处理电路所测得的温度、电压、关键电路测试点特征信号等状态信息;
第三级、显示及操作:整机的信息状态通过嵌装在管理单元上的显控终端进行显示和处理;并且可通过管理网络对外发布整机的状态。
[0009]所述第一级分布式测试及采集处理过程,自测试及采集电路,直接嵌入各单元(LRU),机内测试BIT电路通过IPMB读取各功能电路传感器信息,通过芯片JTAG 口进行TDI输入并将TD0与写入寄存器的标准值比较,判断芯片是否正常,提供故障报警、故障诊断和故障处理功能,从而提高单元可靠性;
其中:IPMB Intelligent Platform Management BUS,智能平台管理总线,是ATCA (Advanced Telecom Computing Architecture)先进的电信计算平台的各 FRU 背板通讯的两组冗余I2C总线的总称;
具有JTAG 口的芯片都有如下JTAG引脚定义:
TCK——测试时钟输入;
TDI—一测试数据输入,数据通过TDI输入JTAG 口 ;
TD0一一测试数据输出,数据通过TD0从JTAG 口输出;
TMS一一测试模式选择,TMS用来设置JTAG 口处于某种特定的测试模式。
[0010]所述方法测试过程在系统中采用连续监控、连续检测的机制。某些故障可能不影响系统工作,有时会自动消失,而有的故障虽然不会损坏设备,但如果不及时停止,系统会无法正常工作,因此需要立刻采取措施,否则故障将损坏设备。
[0011]所述方法在实现故障检测功能时,为每个检测模块设计一个故障计数器,计数器值初始化为0,当功能模块检测到一次故障时,故障计数器加1。进入下一检测周期,若故障消失,则故障计数器减1,当计数达到阈值,进行故障报警,从而达到减小虚警率的效果。
[0012]本发明的有益效果为:
本发明具有较高的故障诊断能力,并能将故障隔离到各单元(LRU);且能够进行充分测试,通过测试覆盖设备电路系统所有可能发生的故障来确保设备的可靠性和安全性,大大提高了设备的可靠性和可测试性。
【附图说明】
[0013]图1为服务器系统结构组成示意图;
图2为计算单元BIT电路图;
图3为整机机内测试BIT电路图;
图4为BIT流程框图。
【具体实施方式】
[0014]下面参照附图所示,通过【具体实施方式】对本发明进一步说明:
实施例1:
一种服务器设备机内测试BIT设计方法,所述服务器在系统结构上按照整机及单元划分为两个层次:模块级现场可更换单元LRU和芯片级功能电路,如图1所示,其中第二层为服务器的现场可更换单元(LRU),每个功能单元可独立进行测试;服务器各功能单元之间主要通过网络电缆进行连接,可通过管理单元对各单元的电压、温度及其工作状态进行监控和管理;
如图3所示,所述方法按框架结构分为三级:分布式测试及采集处理、信息状态集中处理、显示及操作,实现过程如下:
第一级、分布式测试及采集处理:通过自测试及采集电路,直接嵌入各单元(LRU)中实现;
第二级、信息状态集中处理,通过整机的采集处理电路,管理单元通过管理总线(网络、串口等方式)实时采集自测试及采集处理电路所测得的温度、电压、关键电路测试点特征信号等状态信息;
第三级、显示及操作:整机的信息状态通过嵌装在管理单元上的显控终端进行显示和处理;并且可通过管理网络对外发布整机的状态。
[0015]实施例2:
在实施例1的基础上,本实施例所述第一级分布式测试及采集处理过程,自测试及采集电路,直接嵌入各单元(LRU),以计算单元为例,机内测试BIT电路如图2所示,机内测试BIT电路通过IPMB读取各功能电路传感器信息,通过芯片JTAG 口进行TDI输入并将TD0与写入寄存器的标准值比较,判断芯片是否正常,提供故障报警、故障诊断和故障处理功能,从而提高单元可靠性。
[0016]其中:IPMBIntelligent Platform Management BUS,智能平台管理总线,是ATCA (Advanced Telecom Computing Architecture)先进的电信计算平台的各 FRU 背板通讯的两组冗余I2C总线的总称;
具有JTAG 口的芯片都有如下JTAG引脚定义:
TCK——测试时钟输入;
TDI—一测试数据输入,数据通过TDI输入JTAG 口 ;
TD0一一测试数据输出,数据通过TD0从JTAG 口输出;
TMS一一测试模式选择,TMS用来设置JTAG 口处于某种特定的测试模式。
[0017]实施例3:
在实施例1或2的基础上,本实施例所述方法测试过程在系统中采用连续监控、连续检测的机制。某些故障可能不影响系统工作,有时会自动消失,而有的故障虽然不会损坏设备,但如果不及时停止,系统会无法正常工作,因此需要立刻采取措施,否则故障将损坏设备。
[0018]实施例4:
在实施例3的基础上,本实施例所述方法在实现故障检测功能时,为每个检测模块设计一个故障计数器,计数器值初始化为0,当功能模块检测到一次故障时,故障计数器加1。进入下一检测周期,若故障消失,则故障计数器减1,当计数达到阈值,进行故障报警,从而达到减小虚警率的效果。
[0019]BIT测试流程图如图4所示。
[0020]以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
【主权项】
1.一种服务器设备机内测试BIT设计方法,其特征在于:所述服务器在系统结构上按照整机及单元划分为两个层次:模块级现场可更换单元LRU和芯片级功能电路,每个功能单元可独立进行测试;服务器各功能单元之间主要通过网络电缆进行连接,可通过管理单元对各单元的电压、温度及其工作状态进行监控和管理; 所述方法按框架结构分为三级:分布式测试及采集处理、信息状态集中处理、显示及操作,实现过程如下: 第一级、分布式测试及采集处理:通过自测试及采集电路,直接嵌入各单元LRU中实现; 第二级、信息状态集中处理,通过整机的采集处理电路,管理单元通过管理总线实时采集自测试及采集处理电路所测得的状态信息; 第三级、显示及操作:整机的信息状态通过嵌装在管理单元上的显控终端进行显示和处理;并且可通过管理网络对外发布整机的状态。2.根据权利要求1所述的一种服务器设备机内测试BIT设计方法,其特征在于:所述第一级分布式测试及采集处理过程,机内测试BIT电路通过IPMB读取各功能电路传感器信息,通过芯片JTAG 口进行TDI输入并将TDO与写入寄存器的标准值比较,判断芯片是否正常,提供故障报警、故障诊断和故障处理功能。3.根据权利要求1或2所述的一种服务器设备机内测试BIT设计方法,其特征在于:所述方法测试过程在系统中采用连续监控、连续检测的机制。4.根据权利要求3所述的一种服务器设备机内测试BIT设计方法,其特征在于:所述方法在实现故障检测功能时,为每个检测模块设计一个故障计数器,计数器值初始化为0,当功能模块检测到一次故障时,故障计数器加1 ;进入下一检测周期,若故障消失,则故障计数器减1,当计数达到阈值,进行故障报警。
【专利摘要】本发明公开了一种服务器设备机内测试BIT设计方法,所述服务器在系统结构上按照整机及单元划分为两个层次:模块级现场可更换单元LRU和芯片级功能电路,每个功能单元可独立进行测试;服务器各功能单元之间主要通过网络电缆进行连接,可通过管理单元对各单元的电压、温度及其工作状态进行监控和管理;所述方法按框架结构分为三级:分布式测试及采集处理、信息状态集中处理、显示及操作。本发明具有较高的故障诊断能力,并能将故障隔离到各单元(LRU);且能够进行充分测试,通过测试覆盖设备电路系统所有可能发生的故障来确保设备的可靠性和安全性,大大提高了设备的可靠性和可测试性。
【IPC分类】G06F11/22
【公开号】CN105335261
【申请号】CN201510894886
【发明人】陈乃阔, 姜微微, 耿士华
【申请人】山东超越数控电子有限公司
【公开日】2016年2月17日
【申请日】2015年12月8日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1