一种基于主成分分析的钢号查询对照系统的制作方法与工艺

文档序号:12008513阅读:338来源:国知局
一种基于主成分分析的钢号查询对照系统的制作方法与工艺
本发明属于在线数据库技术领域,特别是提供了一种基于主成分分析算法的钢号查询对照系统,查询对照结果以相似度定量给出,实现了匹配钢号快速精准的定位。

背景技术:
钢铁材料的合理选择和使用对产品和工程的质量都有至关重要的影响。但材料的选择往往由于客户经验不足、方法不对,在面对海量材料数据时,虽耗费大量时间精力,却还是没有选择到合适的材料。下游行业长期面临着以下几种共性的问题,阻碍了钢铁材料的有效选取和高效使用:1、由于材料的选择往往是在产品和工程的设计或改造阶段,客户缺乏钢铁材料选择经验,无法定位所需材料的范围,例如:钢种,性能等。2、即便是拥有以前使用相关材料的经验,客户也可能会受到思维定势的影响或缺乏新材料知识,从而忽略了一些更能满足产品要求的材料。3、对备选材料知之甚少,不清楚其特性及可能的替代品。4、对以后产品使用情况和工程运行情况的了解不够全面,不明确所需材料的性能和产品之间的相互影响,从而综合所有运行因素,选择合适的钢品5、利用钢种手册的人工查阅方法会耗费大量的时间和人力,而且很容易产生遗漏。6、目前尚没有广泛应用的权威在线钢铁标准数据库,一些在线数据库中的数据不完善可靠,而且查询方法单一,不能适应客户多角度查询需求。7、根据产品和工程的要求去查找相应材料,往往会出现查询条件疏松,以至于满足条件的钢铁材料可能会有多个,客户没有有效的方法迅速直接的筛选出最优的备选材料。

技术实现要素:
本发明的目的在于提供一种基于主成分分析算法的钢号查询对照系统,系统包含了国际标准化组织(ISO)及九个国家、一个地区的钢铁材料规格和标准技术数据,查询对照结果以相似度的形式定量给出。更好的针对客户的个性化需求提供服务,帮客户准确定位需要的材料,本发明建立了在线钢铁材料标准库,标准库中包含了国际标准化组织(ISO)及九个国家、一个地区的钢铁材料规格和标准技术数据,以及经过性能测试和实际应用得到行业认可的钢号对照关系表。系统利用主成分分析算法计算钢组中关键化学元素权重值,基于权重再计算钢号相似度。克服了权重值设定受到专家经验的局限和人为主观因素的影响,同时在匹配过程中考虑指标取值的区间特性,保证了匹配结果的准确性和有效性。本发明硬件系统包括关系数据库服务器,Web服务器,客户机。Web服务器和关系数据库服务器相连,客户机和Web服务器相连。应用模块包含关系数据库、数据录入模块、钢号查询模块、钢号对照模块。其中关系数据库部署在关系数据库服务器,数据录入模块、钢号查询模块、钢号对照模块部署在Web服务器上。用户通过客户机上的Web浏览器向服务器发出Web请求,Web服务器寻找页面并将文档传送给客户机Web浏览器上。关系数据库是数据录入模块与钢号查询模块、钢号对照模块之间的数据通讯媒介。系统维护人员通过钢号录入模块将国内外标准钢种数据及现有钢号对照关系录入到关系数据库中,钢号查询模块、钢号对照模块再从关系数据库中读出数据并进行分析计算后将结果予以显示。关系数据库:该关系数据库为多国钢号标准库,存储了国际标准化组织(ISO)及九个国家、一个地区的钢铁材料规格和标准技术数据,以及经过性能测试和实际应用得到行业认可的钢号对照关系表。标准数据以钢组作为数据组织的方式,建立分层模型。模型的层数以及在某一层上的分组数均无限制,确保所有钢号都唯一的分配到某一钢组。数据录入模块:数据接口部分,为钢号查询模块、钢号对照模块提供数据输入功能。关系数据库中的钢号数据通过该模块录入,可直接录入钢号数据,也可读取数据文件中的钢号数据导入钢号数据。钢号查询模块:钢号查询模块分三种查询方式:1、通过钢号进行查询:系统将检索出包含用户所录关键字的钢号,并将钢号、所述钢组、标准号、国家或地区信息按照表格形式显示,用户可点击钢号对该钢号的化学成分、力学性能能详细数据进行查看;2、通过标准号、钢组或一般用途查询:系统将检索出包含用户所录关键字的标准号,并将标准号、国家或地区、体系、钢组、一般用途按照表格形式显示,用户可点击标准号查看该标准号下的所有钢号;3、通过化学成分查询:钢铁材料标准中,某一钢号的化学成分是指组成它的各种元素的百分含量,一般而言,同一钢组所包含的化学元素的种类基本相同,这些元素以及它们的组合影响着这一钢组的性能。用户录入所关心的各化学成分指标的最小值、最大值,相似度阈值并选择目标钢组,系统自动调用主成分分析算法计算所选钢组关键化学成分指标的权重值,用户可根据专家知识对权重值进行调整,同时计算用户录入化学成分指标和标准钢号化学成分指标之间的区间重叠度,区间重叠度定义为匹配双方相同指标交集与对照钢号指标范围的比值,重叠度数值在0~1之间。然后各个指标的区间重叠度加权求和得到钢种的相似度,公式如下:式中,si和wi分别为第i个指标的区间重叠度和权重。对于相似度超过阈值的钢号,系统自动按照相似度由高到低的顺序排序后展现给用户。利用主成分分析算法计算权重的核心思想为:主成分分析算法对特定钢组中所有钢号的关键化学成分做分析运算,降维后寻找能代表原数据信息的新特征,再通过计算新特征与原变量之间的相关系数,得到主成分对原始变量的贡献率,作为各关键化学成分的权重系数,来表征其在特定钢种中的重要性。本发明在数据库分层模型的基础上,以钢组为基本单位,计算每个钢组内钢铁材料中各种化学成分对性能的影响程度,用量化的权重数值表示,具体步骤如下:1、根据权重计算类中的主要化学元素,建立随机向量X=[X1,X2,…,Xp],表示此钢类包含p种化学成分。2、若特定钢组中包含n个钢号,则从中取m(m>n)个钢材的成分观测值xi=[x1i,x2i,…,xpi]T,i=1,2,…,m,得到样本数据。由于钢号的化学成分取值大部分在一定的范围内,对于化学成分只有最大值或只有最小值的不完整数据区间要通过模糊逻辑、统计方法及钢组分层模型等方法补全区间值。考虑到制造过程中的随机因素,可以认为成分服从正态分布,且受到范围上下限的限制。为了消除不同成分之间绝对误差对计算结果的影响,将数据归一化到均值为零、单位方差,式中,3、计算归一化数据的相关性矩阵,并求出其特征值和特征向量,计算得到主成分。并根据贡献度,选取前k个主成分向量如果前k个主成分的贡献度在80~90%之上,则表明这些主成分涵盖了大部分原空间的信息,而残余主成分构成的空间中主要为原数据中的噪音,可以被忽略掉。4、在降维后的主成分空间中,k个主成分Y1,Y2,…Yk从原始变量X1,X2,…,Xp中提取的信息量,可度量为Xi与Y1,Y2,…Yk的相关系数的平方,称为k个主成分Y1,Y2,…Yk对原始变量Xi的贡献率,其值为:k个主成分Y1,Y2,…Yk对原始变量Xi的贡献率,可以理解为Xi变量表征原数据特征的程度。贡献率越大,表明该变量含有越多的钢号数据特征,对钢铁材料的影响大,所以它的相似度所占材料相似度计算中比重亦大。因此用贡献率作为化学成分变量的权重值,度量其对钢类数据性能影响的重要性。钢号对照模块:包含两部分:1、对照关系查询:该功能主要针对已得到行业认可的钢号对照关系,这些对照关系大都来自于实际性能测试和应用经验,由系统维护人员录入;2、对照关系计算:该部分旨在建立同一钢组内钢号之间的匹配关系。主要步骤为:步骤一:在计算钢组中选择某一钢号作为对照钢号,并预先设定相似度阈值;步骤二:利用主成分分析算法计算所选钢组关键化学元素权重值,并根据专家知识对权重值进行调整;步骤三:依次选取钢组中其他钢号计算该钢号与对照钢号的相似度;步骤四:选取相似度大于阈值的钢号并按照相似度由高到低的顺序排序建立对照关系。本发明的优点在于:(1)填补了国内通用在线钢铁标准查询服务的空白,更好的辅助钢铁上游企业和下游用户信息传输,为下游用户提供准确可靠的用材查询推荐服务。(2)对数据库中的所有钢材数据,不仅按照国家、标准、用途的方式进行组织,为了满足客户的查询对照需求,根据其化学成分、力学性能及用途,以钢组作为数据组织的方式,建立分层模型,其宽度和深度没有限制,且每个钢号都唯一的分配到某一钢组。(3)将近似材料对照信息和材料相似性信息整合,输入到数据库中,同时提供友好的用户界面供用户查询。这些材料对照关系大都来自实际的性能测试和使用经验,是不可多得的宝贵资源。(4)指标权重值计算采用主成分分析算法,以数据驱动的方式提取出指标权重,同时用户可根据专家知识对权重值进行适当调整。避免了元素权重设定受专家经验的局限和人为主观因素的影响,无法完全反映钢铁材料本身特性。(5)计算过程中考虑到指标取值的区间特性,对只有最大值或只有最小值的不完整数据区间要通过模糊逻辑、统计方法及钢组分层模型等方法补全区间值。从而使计算权重的样本数据更合理有效,计算出来的权重更精确。附图说明图1为本发明系统各模块之间的关系图。图2为钢组分层结构图。图3为钢号查询对照流程图。图4为主成分分析法计算化学成分权重过程。具体实施方式本发明硬件系统包括关系数据库服务器,Web服务器,客户机。Web服务器和关系数据库服务器相连,客户机和Web服务器相连。应用模块包含关系数据库、数据录入模块、钢号查询模块、钢号对照模块。其中关系数据库部署在关系数据库服务器,数据录入模块、钢号查询模块、钢号对照模块部署在Web服务器,用户通过客户机上的Web浏览器向服务器发出Web请求,Web服务器寻找页面并将文档传送给客户机上的Web浏览器。图1~图4为本发明的一种具体实施方式。图1为本发明系统各模块之间的关系图。本发明系统包含关系数据库、数据录入模块、钢号查询模块、钢号对照模块。其中关系数据库部署在关系数据库服务器,数据录入模块、钢号查询模块、钢号对照模块部署在Web服务器上。用户通过客户机上的Web浏览器向服务器发出Web请求,Web服务器寻找页面并将文档传送给客户机Web浏览器上。关系数据库是数据录入模块与钢号查询模块、钢号对照模块之间的数据通讯媒介。系统维护人员通过钢号录入模块将国内外标准钢种数据及现有钢号对照关系录入到关系数据库中,钢号查询模块、钢号对照模块再从关系数据库中读出数据并进行分析计算后将结果予以显示。图2是钢组分层结构图。在关系数据库中建立了多国钢号标准库,多国钢号标准库中的钢号不仅按照国家、标准、用途的方式进行组织,为了满足客户的查询对照需求,根据其化学成分、力学性能及用途,以钢组作为数据组织的方式,建立分层模型,其宽度和深度没有限制,且每个钢号都唯一的分配到某一钢组。每个钢组的化学成分、力学性能及用途都很相似,因此每个钢组的所有钢号都共有一套关键化学元素和权重值。在进行查询对照时,用户可以将分析材料与不同钢组或子钢组的钢号进行对比分析,计算其相似度,从而对计算结果进行评估,找出最佳匹配材料。图3为钢号查询对照流程图。钢号查询是已知各化学成分的范围,查找与之相似度较高的钢号,钢号对照是指指定对照钢号(为标准刚好),查找与之相似度较高的标准钢号,查找范围为指定钢组,用户可以从多个钢组中寻找与之相似度较高的钢号。具体实施步骤为:(1)指定化学成分或对照钢号;(2)设定相似度阈值,阈值范围为0~1;(3)选择钢组,选择钢组时尽可能利用更多的专家知识选择化学成分接近的钢组,而不是盲目选择,导致相似度很小,离预期目标的偏差较大;(3)利用主成分算法计算权重,权重计算出来后,用户可结合实际经验和专家知识对权重进行微调;(4)计算与已选钢组内各钢号的相似度;(5)保存相似度大于阈值的钢号及相似度。若用户还想再选择其它钢组进行查询对照,则重复(3)~(5)步骤,否则提取出保存好的钢号及相似度并排序展现给用户。图4为主成分分析法计算化学成分权重过程。具体步骤为:(1)要确定要计算权重的钢组及该钢组的关键化学成分,对于那些残余元素及非关键化学元素可不列入计算范围中;(2)产生样本,考虑到制造过程中的随机因素,可以假定成样本分服从正态分布,且受到范围上下限的限制,因此对于化学成分只有最大值或只有最小值的不完整数据区间要通过模糊逻辑、统计方法及钢组分层模型等方法补全区间值,区间值的补全对于后续计算区间重叠度也有重要作用,样本数为n*m(n为钢号个数,m为每个钢号产生样本数,m>n);(3)对样本数据进行归一化。使样本均值为0,方差为1;(4)利用归一化后的样本数据计算相关矩阵、特征值、特征向量;(5)选取主成分,如果前k个主成分的贡献度在80~90%之上,则表明这些主成分涵盖了大部分原空间的信息,而残余主成分构成的空间中主要为原数据中的噪音,可以被忽略掉。(6)计算权重,通过相关矩阵、特征值、特征向量能够计算出主成分对化学成分变量的贡献率,该贡献率即为化学成分权重值。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1