一种基于TF-IDF思想计算产品结构相似性的方法与流程

文档序号:16680255发布日期:2019-01-19 00:21阅读:387来源:国知局
一种基于TF-IDF思想计算产品结构相似性的方法与流程

本发明涉及制造业信息化技术领域,具体是一种基于tf-idf思想计算产品结构相似性的方法。



背景技术:

目前,在制造企业中,在进行产品相似性的比较时,通常采用两者都采用了相同的参数化零件,才能进行比较,最主要的原因是因为该方法可以是两个产品之间的所有维度只有数值上的变化,从而进行相应的比较;再有就是比较两组具有相同零件数量的产品,这样可以保证在维度相同的情况下,利用向量特点来比较零件之间的不同,从而得出两个产品之间的相似性。

但是,目前这些比较产品之间相似性的内容都有很大的局限性,并不能比较任意两个产品间的相似性。



技术实现要素:

本发明的目的在于提供一种基于tf-idf思想计算产品结构相似性的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种基于tf-idf思想计算产品结构相似性的方法,包含以下步骤:

a、对于所有产品中的零件信息进行聚合处理;

b、创建零件字典;

c、计算产品的pf-ipf值;

d、利用相关算法计算产品间的相似性;

e、计算产品间的相似性。

作为本发明的进一步技术方案:所述步骤a具体是:获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件。

作为本发明的进一步技术方案:所述步骤b具体是:根据步骤a中进行聚合处理后的零部件,将其归入零部件字典库。

作为本发明的进一步技术方案:所述步骤c具体是:获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率pf;根据某零件在整个样本集中出现的次数计算其权重,即ipf,其计算公式为,其中p为当前样本集中所有的产品数量;pw为出现该零件的产品的数量,利用计算得到pf值和ipf值,通过计算每个零件的pf值以及ipf值计算出该产品中每一个零件的pf-ipf值,从而将产品结构转化为一个具有n维向量的结果。

作为本发明的进一步技术方案:所述步骤d具体是:通过步骤c得到的不同产品的数值化处理结果后,选择合适的相似性算法;当前方式主要适用以向量形式或多维特征进行相似性比较的算法。

作为本发明的进一步技术方案:所述步骤e具体是:对需要进行相似性比较的产品,利用步骤c得到的pf-ipf将产品结构进行数值化处理后,再通过步骤d中确定的相关算法,进行产品间相似性算法的计算。

与现有技术相比,本发明的有益效果是:本发明利用对产品数值化的处理方式,再结合相关的相似性算法,使得任何形式的产品都可以进行相似性的比较。从而可以极大地快速提升在制造业企业中关于夹具、装配工艺及仿真的重用度。

附图说明

图1为基于pf-ipf的余弦定理计算产品的相似性数据关系图。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,一种基于tf-idf思想计算产品结构相似性的方法,包含以下步骤:

a、对于所有产品中的零件信息进行聚合处理。获取当前产品所在的所有样本集,将样本集中所有产品中的零件进行聚合处理,以去除重复的零件;

b、创建零件字典。根据步骤a中,进行聚合处理后的零部件,将其归入零部件字典库(如表1所示);

c、计算产品的pf-ipf值。获取零件在某产品结构中出现的次数,以及该零件所在产品中所有零件的总数量,利用其计算零件在产品中的零件频率pf;根据某零件在整个样本集中出现的次数计算其权重,即ipf,其计算公式为,其中p为当前样本集中所有的产品数量;pw为出现该零件的产品的数量,利用计算得到pf值和ipf值,通过计算每个零件的pf值以及ipf值计算出该产品中每一个零件的pf-ipf值,从而将产品结构转化为一个具有n维向量的结果;

d、选取合适的相似性算法。通过步骤c得到的不同产品的数值化处理结果后,选择合适的相似性算法;当前方式主要适用以向量形式(或者多维特征)进行相似性比较的算法,如欧式距离、余弦定理、皮尔逊相关性、斯皮尔曼等级相关系数,根据问题的具体形式可以选择不同的相似性算法;

e、计算产品间的相似性。对需要进行相似性比较的产品,利用步骤c得到的pf-ipf将产品结构进行数值化处理后,再通过步骤d中确定的相似性算法,从而得到所需产品间的相似性(如图1所示,以余弦定理计算两个产品间的相似性)。

表1为零件字典表:

表2为某产品的pf-ipf值数据表:

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。



技术特征:

技术总结
本发明公开了一种基于TF‑IDF思想计算产品结构相似性的方法,包含以下步骤:A、对于所有产品中的零件信息进行聚合处理;B、创建零件字典;C、计算产品的PF‑IPF值;D、选取合适的相似性算法;E、计算产品间的相似性。本发明利用对产品数值化的处理方式,再结合相关的相似性算法,使得任何形式的产品都可以进行相似性的比较。从而可以极大地快速提升在制造业企业中关于夹具、装配工艺及仿真的重用度。

技术研发人员:马佳;支含绪;邓森洋
受保护的技术使用者:艾凯克斯(嘉兴)信息科技有限公司
技术研发日:2018.09.25
技术公布日:2019.01.18
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1