一种面向设计知识动态推送的自适应需求模型构建方法与流程

文档序号：12733941阅读：146来源：国知局

本发明涉及计算机应用技术领域，尤其涉及了一种面向设计知识动态推送的自适应需求模型构建方法。

背景技术：

21世纪，随着信息技术飞速发展，知识需求逐步成为企业发展乃至社会经济生活的前提，知识生产与应用逐步成为社会经济生活的中心。但随着近几年计算机运算能力的大幅提升和网络急速扩张，无论是在开放的互联网还是以产品设计企业为范围的局域网内，知识资源已十分丰富，“知识被淹没在信息的海洋中”已成为一个不争的事实。庞大的信息缺乏有效组织，使得用户在查找知识时异常困难。目前大多知识平台在知识服务的主动性、及时性和针对性方面，都无法满足企业内外部的知识需求。如何提升平台的知识服务能力成为产品设计企业亟待解决的问题。

“知识泛滥”、“知识迷航”现象反映出知识由于缺乏科学地管理，虽然知识存量大，来源丰富，但用户有效获取所需知识的能力却严重不足。建立切实满足用户知识需求的知识推送已成为知识管理领域研究热点之一。知识管理的动机在于在保存过去俘获的知识，并令适当的人员在适当的时机能快捷取所需且以适当形式展示的知识。知识推送正是完成后者的有效途径。

目前，如何有效针对产品设计人员需求，实现知识的传递和推送服务，以期在企业内部和外部达到知识的共享和再创造，已成为迫切需要解决的问题。

产品设计知识主动推送的方式符合大多数设计企业的现状，通过加快知识获取速度、提高知识获取准确率，加快企业内知识的有效传播，为产品设计效率和质量的提高乃至企业市场竞争力的提升打下良好基础。

对于某一个设计人员而言，当前设计任务下，他所需求的设计知识只占资源库的很小的一部分。同时，随着设计任务的进行，设计人员对设计知识的需求也在不断变化。如何在庞大的资源库中找到设计人员在特定设计任务的特定设计阶段所需求的设计知识，成为用户迫切需要解决的问题。现有技术中，有的只采用一个需求模型，这必然导致其无法充分体现用户需求的多样性特征；有的采用多个需求模型，这又会产生庞大的数据量，从而导致数据维护和管理困难的问题，同时也无法适应在不同设计任务中不同设计阶段的设计人员设计知识需求。

技术实现要素：

为克服现有技术的上述不足，本发明提供了一种面向设计知识动态推送的自适应需求模型构建方法，方法能够准备描述设计人员的多种需求特征，同时又避免了采用多个需求模型而带来的数据维护困难的问题，具有较高的自适应性。

本发明所采用的技术方案是：

(1)根据设计人员信息和设计任务信息分别建立设计人员向量模型和设计任务向量模型，设计人员信息和设计任务信息均为已知信息，设计人员向量模型是由不同设计人员信息组成的向量并作为向量模型，设计任务向量模型是由不同设计任务信息组成的向量并作为向量模型；从设计人员向量模型和设计任务向量模型中提取关键词，通过k-means聚类算法将关键词划分为不同的主题，以每个主题作为一个子需求模型Sub，子需求模型由向量Sub_i＝{(key_i1,w_Si1),(key_i2,w_Si2),...,(key_ij,w_Sij),...,(key_im,w_Sim)}表示，其中，Sub_i表示第i个子需求模型，key_ij表示子需求模型Sub_i中第j个关键词，w_Sij表示第j个关键词的权重，初始权重均设置为1，m表示对应子需求模型关键词个数；

所有子需求模型构成设计知识多主题需求模型Requirment，设计知识多主题需求模型由向量Requirment＝{(Sub₁,w_R1),(Sub₂,w_R2),...,(Sub_i,w_Ri),....,(Sub_n,w_Rn)}表示，其中w_Ri表示第i个子需求模型的权重，初始权重均设置为1，n表示子需求模型个数；

(2)将设计知识多主题需求模型Requirment与设计资源库中的知识文档进行相似度计算，然后生成设计知识多主题推送文档集，设计知识多主题推送文档集由向量Knowledge＝{(Sub₁,K₁),(Sub₂,K₂),...,(Sub_i,K_i),...,(Sub_n,K_n)}表示，其中,K_i表示子需求模型Sub_i下的推送文档集，由向量K_i＝{Doc_i1,Doc_i2,...,Doc_ij,...,Doc_is}构建，其中Doc_ij表示推送文档集K_i中第j篇推送文档，s表示对应推送文档篇数；

(3)针对每篇文档，统计用户总访问时间获得反馈值，针对每个子需求模型生成反馈模型Fb_i＝{(Doc_i1,score_i1),(Doc_i2,score_i2),...,(Doc_ij,score_ij),...(Doc_is,score_is)}，其中score_ij表示推送文档Doc_ij的反馈值，分值范围为0到1；

(4)将用户反馈模型引入用户需求度参数，针对每个子需求模型Sub_i的反馈模型计算获得该子需求模型的需求度，并与子需求模型一起构成需求度模型，需求度模型由向量Feedback＝{(Sub₁,demand₁),(Sub₂,demand₂),...,(Sub_i,demand_i),....,(Sub_n,demand_n)}表示，其中，demand_i表示对子需求模型Sub_i的需求度；

(5)设计知识多主题需求模型中删除需求度低于预设定的需求度阈值threshold_demand的子需求模型，对于保留的子需求模型，将其对应计算获得的需求度赋值到子需求模型的权重w_Ri，从而更新子需求模型的权重w_Ri，初始情况下，第i个子需求模型的权重w_Ri和第j个关键词的权重w_Sij均为1；

(6)根据设计人员浏览知识文档的历史信息提取关键词，设计人员浏览知识文档的历史信息是已知的，通过k-means聚类算法将关键词划分为主题，以每个主题作为一个子需求模型作为待添加需求模型，将待添加需求模型加入到步骤(1)中的设计知识多主题需求模型Requirment中，重复步骤(2)～(6)对设计知识多主题需求模型Requirment、设计知识多主题推送文档集和需求度模型进行更新，从而完成本发明需求模型的自适应更新构建。

本发明完成需求模型构建后，通过需求度模型将其每个子需求模型对应的设计知识多主题推送文档集推送给设计人员。

本发明所述的聚类算法采用k-means聚类算法。

所述步骤(2)具体是：

(2.1)在设计知识多主题需求模型中的每个子需求模型和设计资源库中的每个知识文档之间采用以下公式计算相似度Simularity：

其中，WVSub_i表示子需求模型Sub_i关键词权重向量{w_Si1,w_Si2,w_Sij,...,w_Sim,w_Si(m+1),...,w_SiM}，w_Si(m+1),...,w_SiM表示资源库文档Doc中存在而子需求模型中不存在的关键词在子需求模型中的权重，其取值均为0；WVDoc表示资源库文档Doc关键词权重向量{w_doc1,w_doc2,w_docj,...,w_docm,w_doc(m+1),...,w_docM}，其中，每个权重对应的关键词顺序与子需求模型关键词权重向量对应的关键词顺序一致，对于子需求模型中存在而资源库文档中不存在的关键词，其权重值取0；M表示子需求模型关键词与资源库文档关键词取并集后关键词数量，w_Sik表示子需求模型第k关键词权重，w_dock表示资源库文档第k个关键词的权重，前述两权重对应的关键词相同；

(2.2)针对每个知识文档，采用以下方式进行处理：将与各个子需求模型之间计算获得的相似度均小于等于预设定的相似度阈值threshold_simularity的知识文档剔除，将每个知识文档归属于该知识文档与各个子需求模型计算后获得的最大相似度所对应的子需求模型，接着将子需求模型下归属的所有知识文档组成待推送文档集K_i，将子需求模型及其待推送文档集K_i一起构成设计知识多主题推送文档集。

所述步骤(2)中的每个文档均通过向量Doc＝{(term₁,w_doc1,loc₁),(term₂,w_doc2,loc₂),...,(term_k,w_dock,loc_k),....,(term_r,w_docr,loc_r)}的空间模型表示，其中term_k表示资源库文档第k个关键词，w_dock表示第k个关键词权重，loc_k表示第k个关键词位置信息，主要位置信息有标题、子标题、摘要、正文，r表示文档中关键词个数。

所述文档Doc的第k个关键词权重w_dock由其TF值-IDF值和其位置信息共同确定，具体计算公式如下：

其中，TF表示关键词的词频值，IDF表示关键词的逆文档词频值；

关键词的词频值TF采用以下公式计算：

其中，n表示所述关键词在该篇文档中出现的次数，N表示所述文档中单词总数；

关键词的逆文档词频值IDF采用以下公式计算：

其中，N_D表示资源库文档总数，N_w表示出现所述关键词的文档数量。

所述步骤(3)中文档Doc_ij的反馈值score_ij采用以下公式计算：score_ij＝t_ij/t_max，其中t_ij表示文档Doc_ij的总访问时间，t_max表示设计知识多主题推送文档集中所有推送文档总访问时间最大值。

所述步骤(4)中子需求模型的需求度采用以下公式进行计算：

其中，scores_ik表示子需求模型Sub_i下的推送文档集K_i第k篇推送文档的反馈值，s表示对应推送文档篇数。

本发明的有益效果是：

本发明方法能够准确描述设计人员的多种需求特征，同时又避免了采用多个需求模型而带来的数据维护困难的问题，具有较高的自适应性。

附图说明

图1是本发明方法的流程图。

具体实施方式

以下结合附图对本发明作进一步的详细描述。

如图1所示，本发明的实施例及其实施过程如下：

(1)根据设计人员信息和设计任务信息分别建立设计人员向量模型和设计任务向量模型，从设计人员向量模型和设计任务向量模型中提取关键词，通过k-means聚类算法将关键词划分为不同的主题，以每个主题作为一个子需求模型Sub，子需求模型由向量Sub_i＝{(key_i1,w_Si1),(key_i2,w_Si2),...,(key_ij,w_Sij),...,(key_im,w_Sim)}表示，其中，Sub_i表示第i个子需求模型，key_ij表示子需求模型Sub_i中第j个关键词，w_Sij表示第j个关键词的权重，m表示对应子需求模型关键词个数；

所有子需求模型构成设计知识多主题需求模型Requirment，设计知识多主题需求模型由向量Requirment＝{(Sub₁,w_R1),(Sub₂,w_R2),...,(Sub_i,w_Ri),....,(Sub_n,w_Rn)}表示，其中w_Ri表示第i个子需求模型的权重，n表示子需求模型个数；

例如，针对数控机床的设计中某个设计人员提取的关键词有：{主轴回转精度，主轴回转误差，主轴刚度，主轴材料，导轨结构，导轨材料，导轨润滑，导轨防护装置}，通过k-means聚类算法可以将分为两个主题，其子需求模型分别为{(主轴回转精度，1)，(主轴回转误差，1)，(主轴刚度，1)，(主轴材料，1)}和{(导轨结构，1)，(导轨材料，1)，(导轨润滑，1)，(导轨防护装置，1)}，设计知识多主题需求模型为{({(主轴回转精度，1)，(主轴回转误差，1)，(主轴刚度，1)，(主轴材料，1)}，1)，({(导轨结构，1)，(导轨材料，1)，(导轨润滑，1)，(导轨防护装置，1)}，1)}。

(2)将设计知识多主题需求模型Requirment中的每一个子需求模型分别与设计资源库中的知识文档进行相似度计算，然后生成设计知识多主题推送文档集，设计知识多主题推送文档集由向量Knowledge＝{(Sub₁,K₁),(Sub₂,K₂),...,(Sub_i,K_i),...,(Sub_n,K_n)}表示，其中,K_i表示子需求模型Sub_i下的推送文档集，由向量K_i＝{Doc_i1,Doc_i2,...,Doc_ij,...,Doc_is}构建，其中Doc_ij表示推送文档集K_i中第j篇推送文档，s表示对应推送文档篇数；

例如，针对前述实例，从资源库中匹配出两个推送文档集{主轴部件传动方案选择，主轴端部结构设计，主轴的材料、热处理和技术要求}，{机床导轨技术的主要特性，机床导轨的材料，滑动导轨，静压导轨，滚动导轨，导轨的防护装置}。

(3)针对每篇文档，统计用户总访问时间，针对每个子需求模型生成反馈模型Fb_i＝{(Doc_i1,score_i1),(Doc_i2,score_i2),...,(Doc_ij,score_ij),...(Doc_is,score_is)}，其中score_ij表示推送文档Doc_ij的反馈值，分值范围为0到1；

(4)针对每个子需求模型Sub_i的反馈模型计算获得该子需求模型的需求度，并与子需求模型一起构成需求度模型，需求度模型由向量Feedback＝{(Sub₁,demand₁),(Sub₂,demand₂),...,(Sub_i,demand_i),....,(Sub_n,demand_n)}表示，其中，demand_i表示对子需求模型Sub_i的需求度；

例如，针对前述步骤(3)中的推送文档集{主轴部件传动方案选择，主轴端部结构设计，主轴的材料、热处理和技术要求}中三篇文档的总访问时间分别为：30min、15min、20min，其中min表示分钟，推送文档集{机床导轨技术的主要特性，机床导轨的材料，滑动导轨，静压导轨，滚动导轨，导轨的防护装置}中六篇文档的总访问时间分别为：15min、15min，10min，10min，10min，12min，则推送文档集{主轴部件传动方案选择，主轴端部结构设计，主轴的材料、热处理和技术要求}的三篇文档的反馈值分别为：1、0.5、0.667，其需求度为：(1+0.5+0.667)/3＝0.722，推送文档集{机床导轨技术的主要特性，机床导轨的材料，滑动导轨，静压导轨，滚动导轨，导轨的防护装置}中六篇文档的反馈值分别为：0.5、0.5、0.333、0.333、0.333、0.4，其需求度为：(0.5+0.5+0.333+0.333+0.333+0.4)/6＝0.4。

(5)设计知识多主题需求模型中删除需求度低于预设定的需求度阈值threshold_demand的子需求模型，对于保留的子需求模型，将其对应计算获得的需求度赋值到子需求模型的权重w_Ri，从而更新子需求模型的权重w_Ri；

例如，假设需求度阈值设定为0.5，则子需求模型{(导轨结构，1)，(导轨材料，1)，(导轨润滑，1)，(导轨防护装置，1)}被删除，被保留的子需求模型的权重更新为0.722；

(6)根据设计人员浏览知识文档的历史信息提取关键词，通过k-means聚类算法将关键词划分为主题，以每个主题作为一个子需求模型作为待添加需求模型，将待添加需求模型加入到步骤(1)中的设计知识多主题需求模型Requirment中，重复步骤(2)～(6)对设计知识多主题需求模型Requirment、设计知识多主题推送文档集和需求度模型进行更新，从而完成本发明需求模型的自适应更新构建。

本发明方法的上述实施步骤能够准确描述出设计人员的多种需求特征，同时又避免了采用多个需求模型而带来的数据维护困难的问题，能够较好的满足设计人员高度个性化的需求，其更新机制能够较好的捕捉设计人员知识需求的变化，具有较高的自适应性。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张树有;陈晓杰;高一聪
技术所有人：浙江大学
我是此专利的发明人

上一篇：一种倾斜角度可调的球磨机的制作方法与工艺
上一篇：应用于机箱电源的发光转接板的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。