本发明涉及方案评估领域,特别涉及产品众包设计方案智能评估方法和系统。
背景技术:
1、随着科学技术的进步,人们对生活水平的要求越来越高,同时随着科学技术的快速发展,国内汽车占有率正在不断上升,人们对汽车的要求不仅仅停留在便捷性、舒适性上,更是对安全性和智能化等方面提出了更高的要求,因此在汽车设计方案上的要求更高,而众包指的是一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众志愿者的做法,但是众包的汽车设计方案在各个指标性能上良莠不一,需要对设计方案进行快速的筛选评估。
2、现有的设计方案评估具有以下问题:
3、(1)在确定评价过程使用的指标体系以及指标权重时,专家经验法、文献浏览法、文本分析法等方法可以使指标体系具备一定的可解释性,但指标之间的相互影响关系常常被忽略,得到的指标权重缺少一定的科学性;
4、(2)目前对于产品方案评价的方法都避免不了引入专家经验与主管的主观判断,判断矩阵的判断、指标的评价值的确定与正负理想解的选择都避免不了完全依赖专家经验而导致的主观性太强的风险,不合理的选择可能导致结果的失真或不稳定性;
5、(3)随着设计众包的兴起,越来越多的企业开始在众包平台上进行产品方案的收集,导致产品方案数量明显增多,在此情况下,传统的评价方法可能无法轻松处理大量方案的评价工作;
6、(4)在保障评价具有一定的客观性,且能够处理大量方案的前提下,传统的基于数据挖掘进行方案推荐的方法缺少用户情感分析模块,无法将用户的反馈信息输入到下一次的任务推荐的前端,导致整个方案评价与推荐过程没有形成闭环。
技术实现思路
1、本发明的目的在于提供产品众包设计方案智能评估方法和系统,克服了现有技术的不足,解决了上述问题。
2、为解决上述问题,本发明所采取的技术方案如下:
3、产品众包设计方案智能评估方法,所述评估方法包括以下步骤:
4、s1:采集文本数据并进行预处理;
5、采集众包网站上的设计众包方案文本、任务描述文本以及汽车相关的网页信息和文本,构建汽车行业知识库和一级指标词库,二级指标词库从发包方,文献和gpt4共同构建,并对文本进行预处理;
6、所述文本预处理的方法为:
7、(1)数据清洗:对原始文档中的所有换行符和标点符号进行清洗,从而得到连续的文本数据;
8、(2)停词删除:使用自然语言工具包提供的停词库删除文本中常见的停词;
9、(3)小写:将所有字符转换为小写,以规范文本数据;
10、(4)tokenization:确保将文本适当分割为最小的语义单元token,为后续处理奠定基础;
11、s2:建立指标体系,并计算各指标权重;
12、使用anp对指标权重进行计算,建立指标之间的相互依赖关系网络图,邀请汽车行业内专家进行1-9标度打分,引入专家经验,对打分的分值取加权平均值,由软件直接计算出最终指标权重;
13、所述指标共分为5个一级指标和12个二级指标;
14、s3:选择训练模型并进行训练加载,计算给出每个方案的评分;
15、基于word2vec系统,用skip-gram模型进行训练生成模型,再用生成的模型把方案文本的词语和创建的指标词库进行向量化并结合anp确定的指标权重最终进行相似度计算给出每个方案的评分;
16、所述s3的具体步骤为:
17、s31:使用nltk工具包在设计文本中进行词性标记,提取形容词、副词和名词,以提高了样本的处理效率;
18、s32:选择skip-gram模型来训练预处理语料库;
19、s33:使用处理后的文本数据对生产的模型进行训练加载;
20、s34:通过余弦相似度这个基于向量空间中的角度的方法来判定两个词在语义上的接近程度,量化词语之间的相似性,通过排序得出方案得分高低进行方案推荐;
21、s4:分析用户情感,生成用户友好的界面,并对众包任务进行迭代调整;
22、通过谷歌模型进行优化,确定满意/喜悦,失望,兴奋,信任/安全感,担忧/恐惧,惊讶,愤怒,中立8个标签来分析用户的情感,生成用户友好的界面,让发包方可以方便地查看情感分析结果,并对众包任务进行调整。
23、优选的,所述s2中5个一级指标为:循环经济原则、以人为本原则、动力有效性原则、设计创新原则以及驾驶高性能原则;所述s2中12个二级指标为:环境友好性、可回收性、经济性、普适性、可靠性、续航稳定性、续航便捷性、时尚性、简约性、独特性、驾驶安全性以及驾驶舒适性。
24、优选的,所述s33中对模型进行训练加载的方法具体为:
25、s331:以数据集和参数作为输入,输出包括“w1”、“word2index”和“index2word”;
26、s332:设置训练参数,学习率为0.01,词嵌入维数,迭代次数为10,上下文滑动窗口大小为3;
27、s333:随机初始化两个权重矩阵w1和w2,分别存储上下文的中间嵌入向量和嵌入向量;
28、s334:将训练好的词嵌入向量和词汇表保存为pickle文件;
29、s335:从pickle文件中加载word2index字典,确定给定词的索引;
30、s336:使用这些索引,从w1矩阵中提取出相应的词向量。
31、优选的,所述s34中余弦相似度是一种计算两个非零向量之间相似度的方法,用于计算文本中词或句子的相似性,通过比较向量间的余弦值,可以评估词语间的语义接近程度。
32、优选的,所述s4中对众包任务进行调整是基于情感分析结果进行反馈的,当调整完成后,更新众包平台上的众包任务信息,重新收取设计方案,收集好新一轮的方案后,再次计算其与指标词库的相似度得分,根据新的相似度得分和情感分析结果,系统重新生成推荐列表,优先展示得分高或改进显著的设计方案。
33、本发明还提供了产品众包设计方案智能评估系统,所述评估系统包括:
34、数据采集模块,用于采集文本数据并进行预处理;
35、采集众包网站上的设计众包方案文本、任务描述文本以及汽车相关的网页信息和文本,构建汽车行业知识库和一级指标词库,二级指标词库从发包方,文献和gpt4共同构建,并对文本进行预处理;
36、所述文本预处理的方法为:
37、(1)数据清洗:对原始文档中的所有换行符和标点符号进行清洗,从而得到连续的文本数据;
38、(2)停词删除:使用自然语言工具包提供的停词库删除文本中常见的停词;
39、(3)小写:将所有字符转换为小写,以规范文本数据;
40、(4)tokenization:确保将文本适当分割为最小的语义单元token,为后续处理奠定基础;
41、权重计算模块,用于建立指标体系,并计算各指标权重;
42、使用anp对指标权重进行计算,建立指标之间的相互依赖关系网络图,邀请汽车行业内专家进行1-9标度打分,引入专家经验,对打分的分值取加权平均值,由软件直接计算出最终指标权重;
43、所述指标共分为5个一级指标和12个二级指标;
44、词与词匹配模块,用于选择训练模型并进行训练加载,计算给出每个方案的评分;
45、基于word2vec系统,用skip-gram模型进行训练生成模型,再用生成的模型把方案文本的词语和创建的指标词库进行向量化并结合anp确定的指标权重最终进行相似度计算给出每个方案的评分;
46、所述s3的具体步骤为:
47、s31:使用nltk工具包在设计文本中进行词性标记,提取形容词、副词和名词,以提高了样本的处理效率;
48、s32:选择skip-gram模型来训练预处理语料库;
49、s33:使用处理后的文本数据对生产的模型进行训练加载;
50、s34:通过余弦相似度这个基于向量空间中的角度的方法来判定两个词在语义上的接近程度,量化词语之间的相似性,通过排序得出方案得分高低进行方案推荐;
51、情感分析模块,用于分析用户情感,生成用户友好的界面,并对众包任务进行迭代调整;
52、通过谷歌模型进行优化,确定满意/喜悦,失望,兴奋,信任/安全感,担忧/恐惧,惊讶,愤怒,中立8个标签来分析用户的情感,生成用户友好的界面,让发包方可以方便地查看情感分析结果,并对众包任务进行调整。
53、优选的,所述权重计算模块中5个一级指标为:循环经济原则、以人为本原则、动力有效性原则、设计创新原则以及驾驶高性能原则;所述权重计算模块中12个二级指标为:环境友好性、可回收性、经济性、普适性、可靠性、续航稳定性、续航便捷性、时尚性、简约性、独特性、驾驶安全性以及驾驶舒适性。
54、优选的,所述s33中对模型进行训练加载的方法具体为:
55、s331:以数据集和参数作为输入,输出包括“w1”、“word2index”和“index2word”;
56、s332:设置训练参数,学习率为0.01,词嵌入维数,迭代次数为10,上下文滑动窗口大小为3;
57、s333:随机初始化两个权重矩阵w1和w2,分别存储上下文的中间嵌入向量和嵌入向量;
58、s334:将训练好的词嵌入向量和词汇表保存为pickle文件;
59、s335:从pickle文件中加载word2index字典,确定给定词的索引;
60、s336:使用这些索引,从w1矩阵中提取出相应的词向量。
61、优选的,所述s34中余弦相似度是一种计算两个非零向量之间相似度的方法,用于计算文本中词或句子的相似性,通过比较向量间的余弦值,可以评估词语间的语义接近程度。
62、优选的,所述情感分析模块中对众包任务进行调整是基于情感分析结果进行反馈的,当调整完成后,更新众包平台上的众包任务信息,重新收取设计方案,收集好新一轮的方案后,再次计算其与指标词库的相似度得分,根据新的相似度得分和情感分析结果,系统重新生成推荐列表,优先展示得分高或改进显著的设计方案。
63、本发明与现有技术相比较,具有以下有益效果:
64、本发明采用自然语言处理word2vec算法和余弦相似度方法自动化分析设计方案文本,可以快速处理大量设计方案,显著提高评估效率,同时余弦相似度计算每个方案最终得分,引入了anp方法计算指标权重,量化了设计方案与这些指标的一致性,考虑到了指标之间的相互影响关系,使最终方案的得分更具准确性,增强决策质量,数据驱动的评估降低了主观偏差,提高结果的客观性。
65、本发明引入了情感分析模块和迭代机制,可以辅助设计人员了解用户对产品的满意程度,并借助用户的使用体验和评价需求偏好对产品进行迭代修改,提供更加精准的以用户为中心的设计方案。