一种车辆版型特征补充方法及装置与流程

文档序号:36238627发布日期:2023-12-01 22:06阅读:26来源:国知局
一种车辆版型特征补充方法及装置与流程

本发明涉及车辆,特别是涉及一种车辆版型特征补充方法及装置。


背景技术:

1、在车企出海过程中,了解当地市场销售的车型各版型的详细特征是洞察机会与风险、提高车企在国际市场中决策准确性和可靠性的基础。准确地补全汽车版型级别的特征在车企在出海过程中具有重要的意义。版型级别的特征是指版型的各种参数、配置等,它们直接影响着车型的市场竞争力、定位以及消费者的购买决策。然而,目前很多目标国的数据存在着车型的版型覆盖不全或者版型的特征数据不完整的问题。这一问题阻碍了车企全面了解国外车型的特点和优势,进而影响了其产品选择和市场策略。

2、目前对缺失信息的补充方法大致有两种,一种是将已有对象进行分类,对于缺失信息的对象,利用其与已有对象类的相似度作为权重,用已有对象类的特征进行补充,比如对网购账号的标签进行补充。但这种补充方法依赖于相似度的准确性,因此适合于同类对象较多且对象之间有频繁交互的情况,而版型特征是静态的信息,各版型之间没有互动,因此该方法不适用于补充版型特征;而且同一特征在不同版型之间存在一定的逻辑关系,所以仅基于相似度进行分类无法准确补充缺失特征。另一种信息补充方法是利用知识图谱或网络图谱,将缺失特征的对象节点确定为待定对象节点,利用图谱中与待定对象节点相连的一个或多个对象节点作为参考节点并利用它们的信息对待定对象节点的缺失特征进行补充。但这种信息补充方法依赖于图谱的完整性和准确性。对于版型数据而言,每年都会出现大量新版型,这些版型之间没有自然的关联和互动。因此,无法仅靠算法提取相邻节点和关系,并自动将其纳入图谱,因此需要依靠人工规则来构建图谱,这不仅需要大量的人力投入,而且可能受限于专家知识的局限性,导致图谱的完整性和准确性受到影响,从而影响特征补充的准确性。


技术实现思路

1、本发明提供了一种车辆版型特征补充方法及装置,可以提高补值结果的准确度和稳定性,增强车辆数据的完整性和可靠性。

2、为了解决上述技术问题,本发明提供了一种车辆版型特征补充方法,包括:

3、获取目标版型的所有版型数据,确定目标版型缺失的若干个第一特征;其中,所述第一特征包括第一配置和第一参数;所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况;

4、获取每个第一特征对应的特征补充模型;

5、将目标版型的所有版型数据依次输入至各特征补充模型,分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组,并获取各第一取值无差别组对应的第一特征取值,循环利用每个第一特征取值对所述目标版型进行特征补充,并更新所述目标版型的所有版型数据,直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值,完成目标版型的特征补充;其中,每个第一特征对应若干个取值无差别组;处于同一取值无差别组的所有版型的第一特征取值相同。

6、本发明对于缺失若干个第一特征的目标版型,分别根据缺失的若干个第一特征确定对应的特征补充模型,在特征补充模型中搜索第一特征对应的第一取值无差别组,第一取值无差别组中包括的版型与目标版型在第一特征上的取值相同,因此,获取第一取值无差别组对应的第一特征取值后可以根据获取的若干个第一特征取值对目标版型缺失的若干个第一特征进行特征补充,在完成特征补充后可以通过计算得出第一特征的置信度,当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时,完成特征补充;本发明通过车辆版型之间的相似性和逻辑性可以对车辆版型的缺失特征进行特征补充,提高补值结果的准确性以及数据的可靠性。

7、进一步地,所述获取每个第一特征对应的特征补充模型,具体为:

8、当第一特征为第一参数时,根据第一参数确定目标版型的第一参数对应的特征补充模型;

9、当第一特征为第一配置时,在预设的多模态匹配模型中匹配第一配置的标准名称,并根据第一配置的标准名称确定目标版型的第一配置对应的特征补充模型,具体为:

10、获取第一配置的名称、描述文本和标准配置名称库;

11、分别根据第一配置的名称和描述文本生成第一名称向量和第一内容向量;

12、根据所述第一名称向量和所述第一内容向量,计算所述第一配置与所述标准配置名称库中每个标准配置之间的名称相关系数和内容相关系数;

13、计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度;

14、根据所述第一配置与标准配置名称库中每个标准配置之间的名称相关系数、内容相关系数和取值相似度,得出所述第一配置与每个标准配置的配对概率;

15、将配对概率最大且大于预设的概率阈值的标准配置的名称确定为第一配置的标准名称。

16、本发明的第一特征包括第一配置和第一参数,由于同一个配置在不同的车企或者国家存在不同的名称,因此需要将第一配置匹配到标准名称,再根据标准名称确定特征补充模型,而第一参数都是统一命名的,因此可以直接根据第一参数确定特征补充模型;利用预设的多模态匹配模型对各配置匹配标准名称,是将根据第一配置的配置信息生成第一名称向量和第一内容向量,根据这两个向量计算出第一配置与标准配置名称库中每个标准配置之间的名称相关系数和内容相关系数,再计算第一配置与标准配置名称库中每个标准配置之间的取值相似度,可以根据计算得出的名称相关系数、内容相关系数和取值相似度得出第一配置与每个标准配置的配对概率,在大于概率阈值的配对概率中确定配对概率最大的标准配置对应的名称为第一配置的标准名称;本发明利用多模态匹配模型对配置匹配标准名称,可以增加数据稠密性,从而提高补值准确性。

17、进一步地,所述计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度,具体为:

18、计算第一配置与标准配置名称库中每个标准配置之间的值域相似度,具体为:

19、判断第一配置和标准配置的值域类型;其中,所述值域类型包括离散型和数值型;

20、当第一配置和标准配置的值域类型不同时,第一配置与标准配置的值域相似度为0;

21、当第一配置和标准配置的值域类型相同时,第一配置与标准配置的值域相似度为第一配置和标准配置的值域交集除以第一配置和标准配置的值域并集的结果;

22、当第一配置与标准配置的值域相似度为0时,第一配置与标准配置之间的取值相似度为0;

23、当第一配置与标准配置的值域相似度不为0时,获取包含第一配置和标准配置的第一版型,根据第一版型上的第一配置取值和标准配置取值,计算第一配置与标准配置之间的取值相似度。

24、进一步地,取值无差别组,具体为:

25、在预设数据库中获取若干个特征以及每个特征的相关特征;其中,所述相关特征包括生产国、销售国、品牌、车型、版型、改款时间和车身形式;

26、采用特征选择技术识别出每个特征的值域影响相关特征;

27、将每个特征的所有值域影响相关特征的值域进行叉乘,形成每个特征对应的若干个最细粒度分组;

28、分别获取每个特征所有最细粒度分组对应的特征值;

29、将特征值相同且满足预设约束条件的最细粒度分组聚合成每个特征的取值无差别组。

30、本发明对于每个特征,可以在预设数据库中获取该特征的所有相关特征,采用特征选择技术得出影响该特征值域的相关特征,将影响该特征值域的所有相关特征的值域进行叉乘可以得出该特征对应的若干个最细粒度分组,在约束条件下将特征值相同的最细粒度分组进行聚合,可以得到该特征的若干个取值无差别组;本发明通过确定每个特征的值域影响相关特征,可以得到每个特征的最细粒度分组,能囊括每个特征的每个取值,为后续的特征补充过程奠定了基础。

31、进一步地,所述循环利用每个第一特征取值对所述目标版型进行特征补充,并更新所述目标版型的所有版型数据,直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值,具体为:

32、利用每个第一特征取值对所述目标版型进行特征补充,得到更新后的目标版型的所有版型数据和每个第一特征的置信度;

33、比较每个第一特征的置信度和预设的第一阈值的大小;

34、确定置信度大于第一阈值的第一特征完成特征补充,并循环将更新后的目标版型的所有版型数据依次输入至置信度小于第一阈值的第一特征对应的特征补充模型,直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值。

35、本发明对于目标版型缺失的若干个第一特征,利用若干个第一特征对应的特征补充模型进行独立补值,判断补值后的第一特征的置信度是否大于预设的第一阈值,若大于,则该特征完成特征补充,根据补值后的所有第一特征更新目标版型的版型数据,对置信度不大于第一阈值的第一特征使用特征补充模型进行循环补值并迭代至所有第一特征的置信度都大于第一阈值或循环次数大于预设的第二阈值时,结束循环,完成目标版型的特征补充;本发明先对每个第一特征进行独立补值,再采用迭代循环的方式对目标版型进行特征补充,可以提高补值结果的正确性。

36、进一步地,所述特征补充模型,具体为:

37、根据目标特征的数据类型选择训练模型;其中,所述数据类型包括连续型和离散型;

38、将若干个取值无差别组、若干个版型的所有版型数据和版型间关系数据合并为训练数据集;

39、按照预设比例将所述训练数据集划分成训练集、验证集和测试集;

40、随机将若干个版型中的目标特征设置为缺失,训练所述训练模型对缺失目标特征的版型进行特征补充,并采用带有正则条件的损失函数优化所述训练模型;

41、将训练完成的训练模型确定为目标特征的特征补充模型。

42、进一步地,所述分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组,还包括:

43、当特征补充模型中不存在目标版型的第一特征所处的第一取值无差别组时,利用第一特征的在各版型上的出现情况和第一特征在各版型上的关系数据,对所述目标版型进行特征补充。

44、本发明目标版型缺失的第一特征会出现在特征补充模型中搜索不到取值无差别组的情况,此时需要利用模型输入中的第一特征的在各版型上的出现情况,和第一特征在各版型上的关系数据,对所述目标版型进行特征补充,以保证在没有取值无差别组的情况下也能利用特征补充模型对目标版型进行补值。

45、进一步地,在所述完成目标版型的特征补充后,还包括:

46、利用预设规则对目标版型的补充特征进行检测;

47、当检测出所述目标版型的补充特征中存在异常的特征值时,形成异常信号,并将所述异常信号推送至前端服务器。

48、本发明在完成目标版型的特征补充后,利用预设规则对目标版型的补充特征进行检测,若检测出存在异常的特征值,会形成异常信号,并将其推送至前端服务器,以使相关人员对异常的特征值进行进一步检查和修改,提高补值结果的准确性和数据可靠性。

49、本发明提供了一种车辆版型特征补充方法,对于缺失若干个第一特征的目标版型,若第一特征是配置,则对第一特征进行标准配置名称匹配,再根据第一特征确定对应的特征补充模型,在特征补充模型中搜索第一特征对应的第一取值无差别组,若能够搜索到则根据在第一取值无差别组中获取的第一特征取值对目标版型进行特征补充,若搜索不到则用特征补充模型生成的取值进行特征补充,当所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值时,完成特征补充,最后根据预设规则对补值后的版型数据进行检查。本发明可以通过车辆版型之间的相似性和逻辑性实现对车辆版型的缺失特征进行特征补充,提高补值结果的准确性以及数据的可靠性,为车企提供更准确的市场分析和战略决策依据。

50、相应的,本发明提供了一种车辆版型特征补充装置,包括:确定模块、获取模块和特征补充模块;

51、所述确定模块用于获取目标版型的所有版型数据,确定目标版型缺失的若干个第一特征;其中,所述第一特征包括第一配置和第一参数;所述版型数据包括目标版型中各特征的名称、描述文本和在各版型上的出现情况;

52、所述获取模块用于获取每个第一特征对应的特征补充模型;

53、所述特征补充模块用于将目标版型的所有版型数据依次输入至各特征补充模型,分别在各特征补充模型中搜索目标版型的各第一特征所处的第一取值无差别组,并获取各第一取值无差别组对应的第一特征取值,循环利用每个第一特征取值对所述目标版型进行特征补充,并更新所述目标版型的所有版型数据,直至所有第一特征的置信度都大于预设的第一阈值或循环次数大于预设的第二阈值,完成目标版型的特征补充;其中,每个第一特征对应若干个取值无差别组;处于同一取值无差别组的所有版型的第一特征取值相同。

54、进一步地,所述获取模块,包括:第一确定单元和第二确定单元;

55、所述第一确定单元用于当第一特征为第一参数时,根据第一参数确定目标版型的第一参数对应的特征补充模型;

56、所述第二确定单元用于当第一特征为第一配置时,在预设的多模态匹配模型中匹配第一配置的标准名称,并根据第一配置的标准名称确定目标版型的第一配置对应的特征补充模型,具体为:

57、获取第一配置的名称、描述文本和标准配置名称库;

58、分别根据第一配置的名称和描述文本生成第一名称向量和第一内容向量;

59、根据所述第一名称向量和所述第一内容向量,计算所述第一配置与所述标准配置名称库中每个标准配置之间的名称相关系数和内容相关系数;

60、计算所述第一配置与标准配置名称库中每个标准配置之间的取值相似度;

61、根据所述第一配置与标准配置名称库中每个标准配置之间的名称相关系数、内容相关系数和取值相似度,得出所述第一配置与每个标准配置的配对概率;

62、将配对概率最大且大于预设的概率阈值的标准配置的名称确定为第一配置的标准名称。

63、本发明提供了一种车辆版型特征补充装置,以模块间的有机结合为基础,提高了补值结果的准确度和稳定性,也增强了车辆数据的完整性和可靠性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1