一种BIM的采集数据处理方法、系统、电子设备及存储介质与流程

文档序号:37426204发布日期:2024-03-25 19:13阅读:17来源:国知局
一种BIM的采集数据处理方法、系统、电子设备及存储介质与流程

本技术涉及数据处理领域,具体涉及一种bim的采集数据处理方法、系统、电子设备及存储介质。


背景技术:

1、建筑行业数字化转型和智能化发展中,bim模型的数据采集和智能处理技术正成为一个重要领域。bim通过创建三维数字化建筑模型,集成几何、属性、材料、成本等信息,实现项目协同。但是,数据采集过程中的误差会导致模型准确性下降。为确保模型数据可靠,需要对采集数据进行异常检测和分类。

2、目前常用svm支持向量机进行异常分类。但svm的参数选择不当导致性能下降。核函数的尺度参数选择不当,会造成超平面构建效果差,降低分类准确率,进而影响bim模型准确性。


技术实现思路

1、本技术提供一种bim的采集数据处理方法、系统、电子设备及存储介质,用于解决svm的参数选择不当导致性能下降。核函数的尺度参数选择不当,会造成超平面构建效果差,降低分类准确率,进而影响bim模型准确性的问题。

2、第一方面,本技术提供了一种bim的采集数据处理方法,方法包括:

3、确定目标建筑的建筑类型,采集相同建筑类型的历史建筑数据,并基于历史建筑数据构建向量机数据集;

4、获取预设的尺度区间内的所有尺度参数,并根据每个尺度参数和向量机数据集,确定每个尺度参数对应的训练集;

5、根据每个尺度参数对应的训练集中的建筑数据,确定建筑数据的类型,并根据建筑数据的类型确定每个尺度参数对应的核函数;

6、根据每个尺度参数对应的核函数和每个尺度参数对应的训练集,确定每个尺度参数的初始值,并根据每个尺度参数的初始值,确定每个尺度参数对应的目标尺度参数;

7、对所有目标尺度参数进行交叉验证,得到每个目标尺度参数的分类准确率;

8、根据尺度区间内所有目标尺度参数的初始值和分类准确率,确定目标区间,并根据目标区间,确定目标建筑的最优尺度参数;

9、根据最优尺度参数构建目标建筑类型的目标svm超平面模型,并根据目标svm超平面模型,对待分类的建筑数据进行处理,得到分离处理后的建筑数据。

10、通过采用上述技术方案,首先,确定目标建筑的类型,并采集该类型建筑的历史数据来构建向量机数据集,这为后续svm模型的训练提供了数据基础。然后,方法预设尺度区间,获取区间内的所有尺度参数,并根据每个尺度参数确定对应的训练集,这一步遍历了尺度参数空间,为寻找最优尺度参数创造了条件。接着,方法会根据每个训练集的数据类型智能确定对应的参数的核函数,结合了数据驱动和经验法则,使核函数的选择更具针对性。在确定了核函数后,方法根据核函数和训练集确定每个尺度参数的初始值,并以初始值推算出目标尺度参数。目标尺度参数经过交叉验证可以得到分类准确率,然后根据初始值和分类准确率确定目标区间,以锁定最优参数范围。最后,以目标区间确定最终尺度参数,并构建svm模型进行分类。这样,整个通过上述步骤经过数据集构建、遍历参数、核函数确定、交叉验证等步骤,确定了最优的参数,从而提升了bim采集数据处理的效果,解决svm的参数选择不当导致性能下降。核函数的尺度参数选择不当,会造成超平面构建效果差,降低分类准确率,进而影响bim模型准确性的问题。

11、可选的,根据每个尺度参数对应的训练集中的建筑数据,确定建筑数据的类型,并根据建筑数据的类型确定每个尺度参数对应的核函数,包括:

12、对每个尺度参数对应的训练集中的建筑数据进行分类,确定建筑数据的维度类型和数据分布类型;

13、当建筑数据的类型为低维度类型或线性分布类型,确定尺度参数对应的核函数为线性核函数;

14、当建筑数据的类型为高维度类型或非线性分布类型,确定尺度参数对应的核函数为高斯核函数。

15、通过采用上述技术方案,先对每个尺度参数对应的训练集进行建筑数据分类,确定数据的维度类型和分布类型这两个特征。然后,根据这两个特征判断采用何种核函数:如果建筑数据为低维度类型或线性分布类型,由于数据复杂度低,则选择简单的线性核函数;如果建筑数据为高维度类型或非线性分布类型,由于数据复杂度高,则选择强大的高斯核函数。这样,方法实现了根据具体数据情况,选择合适复杂度的核函数。相比固定使用某种核函数,这种方式可以让核函数的表达能力与数据的复杂度相匹配,防止高估或低估,从而使最终得到的svm模型分类效果更优。

16、可选的,根据每个尺度参数对应的核函数和每个尺度参数对应的训练集,确定每个尺度参数的初始值,包括:

17、将每个尺度参数对应的建筑数据作为对应核函数的输入,得到每个尺度参数对应的核函数矩阵;

18、根据对应的核函数矩阵确定每个尺度参数对应训练集中每个历史建筑数据的核函数值序列;

19、根据核函数值序列,确定对应尺度参数的初始值。

20、通过采用上述技术方案,将建筑数据作为对应核函数的输入,构建核函数矩阵。然后基于矩阵计算每个历史建筑数据与其他数据之间的核函数值,形成核函数值序列。最后依据核函数值序列确定尺度参数的初始值。这样,方法没有简单随机或经验设定初始值,而是通过计算核函数映射特征空间距离,充分考虑了建筑数据间的内在相关性,初始化了符合数据分布的尺度参数。相比其他初始值确定方式,这种基于核函数矩阵的数据驱动方式更具有可解释性,也使参数初始值在搜索空间中更接近最优值。

21、可选的,获取目标尺度参数的建筑数据中每个建筑数据的核函数值序列,包括:

22、获取目标尺度参数的建筑数据中,第n个建筑数据在高斯核函数矩阵中与除第n个建筑数据外的每个建筑数据之间的核函数值,构成第n个建筑数据的核函数值序列。

23、通过采用上述技术方案,对目标尺度参数对应的样本集中,依次取出第n个样本。然后在该尺度参数的高斯核函数矩阵中,提取出第n个样本与除自己外的所有其他样本之间的核函数值。这些核函数值构成了第n个样本在当前尺度参数下的核函数值序列。

24、这种逐个样本获取序列的方式,能够全面考察目标尺度参数对各样本特征提取的效果。通过分析样本之间在核矩阵中的匹配程度,评估尺度参数对样本进行映射到特征空间后的分布适配效果。计算序列能够量化这种适配程度,为后续确定尺度参数初始值提供依据。

25、可选的,根据尺度区间内所有目标尺度参数的初始值和分类准确率,确定目标区间,包括:

26、根据尺度区间内所有目标尺度参数的初始值和分类准确率,确定初始值和分类准确率之间的相关系数;

27、以尺度区间内最大的分类准确率对应的目标尺度参数为尺度区间的中心参数;

28、根据中心参数将尺度区间划分为第一区间和第二区间,并确定第一区间和第二区间的分类准确率;

29、获取第一区间和第二区间内的所有尺度参数以及每个尺度参数的初始值;

30、根据第一区间的所有尺度参数的初始值,确定第一区间的第一平均初始值,根据第二区间的所有尺度参数的初始值,确定第二区间的第二平均初始值;

31、根据第一平均初始值和第一区间的分类准确率以及初始值和分类准确率之间的相关系数,确定第一区间的目标度;

32、根据第二平均初始值和第二区间的分类准确率以及初始值和分类准确率之间的相关系数,确定第二区间的目标度;

33、将第二区间和第二区间中目标度最大的区间作为目标区间。

34、通过采用上述技术手段,首先计算初始值和分类准确率的相关系数,确定两者之间的关联性。然后以最大分类准确率对应的参数为中心参数,将尺度区间划分为两部分,并计算各区间的分类准确率。接着获取各区间内的尺度参数及初始值信息,计算各区间的平均初始值。根据平均初始值、分类准确率及两者相关系数确定各区间的目标度,并比较目标度确定新的目标区间。这样通过区间划分、目标度比较的迭代过程,方法逐步缩小了尺度参数的选取范围,使其向优化目标接近。相比全局扫描,这种局部迭代搜索方式提高了参数优化的效率。综上,该目标区间确定思路实现了更精确、高效的尺度参数选择,增强了最终bim采集数据处理的性能。

35、可选的,根据中心参数将尺度区间划分为第一区间和第二区间,并确定第一区间和第二区间的分类准确率,包括:

36、将小于中心参数且与中心参数差值最小的目标尺度参数作为第一区间的左边界,将中心参数作为第一区间的右边界,得到尺度区间的第一区间;

37、将大于中心参数且与中心参数差值最小的目标尺度参数作为第二区间的右边界,将中心参数作为第二区间的左边界,得到尺度区间的第二区间;

38、将第一区间的左边界和右边界对应的分类准确率的均值作为第一区间的分类准确率,将第二区间的左边界和右边界对应的分类准确率的均值作为第二区间的分类准确率。

39、通过采用上述技术方案,以最大分类准确率对应的中心参数为依据,选取差值最小的小于中心参数的尺度参数作为第一区间左边界,选取差值最小的大于中心参数的尺度参数作为第二区间右边界。这样可以使得两区间在中心参数周围对称分布,区间范围基本相当,避免出现一大一小的不合理划分。同时,方法取各区间边界参数的分类准确率均值作为区间分类准确率,能够平滑随机波动,反映区间整体水平。通过这样的区间划分方式,方法实现了均衡、精确的区间构建,为后续的目标区间比较选取提供了合理范围。相比简单随机或均分的区间生成方法,这种考虑中心敏感性的划分方式更有利于使参数区间向最优收敛,从而提高bim采集数据处理的效果。

40、可选的,根据目标区间,确定目标建筑的最佳尺度参数,包括:

41、根据目标区间中每个尺度参数的初始值获取目标区间中的目标尺度参数,对目标区间中的所有目标尺度参数进行交叉验证,得到目标区间中的每个目标尺度参数的分类准确率,根据目标区间中的所有目标尺度参数的初始值和分类准确率获取新的目标区间;

42、重复进行目标区间更新操作,直到得到的最新的目标区间的第一区间和第二区间中,不存在分类准确率比最新的目标区间的中心参数的分类准确率更高的尺度参数时,停止迭代;

43、将最新的目标区间的中心参数作为最佳尺度参数。

44、通过采用上述技术方案,首先基于当前目标区间内的尺度参数及其初始值,通过交叉验证得到各参数的分类准确率。然后比对分类准确率,更新区间范围,获得新的目标区间。这样的迭代更新操作一直进行,直到最新的目标区间中的参数分类准确率无法超过区间中心参数为止。此时,区间已缩小到只含一个最优参数,该中心参数即为最终确定的最优尺度参数。这种迭代逼近最优参数的过程,相比单步确定能够实现更高的精确度。最终得到的尺度参数,使svm模型参数配置最优,分类性能达到最大化。

45、在本技术的第二方面提供了一种bim的采集数据处理系统,包括:

46、数据采集模块,用于确定目标建筑的建筑类型,采集相同建筑类型的历史建筑数据,并基于历史建筑数据构建向量机数据集;

47、训练集构建模块,用于获取预设的尺度区间内的所有尺度参数,并根据每个尺度参数和向量机数据集,确定每个尺度参数对应的训练集;

48、核函数确定模块,用于根据每个尺度参数对应的训练集中的建筑数据,确定建筑数据的类型,并根据建筑数据的类型确定每个尺度参数对应的核函数;

49、目标尺度参数确定模块,用于根据每个尺度参数对应的核函数和每个尺度参数对应的训练集,确定每个尺度参数的初始值,并根据每个尺度参数的初始值,确定每个尺度参数对应的目标尺度参数;

50、准确率确定模块,对所有目标尺度参数进行交叉验证,得到每个目标尺度参数的分类准确率;

51、最优尺度参数确定模块,用于根据尺度区间内所有目标尺度参数的初始值和分类准确率,确定目标区间,并根据目标区间,确定目标建筑的最优尺度参数;

52、数据分类模块,用于根据最优尺度参数构建目标建筑类型的目标svm超平面模型,并根据目标svm超平面模型,对待分类的建筑数据进行处理,得到分离处理后的建筑数据。

53、在本技术的第三方面提供了一种计算机存储介质,计算机存储介质存储有多条指令,指令适于由处理器加载并执行上述的方法步骤。

54、在本技术的第四方面提供了一种电子设备,包括:处理器和存储器;其中,存储器存储有计算机程序,计算机程序适于由处理器加载并执行上述的方法步骤。

55、综上,本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:

56、1、本技术首先,确定目标建筑的类型,并采集该类型建筑的历史数据来构建向量机数据集,这为后续svm模型的训练提供了数据基础。然后,方法预设尺度区间,获取区间内的所有尺度参数,并根据每个尺度参数确定对应的训练集,这一步遍历了尺度参数空间,为寻找最优尺度参数创造了条件。接着,方法会根据每个训练集的数据类型智能确定对应的参数的核函数,结合了数据驱动和经验法则,使核函数的选择更具针对性。在确定了核函数后,方法根据核函数和训练集确定每个尺度参数的初始值,并以初始值推算出目标尺度参数。目标尺度参数经过交叉验证可以得到分类准确率,然后根据初始值和分类准确率确定目标区间,以锁定最优参数范围。最后,以目标区间确定最终尺度参数,并构建svm模型进行分类。这样,整个通过上述步骤经过数据集构建、遍历参数、核函数确定、交叉验证等步骤,确定了最优的参数,从而提升了bim采集数据处理的效果,解决svm的参数选择不当导致性能下降。核函数的尺度参数选择不当,会造成超平面构建效果差,降低分类准确率,进而影响bim模型准确性的问题。

57、2、本技术通过计算初始值和分类准确率的相关系数,确定两者之间的关联性。然后以最大分类准确率对应的参数为中心参数,将尺度区间划分为两部分,并计算各区间的分类准确率。接着获取各区间内的尺度参数及初始值信息,计算各区间的平均初始值。根据平均初始值、分类准确率及两者相关系数确定各区间的目标度,并比较目标度确定新的目标区间。这样通过区间划分、目标度比较的迭代过程,方法逐步缩小了尺度参数的选取范围,使其向优化目标接近。相比全局扫描,这种局部迭代搜索方式提高了参数优化的效率。综上,该目标区间确定思路实现了更精确、高效的尺度参数选择,增强了最终bim采集数据处理的性能。

58、3、本技术基于当前目标区间内的尺度参数及其初始值,通过交叉验证得到各参数的分类准确率。然后比对分类准确率,更新区间范围,获得新的目标区间。这样的迭代更新操作一直进行,直到最新的目标区间中的参数分类准确率无法超过区间中心参数为止。此时,区间已缩小到只含一个最优参数,该中心参数即为最终确定的最优尺度参数。这种迭代逼近最优参数的过程,相比单步确定能够实现更高的精确度。最终得到的尺度参数,使svm模型参数配置最优,分类性能达到最大化。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1