一种从脱机文档获取BIM数据的方法与流程

文档序号:27490725发布日期:2021-11-22 14:23阅读:103来源:国知局
一种从脱机文档获取BIM数据的方法与流程
一种从脱机文档获取bim数据的方法
技术领域
1.本发明属于图像识别领域,特别是涉及一种从脱机文档获取bim数据的方法。


背景技术:

2.bim是建筑信息模型的简称。目前bim技术已经逐渐应用于建筑工程的各个方面,并处于高速发展阶段。目前bim数据的获取主要通过三种方式:利用三维软件正向设计建模、以二维cad图纸为依据利用三维软件翻模、利用cad识别软件辅助三维软件建模。这三种方式对于建筑单体的bim的模型来讲是适合的,但是对于园区级亦或者城市级的数字孪生来讲,成本过于昂贵。因此目前对于智慧园区、智慧城市级别的应用,更多的还是采取无人机倾斜摄影获取表皮信息,但倾斜摄影数据又无法获取建筑物内部的构件级数据。
3.图像识别是计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。识别过程包括图像预处理、图像分割、特征提取和判断匹配。简单来说,图像识别就是计算机如何像人一样读懂图片的内容。目前图像识别主要应用还是人脸识别、商品识别等方面,对于建筑信息模型来讲还未有大规模的应用实例。
4.由于cad二维矢量图纸的保密要求,在园区、城市级别的bim应用来讲,很难收集到建筑物的全部cad二维矢量图纸,利用cad矢量识别软件有一定的适用局限性。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种从脱机文档获取bim数据的方法。
6.包括如下步骤:步骤s1: 读取通过特定的采集系统(摄像机、扫描仪)将图形以图像的方式采集到的脱机图纸文档。
7.步骤s2:遍历文档,对文档进行图形降噪处理后,利用图像识别将文档内图形识别为文字、直线、椭圆弧、椭圆、圆弧、圆及其他非二次曲线。
8.步骤s3:根据图形特点采集图元的坐标、长度、曲率、半径、文字内容等数据,根据图元相关性,判断各个图元的位置关系,提取相交、平行、凹凸性、闭合性、夹角等特征,将数并存入数据库对应容器。
9.步骤s4:利用几何结构算法,通过几何约束树进行图元数据对比,在容差范围内数据完全一致的,进行相关图元对比,相关图元关系达到触发值后,将该组图元定义为关键特征图元组。
10.步骤s5:关键特征图元组与数据库中预设文档类型中的预设关键特征图元对比,对比结果相符合后将关键特征图元组类别设定为预设关键特征元素,将类别属性存入数据库;对比结果不相符,采用人工干预方式确定类别。
11.步骤s6:通过预设的符号特征树,根据预设的关键特征元素为根节点,使用广度优先算法,广度优先遍历节点的顺序和节点之间的边信息,记录下来作为输入符号特征树的识别特征模板,存入数据库。
12.步骤s7:根据预设文档类型特征,判断识别特征模板的准确性,对比结果吻合的输出构件数据至数据库。
13.步骤s8:将未识别为关键特征图元、对比结果异常的图元,输出数据至未识别容器,通过二维显示系统读取,采用人工干预方式判定或修改,修改后的数据输出至数据库。
14.步骤s9:利用纠偏算法,通过关键特征图元的角度、长度、文字等特征,对数据纠偏。
15.步骤s10:将全部识别数据以特定输出格式输出为文档,利用bim软件打开。
16.常规的建筑工程文档主要包括图纸目录、专业总说明等文字为主的文档和以层数、构件类别、表达方式(平面、立面、剖面、详图)组成的图形图元为主的文档。其中图形图元为主的文档信息含量更大,也更为适合图像识别方式。因此根据图形图元文档的特点,提出了几何结构算法。
17.几何结构算法包括几何约束关系和几何位置关系,所述几何约束关系包括线段相交、线段平行、圆弧与直线、文本与直线、文本与圆弧等2个图元之间的关系和凹凸性、闭合性等多图元的关系;所述几何位置关系是指将第一基本图元以自身的端点坐标为井字格,与之产生几何约束关系的第二基本图元的中心点格号。
18.线段相交属性包括端点坐标、线段数学表达式、交点坐标、夹角、长度比例;端点坐标由第一基本图元的两个坐标和第二基本图元的两个坐标组成、交点坐标为线段数学表达式的唯一解;夹角0
°‑
180
°
;长度比例为第一基本图元的总长度除以第二基本图元的总长度。
19.线段平行包括端点坐标、线段数学表达式、中点坐标、中点连线数学表达式、长度比例、中点距离比、中点连线夹角组成,端点坐标由第一基本图元的两个坐标和第二基本图元的两个坐标组成,中点坐标为第一、第二基本图元的端点坐标之和除以二,长度比例为第一基本图元的总长度除以第二基本图元的总长度,中点距离比为中点连线长度除以第一基本图元的长度,中点连线夹角为中点连线与第一基本图元的右夹角。
20.圆弧与直线包括端点坐标、圆心坐标、半径、交点坐标、直线位置、长度关系、中点距离比值,端点坐标包括直线基本图元的两个坐标,圆弧基本图元的两个坐标;圆心坐标、半径为圆弧的圆心坐标和半径值;直线位置包括相离、相切、相割、相交;长度关系为圆弧弧长除以直线长度;中点距离比值为圆心到直线距离除以半径。
21.几何位置关系包括:线段相交、线段平行、选段与圆弧、文字与线段、文字与圆弧的相互关系,几何位置关系进一步描述几个基本图元的相互关系。
22.通过上述几种常规的图形特点,能够将主要的识别构件以关键特征元素的方式表达,使之降维并结构化,更适应图像识别的逻辑。
23.对于不同的文档类别,由于都能够通过图名中的构件类别、表达方式确定图纸的绘制逻辑,因此可以通过树状结构进一步完成整体的逻辑识别。
24.符号特征树的广度优先算法的元素包括首要关键特征元素、重复特征元素、二级关键特征元素、文本元素、圆弧元素和直线元素。根据预设文档类别选取的关键特征图元,坐标最小值的关键特征图元为首要关键特征元素,同类关键特征图元为重复特征元素;根据预设文档类别选取的第二关键特征图元,坐标最小值的第二至第n关键特征图元为二级关键特征元素;根据首要关键特征元素>重复特征元素>二级关键特征元素>文本元素>圆弧
元素>直线元素的顺序以广度优先算法建立符号特征树。
25.广度优先算法,同广度优先搜索,又称作宽度优先搜索,或横向优先搜索,简称bfs,是一种图形搜索演算法。简单的说,bfs是从根节点开始,沿着树的宽度遍历树的节点,如果发现目标,则演算终止。广度优先搜索的实现一般采用open

closed表。
26.广度优先算法是一种盲目搜寻法,目的是系统地展开并检查图中的所有节点,以找寻结果。换句话说,它并不考虑结果的可能位置,彻底地搜索整张图,直到找到结果为止。bfs并不使用经验法则算法。
27.从算法的观点,所有因为展开节点而得到的子节点都会被加进一个先进先出的伫列中。一般的实际操作里,其邻居节点尚未被检验过的节点会被放置在一个被称为open的容器中(例如伫列或是链表),而被检验过的节点则被放置在被称为closed的容器中。(open

closed表)。
28.无论是图纸绘制过程还是图纸翻拍、图像识别的过程,都会存在误差,因此必须要设定一定的容差范围,容差范围过大导致识别错误量大,容差范围过小导致识别率低。
29.容差范围包括角度容差值、长度比值容差值、位置关系容差值;角度容差值包括线段相交关系容差值、线段平行关系中线夹角容差值等所能容忍的最大角度偏差值,预设值5
°
,可根据实际情况人工调整;长度比值容差值包括线段相交关系和线段平行关系的长度比值属性、圆弧与线段关系的弧长与线段长度比值属性,预设为0.2,可根据实际情况人工调整;位置关系容差值为线段相交、线段平行、选段与圆弧、文字与线段、文字与圆弧的九宫格相互关系,根据不同关键特征图元类别设置。
30.纠偏算法包括角度纠偏、长度纠偏和文字纠偏;角度纠偏为根据固定关键特征图元线段夹角为90
°
的特性,遍历基本图元并调整基本图元的坐标值以达到主要关键特征图元趋于90
°
,长度纠偏为根据与图元长度尺寸相关文字内容比对后,根据长度尺寸文字数值遍历基本图元并调整基本图元的坐标值以达到主要关键特征图元与尺寸文字相同。
31.文字纠偏包括关键词获取单元、错误分析单元、纠正单元、纠正单元;关键词获取单元用于获取关键词、错误分析单元用于将所述文字和关键词输入训练好的错误联想词库模型中,以从所述文档中识别出与关键词对应的待纠正部分,其中所述错误联想词库模型是根据错误样本与所述错误样本对应的准确词建立的;纠正模块用于将待纠正部分替换为所述关键词。
32.与现有bim数据获取的技术相比,对于脱机文档,本发明颠覆了只能通过人工翻模的陈旧模式,数据采集的速度大幅增加、成本大幅降低。对于cad矢量文档,本发明利用图像识别技术依然具备效率高、成本低的优势。特别的是,通过大批量的文档识别,建立了丰富的文档数据和关键特征元素,这些数据可以进一步提高识别效率和精度。
附图说明
33.附图示出了本公开的示例性实施方式,并与其说明一起用于解释本公开的原理,其中包括了这些附图以提供对本公开的进一步理解,并且附图包括在本说明书中并构成本说明书的一部分。
34.图1是从脱机文档获取bim数据的方法流程示意图;图2是线段位置井字格分布示意图;
图3是线段相交示意图;图4是线段平行示意图;图5线段与圆弧关系示意图;图6关键特征图元组示意图。
具体实施方式
35.下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
36.图1是从脱机文档获取bim数据的方法流程示意图,包括如下步骤:步骤s1: 读取通过特定的采集系统(摄像机、扫描仪)将图形以图像的方式采集到的脱机图纸文档。
37.步骤s2:遍历文档,对文档进行图形降噪处理后,利用图像识别将文档内图形识别为文字、直线、椭圆弧、椭圆、圆弧、圆及其他非二次曲线。
38.步骤s3:根据图形特点采集图元的坐标、长度、曲率、半径、文字内容等数据,根据图元相关性,判断各个图元的位置关系,提取相交、平行、凹凸性、闭合性、夹角等特征,将数并存入数据库对应容器。
39.步骤s4:利用几何结构算法,通过几何约束树进行图元数据对比,在容差范围内数据完全一致的,进行相关图元对比,相关图元关系达到触发值后,将该组图元定义为关键特征图元组。
40.步骤s5:关键特征图元组与数据库中预设文档类型中的预设关键特征图元对比,对比结果相符合后将关键特征图元组类别设定为预设关键特征元素,将类别属性存入数据库;对比结果不相符,采用人工干预方式确定类别。
41.步骤s6:通过预设的符号特征树,根据预设的关键特征元素为根节点,使用广度优先算法,广度优先遍历节点的顺序和节点之间的边信息,记录下来作为输入符号特征树的识别特征模板,存入数据库。
42.步骤s7:根据预设文档类型特征,判断识别特征模板的准确性,对比结果吻合的输出构件数据至数据库。
43.步骤s8:将未识别为关键特征图元、对比结果异常的图元,输出数据至未识别容器,通过二维显示系统读取,采用人工干预方式判定或修改,修改后的数据输出至数据库。
44.步骤s9:利用纠偏算法,通过关键特征图元的角度、长度、文字等特征,对数据纠偏。
45.步骤s10:将全部识别数据以特定输出格式输出为文档,利用bim软件打开。
46.几何结构算法包括几何约束关系和几何位置关系,所述几何约束关系包括线段相交、线段平行、圆弧与直线、文本与直线、文本与圆弧等2个图元之间的关系和凹凸性、闭合性等多图元的关系;所述几何位置关系是指将第一基本图元以自身的端点坐标为主轴的井字格,与之产生几何约束关系的第二基本图元的中心点格号。
47.在一个实施例中,参见图2,第一基本图元1为线段,在最大识别范围2内,以线段的
两个端点2坐标为主轴的井字格中,将识别范围2分割为9个部分,分别为左上部分4、上部分5、右上部分6、左部分7、中部分8、右部分9、左下部分10、下部分11、右下部分12。
48.在一个实施例中,参见图3,线段相交属性包括端点2坐标、线段数学表达式、交点14坐标、夹角15、长度比例;端点2坐标由第一基本图元1的两个坐标和第二基本图元13的两个坐标组成、交点14坐标为线段数学表达式的唯一解;夹角14为0
°‑
180
°
;长度比例为第一基本图元1的总长度除以第二基本图元13的总长度。
49.在一个实施例中,参见图4,线段平行包括端,2坐标、线段数学表达式、中点16坐标、中点连线17数学表达式、长度比例、中点距离比、中点连线夹角18组成,端点2坐标由第一基本图元1的两个坐标和第二基本图元13的两个坐标组成,中点坐标为第一基本图元1、第二基本图元13的端点2坐标之和除以二,长度比例为第一基本图元1的总长度除以第二基本图元13的总长度,中点距离比为中点连线17长度除以第一基本图元1的长度,中点连线夹角18为中点连线17与第一基本图元1的右夹角18。
50.在一个实施例中,参见图5,第一圆弧23与第一直线24包括端点坐标、圆心坐标、半径、交点坐标、直线位置、长度关系、中点距离比值,端点坐标包括直线基本图元的两个坐标,圆弧基本图元的两个坐标;圆心坐标、半径为圆弧的圆心坐标和半径值;直线位置包括相离19、相切20、相割21、相交22;长度关系为圆弧弧长除以直线长度;中点距离比值为圆心到直线距离除以半径。
51.在一个实施例中,参见图6,第一基本图元25与第二基本图元26符合线段相交且端点坐标相同,夹角14为90
°
、第一基本图元与第三27基本图元符合线段相交且端点坐标相同,夹角14为90
°
、第一基本图元与第四基本图元28符合线段平行;四个基本图元达到“矩形”触发值,定义为关键特征图元组。
52.对于不同的文档类别,由于都能够通过图名中的构件类别、表达方式确定图纸的绘制逻辑,因此可以通过树状结构进一步完成整体的逻辑识别。
53.符号特征树的广度优先算法的元素包括首要关键特征元素、重复特征元素、二级关键特征元素、文本元素、圆弧元素和直线元素。根据预设文档类别选取的关键特征图元,坐标最小值的关键特征图元为首要关键特征元素,同类关键特征图元为重复特征元素;根据预设文档类别选取的第二关键特征图元,坐标最小值的第二至第n关键特征图元为二级关键特征元素;根据首要关键特征元素>重复特征元素>二级关键特征元素>文本元素>圆弧元素>直线元素的顺序以广度优先算法建立符号特征树。
54.在一个实施例中,例如框架结构梁平面布置图,首要关键特征元素为图纸最左下角位置的矩形围合元素(柱构件关键特征),其他的矩形围合元素为重复特征元素;二级关键特征元素包括有平行元素(梁构件关键特征),线段与文字元素(尺寸标注关键特征、轴网编号关键特征)。根据梁平面布置图的符号特征树构建框架结构树。
55.无论是图纸绘制过程还是图纸翻拍、图像识别的过程,都会存在误差,因此必要要设定一定的容差范围,容差范围过大导致识别错误量大,容差范围过小导致识别率低。
56.容差范围包括角度容差值、长度比值容差值、位置关系容差值;角度容差值包括线段相交关系容差值、线段平行关系中线夹角容差值等所能容忍的最大角度偏差值,预设值5
°
,可根据实际情况人工调整;长度比值容差值包括线段相交关系和线段平行关系的长度比值属性、圆弧与线段关系的弧长与线段长度比值属性,预设为0.2,可根据实际情况人工
调整;位置关系容差值为线段相交、线段平行、选段与圆弧、文字与线段、文字与圆弧的九宫格相互关系,根据不同关键特征图元类别设置。
57.纠偏算法包括角度纠偏、长度纠偏和文字纠偏;角度纠偏为根据固定关键特征图元线段夹角为90
°
的特性,遍历基本图元并调整基本图元的坐标值以达到主要关键特征图元趋于90
°
,长度纠偏为根据与图元长度尺寸相关文字内容比对后,根据长度尺寸文字数值遍历基本图元并调整基本图元的坐标值以达到主要关键特征图元与尺寸文字相同。
58.文字纠偏包括关键词获取单元、错误分析单元、纠正单元、纠正单元;关键词获取单元用于获取关键词、错误分析单元用于将所述文字和关键词输入训练好的错误联想词库模型中,以从所述文档中识别出与关键词对应的待纠正部分,其中所述错误联想词库模型是根据错误样本与所述错误样本对应的准确词建立的;纠正模块用于将待纠正部分替换为所述关键词。
59.在本说明书的描述中,参考术语“一个实施例/方式”、“一些实施例/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例/方式或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施例/方式或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例/方式或示例以及不同实施例/方式或示例的特征进行结合和组合。
60.此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本技术的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
61.本领域的技术人员应当理解,上述实施方式仅仅是为了清楚地说明本公开,而并非是对本公开的范围进行限定。对于所属领域的技术人员而言,在上述公开的基础上还可以做出其它变化或变型,并且这些变化或变型仍处于本公开的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1