基于深度强化学习的有限元网格优化方法、设备和介质与流程

文档序号:26195368发布日期:2021-08-06 18:49阅读:391来源:国知局
基于深度强化学习的有限元网格优化方法、设备和介质与流程
本发明涉及网格划分领域,具体而言,涉及一种基于深度强化学习的有限元网格优化方法、设备和介质。
背景技术
:有限元网格划分常见的方式有几何编码拓扑、图形编码拓扑、相似性启发式拓扑和字符编码拓扑。在主流计算机辅助工程(computeraidedengineering,cae)仿真软件中,网格划分底层采用的是几何编码拓扑的方式来实现的。cae是汽车研发过程中非常重要的环节,其中网格划分工作是最为基础、重要的前置工作。网格工作占据了汽车研发仿真50%左右的工作量,同时网格的质量对仿真结果也有较大的影响。因此,如何提高网格划分效率并保证网格质量,是汽车研发仿真领域亟待解决的痛点需求。一直以来,网格划分多采用手动操作,且网格质量取决于工程师的技术经验。目前主流商业软件的batchmesh功能可以完成网格初步划分,但其所生成的网格也不能完全满足分析计算的要求,且仍有大量工作需要手动操作来优化调整。有鉴于此,特提出本发明。技术实现要素:本发明实施例提供一种基于深度强化学习的有限元网格优化方法、设备和介质,以提高网格划分的效率和精度。第一方面,本申请实施例提供了一种基于深度强化学习的有限元网格优化方法,包括:获取几何模型的初始有限元网格数据;根据所述初始有限元网格数据,生成所述几何模型的三维模型;采用检测网络对所述三维模型进行特征识别和分类,得到所述三维模型的局部特征和所述局部特征的分类结果;所述分类结果包括合理和不合理;将不合理的局部特征输入至优化网络,通过所述优化网络按照优化策略对所述局部特征对应的局部有限元网格数据进行调整,以使调整后有限元网格数据的网格质量达到设定要求;其中,所述优化网络通过局部特征样本进行深度学习得到;捕捉用户对调整后有限元网格数据的再调整策略,将所述再调整策略作为正向激励对所述优化网络进行强化学习,以更新所述优化网络;并采用更新后的优化网络继续优化所述调整后有限元网格数据。第二方面,本发明实施例还提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现任一实施例所述的基于深度强化学习的有限元网格优化方法。第三方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例所述的基于深度强化学习的有限元网格优化方法。本实施例通过自主构建三维模型结合深度神经网络检测有限元网格需优化的局部特征、通过优化网络与检测结果的迭代交互优化有限元网格质量,通过深度强化学习微调网格自主学习优化方法,实现基于人工智能的有限元网格质量优化方案,提高了网格优化的质量和效率。附图说明为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例提供的一种基于深度强化学习的有限元网格优化方法的流程图;图2是本发明实施例提供的处理前后的对比图;图3是本发明提供的检测网络的结构示意图;图4是本发明实施例提供的优化网络的深度学习示意图;图5是本发明实施例提供的采用优化网络进行优化的示意图;图6是本发明实施例提供的一网格片段的优化过程示意图;图7是本发明实施例提供的基于马尔可夫决策过程的示意图;图8是本发明实施例提供的仿真业务场景下深度强化学习模型的示意图;图9是本发明实施例提供的采用batchmesh划分前围板网格的示意图;图10是本发明实施例提供的按照深度强化学习算法划分前围板网格的示意图;图11是本发明实施例提供的采用batchmesh划分前围板之加强板筋网格的示意图;图12是本发明实施例提供的按照深度强化学习算法划分前围板之加强板筋网格的示意图;图13是本发明实施例提供的采用batchmesh划分前围板之凸台网格的示意图;图14是本发明实施例提供的按照深度强化学习算法划分前围板之凸台网格的示意图;图15是本发明实施例提供的采用batchmesh划分翻边网格的示意图;图16是本发明实施例提供的按照深度强化学习算法划分翻边网格的示意图;图17为本发明实施例提供的一种电子设备的结构示意图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行清楚、完整的描述。显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施例,都属于本发明所保护的范围。在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。图1是本发明实施例提供的一种基于深度强化学习的有限元网格优化方法的流程图,适用于对有限元网格数据进行优化的情况,本实施例由电子设备来执行。该方法包括以下操作:s110、获取几何模型的初始有限元网格数据。将几何模型(例如汽车元件的几何模型)输入至仿真软件cae中,通过该仿真软件cae采用几何编码拓扑方法划分网格,得到初始有限元网格数据。cae基于几何编码拓扑的方式生成有限元网格,没有考虑到几何模型的局部特征,网格精度有限,本方案在此初始有限元网格的基础上进行优化。s120、根据所述初始有限元网格数据,生成所述几何模型的三维模型。本操作的意义在于:后续要采用检测网络进行特征识别和分类操作,然而目前的检测网络仅针对拥有完整的边、顶点和面片描述的三维模型,对信息有限的有限元网格数据则不适用。基于此,为了能更好的抽象局部特征,也为了能在优化阶段更好的编辑和更新有限元网格,根据原始有限元网格数据构建可编辑的三维数据结构。初始有限元网格数据包括各顶点的标识和三维坐标,各顶点所在的面,以及同一面上各顶点的连接顺序。首先定义三维模型的几何表达:由于几何模型自动生成的初始有限元网格数据可以被看作是流行网络,即每个边最多被两个面片共用,因此考虑以半边结构为基础构建三维模型。主要包含三种基础类型的数据,在这些数据应该存储这些数据的信息、其相关属性以及三种数据之间的连接关系。这三种基础数据包含vertexinfo.,faceinfo.和edgeinfo.,详细信息如下:(1)vertexinfo:主要存储顶点标识(nodeid),空间坐标下x,y,z值,以及法线信息(normal)等。(2)faceinfo:主要存储面片标识(gridid),面片包含的顶点集信息。如果grid对应了三个顶点则代表该面片是一个三角网格,那么该faceinfo.包含三个顶点信息,若是gird对应四格顶点则代表该面片代表四边形网格,存储的就是四个顶点的信息。(3)edgeinfo:主要存储边的id,边包含的两个顶点信息,公用此边的两个面片信息。这里需要注意的是,由于在一些特殊情况下,几何模型自动生成的初始有限元网格数据可能产生孤立边,此时应该调用智能模块做删除边,或者合并顶点等处理。建立三维模型过程的核心是建立初始有限元网格数据的关联的过程,即构建数据结构的过程,而在这个过程中,与顶点、面片和边信息相关联的信息尤为重要,该信息可以满足下面关联信息的查询要求:(1)对于给定的边,需要查询的连接关系应该包含:该边用到的点信息和分享该边的面片信息。其中如果一条边关联的顶点数量大于2,需要记录并做进一步的处理。(2)对于给定的点,需要查询的连接关系应该包含:该点关联的所有边,并且这些边应该以逆时针顺序给出;该点关联的所有面片,并且这些面片应该以逆时针顺序给出。(3)对于给定的面片,需要查询的连接关系应该包含:该面片关联的所有面片,并且这些面片应该以逆时针顺序给出。在上述定义的基础上,三维模型的生成过程包括:根据所述初始有限元网格数据,以半边结构为基础,依次构建所述几何模型的边、顶点和面片;其中,所述边包括各半边关联的顶点和分享各半边的面片;所述顶点包括顶点的标识、三维坐标、从所述顶点出发的边的集合以及包括所述顶点的面片集合;所述面片包括面片的标识、组成所述面片的顶点集合,以及组成所述面片的边集合。考虑基于半边数据结构作为设计基础,不再存储整边信息,因此不再记边为最小单位进行查询。将整边分为两个半边,以半边来作为基本单位来查询。将一条整边一分为二,其中一条半边属于它一个相邻面的边环,而另一条半边属于它另一个相邻面的边环。每一条半边仅存储它的起点指针,这样两条半边能够表示一条边的两个端点,当搜索一个面的各端点时,只需沿着半边顺序即可。具体方法如下:(1)边的构建根据边的种类对边进行标记,不同种类边(包括边界边,一般边和需进一步处理的边)的查询和处理使用不同方法。其中,边界边指的是该边只属于一个面片。对于边界边,只有一个方向的边有关联的面片,但两个方向的边有关联的顶点。对于一般边,将该边分为两边,这两个边设为相反的方向,建立每条半边与对应面片的连接关系,建立每条半边与对应顶点的连接关系。对于需进一步处理的边,处理方法依据边的拓扑特征来处理。图2是本发明实施例提供的处理前后的对比图。左侧图虚线框中两个黑点之间的边需要进一步处理。根据综合信息(包括该边的长度,与邻边的点积大小,边是否具备删除条件)判断将要处理的方法,假设判断后得出的结论是应该合并两个黑点,则合并后得到结果如图2右侧所示。(2)顶点的构建存储每个顶点包含标识id信息,三维坐标,从该顶点出发的边的集合,包含该顶点的面片集合。每个结点可通过循环器得到某一个结点的环邻域(1-ring),不再需要类似于基于面片结构中的分支判断语句得到1-ring邻域。(3)面片的构建存储每个面片包含其id信息,组成面片的顶点集合,通过顶点集合可以得到组成该面片的边集合。本方法选择自主构建三维数据结构的原因是,选用半边数据结构作为基础不仅保留了存储顶点和面片这一信息,也存储了半边信息。本结构形式可以灵活改变顶点,边以及面片,支持顶点和拓扑结构的添加、修改和删除。一方面满足本案存储自定义的初始有限元网格数据的功能需求,另一方面信息查询效率高。自主构建的三维数据结构保证优化过程中生成的离散网格数据在初始几何特征信息的合理范围内,不脱离原始几何特征信息,并保证在分析和更新三维数据的过程中享有更高自由度。也就是说,自主构建的三维数据结构可以自由编辑;初始有限元网格信息是依附在几何模型上面的,自主构建的三维数据自由编辑的前提是不能脱离几何模型。s130、采用检测网络对所述三维模型进行特征识别和分类,得到所述三维模型的局部特征和所述局部特征的分类结果;所述分类结果包括合理和不合理。检测网络的输入为组成三维模型的三维数据结构(主要是顶点以及拓扑连接关系),输出为局部特征(包括:单元格之间的形状、角度等;以及单元格的聚类特征:如孔、圆角、翻边等特殊几何结构;构成特征图像的顶点id值、三维坐标),以及局部特征的分类结果(即哪些特征是规则/合理的,哪些是不规则/合理的)。可见,检测网络具备特征识别功能+特征分类功能。为实现这两个功能,检测网络的结构如图3所示,包括pointnet++网络、geo网络、特征融合网络、权重特征提取网络和分类网络。图3中的n*b,表示每次训练的样本个数,其中n为顶点的个数,b为batchsize。pointnet++网络为三层pointnet++层,每一层结构为[knn,fc,max-pooling];geo网络为[geoconv,mlp,geoconv,mlp]四层算子。一方面,将所述三维模型的三维数据结构(类似于三维点云)分别输入至所述pointnet++网络和geo网络,得到所述pointnet++网络输出的第一特征和所述geo网络输出的第二特征。将所述第一特征和所述第二特征连接后输入至特征融合网络,通过所述特征融合网络对连接后的特征进行融合得到第三特征。由图3可见,特征融合网络为[geoconv,mlp]算子。本实施例之所以选择pointnet++和geo联合提取特征是因为:pointnet++对每个点进行单独处理,而忽略了点与点之间的关系的问题,geo对点与点之间的连接关系处理效果则更好,所以选择了两种方式相结合。另一方面,将初始权重输入至权重特征提取网络(为四层mlp层),得到权重特征;其中,初始权重是设定的一个初始值。将所述权重特征和第三特征对应相乘,可以理解成事件即点坐标特征*概率。将相乘后的结果输入至所述分类网络,得到所述分类网络输出的局部特征和局部特征的分类结果。分类网络为四层mlp层,实质是一个基于神经网络的分类网络。下面介绍检测网络的训练过程:检测网络的训练集包含三维模型的局部特征。此外,按照人的经验,对局部特征进行合理/不合理标注。采用该训练集训练前述检测网络,使检测网络具有特征识别+分类功能。在构建训练集时会开展数据清洗、数据标注、数据增强工作。数据清洗是指,识别并标识正负样本,保留有效样本数据,更正或去除无效样本数据;数据增强是指,对原始网格数据特征进行旋转、缩放、增加行或列网格等几何变换来获取额外的训练数据。本实施例主要通过构建的三维模型得到几何与网格信息,使用网格上的顶点信息及拓扑连接关系作为输入,对数据进行基于深度学习方法的模糊检测(在此处只检测对应检测区域中是否有不合理的网格单元,只反馈是和否,不反馈具体区域id和对应坐标,所以称之为模糊检测)。检测方法从局部顶点特征进行学习,最终得到顶点预测结果。考虑将网格上的顶点看作类似三维点云集,使用分类思想,对顶点排列是否合理,连接是否合理进行分类,将问题简化为有限分类问题。s140、将不合理的局部特征输入至优化网络,通过所述优化网络按照优化策略对所述局部特征对应的局部有限元网格数据进行调整,以使调整后有限元网格数据的网格质量达到设定要求;其中,所述优化网络通过局部特征样本进行深度学习得到。检测网络识别到不合理的局部特征,需要通过优化网络进行调整。优化网络具体为基于深度学习的人工智能网络,通过与检测网络进行交互,实现总体网格质量的提升。为了实现策略推理和交互,优化网络的构建包括以下几个部分:(1)建立数据库。在数据库中初始化存储事实集合,主要包括三维模型的局部特征、特征区域位置信息、具体到顶点位置、网格边长度区间、网格边角度数等。(2)建立知识库,设置相对应的初始化规则集合,对初始化规则进行编码提高效率。根据多边形几何特征使用卷积神经网络进行分类,对于网格的调整分为网格微调和更改网格拓扑机构,网格微调中有局部顶点移动和局部网格平滑、整体平滑等,具体指指调整网格线的长度、三角形或四边形角度、曲线拟合、aspectratio、偏斜度(skewness)、翘曲(warping)等。网格拓扑结构包括网格边拆分,网格顶点替代、网格单元合并和删除等。网格拓扑结构调整包括网格边拆分(split操作)、网格顶点替代(paste操作)、网格单元合并(combine操作)等有明确指令的操作。(3)建立推理机(inferenceengine)模型,使用检测出的局部特征作为输入,根据规则推导优化策略。利用多层感知机学习修改网格策略,同时选择网格质量快速提升的最佳推理路径,逐渐对优化网络提出修改的建议。其中,网格质量可以采用仿真软件cae中的评分表示,分数越低,质量越高。(4)建立优化网络与检测网络的交互,扩展优化网络的外部接口,使得优化网络可以和外部数据(例如三维模型和网格数据)和外部模块(例如检测网络)进行迭代交互,迭代中逐步加入新知识和事实,被推理机使用可进一步优化推理机。可以根据已有的事实数据,调用外部模块更新规则,并且可以查询外部的三维模型数据与检测结果作为推理依据。至此,完成优化网络的构建。优化网络通过局部特征样本进行深度学习得到,图4是本发明实施例提供的优化网络的深度学习示意图。首先基于网格大数据进行数据加工,针对已有网格数据,进行重新网格化(reconstruct)操作,得到成对的网格样本,在生成网格样本时要实现高中低样本全覆盖的目的。分别根据各网格样本生成三维模型,并将三维模型输入至已训练好的检测网络,输出不合理的局部特征样本。将不合理的局部特征输样本入至优化网络,基于知识库和推理机得到局部特征样本的一步优化策略;按照所述一步优化策略对所述局部特征样本对应的局部网格样本进行调整。选择网格质量快速提升的最佳推理路径,逐渐对优化网络提出修改的建议,直到当前网格样本的网格质量达到设定要求。图5是本发明实施例提供的采用优化网络进行优化的示意图,将不合理的局部特征输入至优化网络,基于所述优化网络中的推理机和知识库得到所述局部特征的一步优化策略;按照所述一步优化策略对所述局部特征对应的局部有限元网格数据进行调整;获取(前次调整后的)当前有限元网格数据的网格质量,判断所述当前有限元网格数据的网格质量是否达到设定要求。如果所述当前有限元网格数据的网格质量未达到设定要求,则整个网格中还存在不合理的部分,需要继续进行优化,那么生成所述当前有限元网格数据的三维模型,并返回所述特征识别和分类操作,识别出不合理的局部特征,并继续将局部特征输入至优化网络,以此类推,直到所述当前有限元网格数据的网格质量达到设定要求。可选的,在所述将不合理的局部特征输入至优化网络,通过所述优化网络按照优化策略对所述局部特征对应的局部有限元网格数据进行调整,以使调整后有限元网格数据的网格质量达到设定要求之前,还包括:获取所述初始有限元网格数据的网格质量。相应的,所述如果所述当前有限元网格数据的网格质量未达到设定要求,生成所述当前有限元网格数据的三维模型,包括:如果所述当前有限元网格数据的网格质量未达到设定要求,判断当前有限元网格数据的网格质量是否高于所述初始有限元网格数据的网格质量;如果是,说明前一步优化策略可行,但整体质量不高,则接受前一步优化策略并生成所述当前有限元网格数据的三维模型;如果否,说明前一步优化策略不可行且整体质量不高,则按照前一步优化策略对所述局部有限元网格数据进行回滚后,生成当前有限元网格数据的三维模型,也就是撤销前一步优化策略。可选的,获取当前有限元网格数据的网格质量采用自动的方式,对仿真软件的应用程序编程接口api进行二次开发,一方面,写仿真软件底层函数,解决了算法在自动调整网格过程中的鼠标、键盘等资源占用问题,方便仿真工程人员在网格调整过程中,进行其他工作;另一方面,预先选定网格质量参数和评分标准(例如角度、共顶点),固化到仿真软件中,不需要用户手动操作。调用所述仿真软件的应用程序编程接口api,依据预先选定的质量参数以及评分标准对所述当前有限元网格数据进行自动评分(评分过程也不需要用户手动操作);并将分数作为所述网格质量。同理,还可以获取所述初始有限元网格数据的网格质量。基于上述描述,判断所述当前有限元网格数据的网格质量是否达到设定要求包括:判断当前有限元网格数据的分数是否低于设定值,如30。需要对图5进行详细说明的是,由于三维模型与初始有限元网络数据的几何结构相同,可直接在自主构建的三维模型上优化(即生成当前有限元网格数据的三维模型),优化完成后,需同步到初始有限元网格数据实现调整,得到当前有限元网格数据。同步完成后,调用api自动评分。(这样操作的原因在于检测和优化都是针对三维模型而言的,但是由于三维模型和有限元网格实质是一样的,所以可以把对三维模型的优化映射到网格上,从而利用仿真软件对网格进行评分,也就是对三维模型进行评分;而仿真软件是不能对三维模型评分的,分数可理解成不合格的单元的个数,分数越高说明网格调整效果越差)。如果分数低于初始有限元网格数据的分数,将该三维模型输入至检测网络中,进行该优化策略的下一步调整;如果分数高于初始有限元网格数据的分数,将前步优化策略进行回滚,并将三维模型输入至检测网络中。如此循环,得到评分最低的网格,也就同步得到质量最好的网格。在一具体应用场景中,以一个网格片段(作为初始有限元网格数据)为例,通过检测网络得到该网格片段的局部特征,采用优化网络与检测网络交互进行优化。图6是本发明实施例提供的一网格片段的优化过程示意图,左侧inputx是输入至检测网络的网格片段,右侧outputy是优化后的网格片段,中间虚线部分是优化过程。当存在多个不合理局部特征时,对每个不合理之处优化的优先级,应依赖已经建立好的知识库。图6中是顺序执行的过程,仅作为示例解释优化过程。从图(a)中可以看到网格片段中包含多个局部特征,通过检测网络检测到(b)中方框标出的不合理的局部特征,根据优化网络中的推理机选择优化策略,优化后得到(c)网格。(c)网格质量未得到设定要求,则将(c)网格生成对应的三维模型,并通过检测网络对该三维模型进行检测,得到(d)中方框标出的不合理的局部特征,根据优化网络中的推理机选择优化策略,优化后得到(e)网格;(e)网格质量未得到设定要求,则将(e)网格生成对应的三维模型,并通过检测网络对该三维模型进行检测,得到(f)中方框标出的不合理的局部特征。根据优化网络中的推理机选择优化策略,优化后得到y,y网格质量未得到设定要求,操作结束。s150、捕捉用户对调整后有限元网格数据的再调整策略,将所述再调整策略作为正向激励对所述优化网络进行强化学习,以更新所述优化网络;并采用更新后的优化网络继续优化所述调整后有限元网格数据。在s150之前,优化网络的推理机来源于深度学习。在实际使用优化网络的过程中,s150继续针对优化网络进行网格改进能力训化,即强化学习,深度强化建模完成后,在用户调整网格的过程中模型会记录再调整策略,即手动操作动作,作为正向激励反馈给优化网络,优化网络不断优化,完善自身算法,最终实现高能力的优化网络。进一步采用该优化网络继续优化所述调整后有限元网格数据,从而进一步提高有限元网格数据的质量。具体的,将所述再调整策略作为正向激励对所述优化网络进行强化学习,包括:预先定义动作集、状态集和奖励机制;其中,所述动作集包括对网格的多个再调整策略,所述状态集包括多个局部特征,所述奖励机制为依据在调整策略前后的有限元网格数据的网格质量之差,决定是否给予奖励;基于马尔可夫决策过程,利用所述动作集、状态集和奖励机制,决定所述再调整策略给予奖励,并对所述优化网络进行强化学习。其中,动作集包括仿真软件中的网格调整操作paste、split、origin、combine、elementjoin、swap、move、smooth、scale、rotate、number、edgejoin等。状态集包括三角形正对、三角形错位对、三角形背对、三角形错位背对、三角形共节点、washer垫圈、塑料件。奖励机制为依据对不合理的网格单元进行网格自动调整前后的质量得分差值,决定是否给予奖励,若调整后得分-评判前得分>0,则作为正向激励反馈给优化网络。深度强化学习方案基于马尔可夫决策过程(mdp),针对系统任务进行动态的建模。建模后得到每个时刻的网格顶点的状态,结合cae仿真软件底层函数,建立起适配任务环境。此外,还需通过目前较为成熟的深度学习算法(ppo、ddpg等)构建可以自主学习的ai-brain,具体算法如图7所示。在任务环境(taskenvironment)中,考虑系统在t时刻下处于st状态,ai-brain会自主选择策略来处理事态,系统会在训练过程中不断迭代st,并记录系统的最优策略。对于该项目的策略目标设计,拟采用ddpg进行策略优化,从而得到做出优化的策略。经过若干论迭代,系统将会自主训练出最佳决策策略。以其中一种状态为例:调整后有限元网格数据→构建三维模型→质量评分a→检测不合理的局部特征(对应状态集,如检测出含有状态集里的三角形背对的情况)→用户调整网格(触发动作,如针对三角形背对的状态,进行paste操作→质量评判b→评判b-a差数值大于0→作为正激励反馈给优化网络(优化网络下次遇到同样的状态集,即三角形背对的情况时,会优先选择paste操作)。图8是本发明实施例提供的仿真业务场景下深度强化学习模型的示意图。参见图8,本实施例通过自主构建三维模型结合深度神经网络检测有限元网格需优化的局部特征、通过优化网络与检测结果的迭代交互优化有限元网格质量,通过深度强化学习微调网格自主学习优化方法,实现基于人工智能的有限元网格质量优化方案。整个技术路线需要结合多种人工智能技术包括深度学习、专家系统和深度强化学习,以及多种神经网络及算法作为模型设计基础,考虑算法和软件的跨平台性以及算法自动调用仿真软件底层命令的需求,设计和实现语言主要使用python,结合上述提到的整体解决方法实现并解决对汽车元件有限元网格的自动优化问题。为验证深度强化学习算法的有效性,本实施例选取了具有长圆孔、阴阳台、加强筋等不规则典型几何特征的前围板,对比网格深度强化学习的网格自动划分技术和传统batchmesh结合手动调整的方式,从网格划分质量和效率两方面开展对比。(1)效率验证选取了前围板整体网格,以及加强板筋、凸台、翻边等典型特征网格数据,从网格整体和局部质量进行了对比。图9是本发明实施例提供的采用batchmesh划分前围板网格的示意图,图10是本发明实施例提供的按照深度强化学习算法划分前围板网格的示意图。图11是本发明实施例提供的采用batchmesh划分前围板之加强板筋网格的示意图,图12是本发明实施例提供的按照深度强化学习算法划分前围板之加强板筋网格的示意图,图13是本发明实施例提供的采用batchmesh划分前围板之凸台网格的示意图,图14是本发明实施例提供的按照深度强化学习算法划分前围板之凸台网格的示意图,图15是本发明实施例提供的采用batchmesh划分翻边网格的示意图,图16是本发明实施例提供的按照深度强化学习算法划分翻边网格的示意图。参见图中标记出的位置,从最终网格质量上可以看出本实施例提供的方案相对batchmesh能够较好的保证网格划分的质量,网格质量效果达到了行业成熟的网格划分专业工程师水平。(2)质量验证在保证了较高网格质量的基础上,对基于深度强化学习算法的优化网络的效率进行了验证,选取了前围板、白车身、四门两盖等,涵盖钣金件、塑料件的典型部件进行手动划分和算法模型自动划分对比,从结果上看,优化网络能有效提升仿真网格划分效率,针对钣金件整体网格划分效率能提升75%及以上,塑料件网格划分效率提升60%及以上。如表所示:表优化网格划分效率验证(单位:小时)前围板前车门发动机罩副车架驾驶员座椅a柱上护板前门内板手动调整8241624321076优化网络≤1≤6≤4≤5≤8≤4≤30效率提升87.5%75%75%79.17%75.00%60.00%60.52%图17为本发明实施例提供的一种电子设备的结构示意图,如图17所示,该设备包括处理器20、存储器21、输入装置22和输出装置23;设备中处理器20的数量可以是一个或多个,图17中以一个处理器20为例;设备中的处理器20、存储器21、输入装置22和输出装置23可以通过总线或其他方式连接,图17中以通过总线连接为例。存储器21作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的动态场景数据的导入方法对应的程序指令/模块。处理器20通过运行存储在存储器21中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的动态场景数据的导入方法。存储器21可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器21可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器21可进一步包括相对于处理器20远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。输入装置22可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。输出装置23可包括显示屏等显示设备。本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现任一实施例的动态场景数据的导入方法。本申请实施例的计算机存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如”c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(lan)或广域网(wan),连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1