
转载自公众号:智能土木ABC
论文:Han, J., Lu, X. Z., & Lin, J. R. (2025). Pretrained graph neural network for embedding semantic, spatial, and topological data in building information models. Computer‐Aided Civil and Infrastructure Engineering.
DOI: https://doi.org/10.1111/mice.70073
00
太长不看版
BIM作为建设工程的完整数字模型,它不仅包括工程实体的三维形体,还囊括了丰富的语义、空间、材料等多维信息,是工程师知识与智慧的结晶。因此,如何高效挖掘、提炼并复用BIM蕴含的丰富工程知识,已成为行业和学界的关注焦点。近年来,大模型等先进AI技术的发展为解决类似难题带来了新思路。其基本思路是利用复杂的深度神经网络学习海量文本、图像等数据中的复杂规律,并将其应用于系列文本对话、图像处理识别等任务。然而,如何让大模型高效地学习和处理BIM模型丰富而又高度关联的语义、空间、拓扑特征仍是领域面临的基础性难题之一。
因此,本研究提出了首个面向BIM模型的大规模图神经网络——BIGNet,旨在学习并复用多维度的BIM设计特征。首先,研究构建了一种可扩展的图表示方法,将BIM构件的“语义-空间-拓扑”特征进行编码,并建立了包含近百万节点和350万边的超大规模数据集。随后,基于GraphMAE2模型,引入新的消息传递机制与节点掩码训练策略,提出并构建了BIGNet模型。
多项BIM相关设计任务测试显示,BIGNet表现出显著优势。 BIGNet相比未预训练模型在平均F1分数上提升了72.7%,充分证明了其在学习与迁移BIM设计知识方面的有效性。研究同时揭示了不同网络特征对其性能的影响:1)同构图比异构图在设计特征学习上效果更佳;2)在30厘米半径内引入局部空间关系能进一步提升性能;3)基于图注意力网络(GAT)的特征提取方案取得最佳迁移效果。有关研究为智能设计带来了新思路,也为未来BIM全生命周期的智能化管理奠定了基础。
01
研究背景
近年来,建筑信息模型(Building Information Modeling,BIM)在可视化、人机协同设计、全生命期评估等方面取得了广泛应用,为工程设计和施工带来极大的便利。BIM的价值在于,它不仅仅是一个三维模型,更是一个融合了语义、空间、材料等多维信息的完整数据模型。在大量历史BIM模型中,蕴藏着建筑门窗的常见取值范围、构件之间的空间布局和连接方式等“设计规律”。这些规律源于无数工程师的实践经验,凝结着宝贵的工程智慧。因此,如何从海量BIM数据中挖掘、提炼并复用这些知识,已经成为行业和学界共同关注的焦点。
与此同时,人工智能的发展为这一难题带来了新的契机。AI在处理非线性和模糊问题方面展现出强大能力,能够帮助我们从复杂的工程数据中学习规律。但BIM模型的数据结构复杂,既包含三维几何信息,也包含大量非几何信息,而机器学习通常需要结构化的数据作为输入。这就带来一个新的挑战:如何把庞杂的BIM数据表征(“翻译”)为便于机器理解的形式,成为智能建造迈向下一步的关键。
除了BIM模型本身数据表征复杂这一难题外,缺乏足够的标注数据也是制约深度学习在BIM领域应用的一大瓶颈。毕竟,人工标注往往耗时耗力,而建筑工程的专业性又使得标注成本更高。近几年兴起的大模型及预训练、迁移学习相结合的范式为这一问题提供了新的思路。该范式能够利用海量无标注数据进行自监督学习,从中提炼出复杂的设计规律和工程经验,而这些通用知识又可以迁移到不同任务中去使用。受此启发,本研究将探索通过预训练GNN大模型的方法实现从BIM模型中学习并复用多维度的设计特征,并支持多种下游任务。从而,利用BIGNet让隐藏在复杂BIM模型里的设计知识真正“活”起来,为智能化的建筑设计与施工提供了强有力的支撑。

图1 流程图
02
研究方法
2.1 面向BIM的可扩展图表示方法
针对三维模型表征难题,提出了BIM“语义-空间-拓扑”多维特征的图表征方法。具体而言,基于Revit软件的API 接口开发BIM数据特征提取算法,提取模型中不同专业构件的属性及其相互间的拓扑关系,并将其以图节点和节点属性的形式表征为网络图结构形式,从而为后续学习和迁移模型中的设计规律奠定数据集基础。具体的属性提取方法如表1所示,图构造方法如图2、3所示:
表1 构件语义、拓扑与空间特征的统一嵌入


图2 BIM模型的图表征方法

图3 BIM图表征示例
需要注意的是,图结构可以分为同构图(homogeneous graph)和异构图(heterogeneous graph)。在同构图中,所有节点都代表同一类型的实体,所有边也都是同一类型的关系;而在异构图中,节点和边的类型可以不同。不同的图结构会影响神经网络在训练时的消息传递机制,从而显著影响模型的学习效果。因此,在后续实验中,我们将比较两种图结构对模型性能的影响。
此外,本研究提出的表征方法可以将BIM模型中的错误检测转换为节点分类问题,从而显著简化模型审查任务。同时本方法也具有良好的可扩展性,可以根据实际应用中的下游任务增加或减少图节点和节点属性。
2.2 BIGNet架构
本研究借鉴了部分GraphMAE2图神经网络预训练的架构学习构件的隐式空间排布规律,并进行改进扩大了应用范围,使其同时适用于同构图和异构图。通过遮蔽输入图中部分节点的方法,将网络预训练问题转化为节点特征解码重构的问题,促使模型自监督学习从局部信息恢复整个图形结构,如图4所示。

图4 GraphMAE2架构
在BIM数据中,两个语义节点之间往往夹着一个拓扑或空间节点。为了让模型在学习时不仅关注单个构件,还能理解周边构件的属性,我们在编码器和解码器中都采用了两层GAT网络。这样既能保证信息传递的完整性,又能控制计算成本。相比之下,已有的GraphMAE2方法只适用于同构图,而本研究则进一步探索了同构图和异构图对模型表现的影响。考虑到构件之间真实的物理关系,我们还对消息传递机制进行了改进,如图5所示。

图5 两层GAT网络消息传递机制
BIGNet让模型在编码时不仅能看见单个构件,还能理解它与周围构件的空间与拓扑关系。这样一来,模型就能捕捉到BIM数据中更深层次的空间排布规律,同时具备更强的全局特征表达能力。得益于此,BIGNet在小样本条件下也能顺利完成迁移学习任务。需要说明的是,在下游应用中,我们只保留encoder,用它来生成特征嵌入或进行微调,decoder和projector则会被舍弃。
2.3 BIGNet在不同场景迁移学习中的表现
为了全面验证 BIGNet 的表现,我们挑选了工程中常见的三类错误场景:1)语义错误:构件的类别或属性设置不当,比如把墙体错误地建成了梁族,后续造价和维护就会出问题;2)取值范围错误:构件参数不符合行业规范,比如门的高度低于 200 cm 或高于 240 cm;3)拓扑关联错误:构件之间的连接关系出错或丢失,比如机电(MEP)构件与其连接件在修改或移动后出现缝隙,或者几何上虽相连,但属性关系却消失。需要注意的是本研究提出的方法可以实现将BIM模型中的错误检测转换为节点分类问题,如图6所示。

图6 将BIM审查问题转换为节点分类问题
BIGNet的迁移学习有两种方式:特征提取和微调。前者只用encoder提特征,后者会更新参数以适应新任务。分类器上,我们测试了MLP和GAT两种选择,最终形成三种方案:1)特征提取+MLP;2)特征提取+GAT;3)微调+MLP(如图7所示)。

图7 三种迁移学习策略
03
实验设置与结果
3.1 实验设置
本研究重点考察两组影响因素:1)图表征方法(参数见表2);2)迁移学习方法(参数见表3)。由于图表征与预训练、迁移学习属于相对独立的过程,本文不考虑二者的耦合效应。同时,为验证 BIGNet 的有效性,设置未预训练模型作为对照组。
表2 图表征方法探讨

表3 迁移学习方法探讨

3.2 实验结果
1) 不同图结构对模型性能的影响
实验结果表明:同构图比异构图更准、更快。虽然异构图能捕捉更多细节,但它太复杂、训练成本高,本研究里耗时甚至是同构图的5倍。反而是结构更简单的同构图,在小样本和有限资源条件下表现更好,也证明它足以让模型学到有效的节点关系。

图8 不同图结构的F1分数
2) 空间关系取值范围对模型性能的影响
从图8可知,0.3 米的空间范围比 0.6 米更合适。虽然更大的范围能带来更多位置信息,但也让节点数暴增,增加了错误与正确节点的不平衡;而范围太小又会信息不足,导致判断失准。最终结果表明,0.3 米是最佳平衡点:既保证了信息充足,又避免了过度复杂。在后续研究中,我们也将空间关系的取值范围固定为 0.3 米。
3) 不同迁移学习方法对模型性能的影响
从图9可知,在异构图中,微调(Fine-tuning)是效果最好的方法,原因在于数据量有限,直接从头训练难以奏效,微调现有参数更合适。但整体来看,异构图的表现还是不如同构图,这和之前的分析一致。因此,我们后续重点关注同构图的结果。

图9 不同迁移学习方法的F1分数
此外,和传统方法比,我们的方法在F1-score上提升了59.5%(MLP)和72.7%(GAT)。这说明它不仅能学到构件的属性,还能理解构件间的拓扑和空间关系,从而大幅提升模型对隐含设计规律的捕捉能力。换句话说,我们提出的BIM专属图数据集和预训练模型,让错误检测更准、更快,也能适用于多种BIM模型校核任务。
04
研究结论
本研究探索提出了基于大模型从既有BIM模型中提取、学习与复用设计经验的方法。首先,提出了一种针对BIM模型“语义-空间-拓扑”多维特征的图表征方法,并构建了相应的大规模预训练图神经网络BIGNet。据我们所知,这是直接面向多维BIM图数据构建大型预训练网络的初始探索。随后,通过基于迁移学习的多项BIM模型审查任务验证了所提方法的有效性,得到以下结论:
(1) 当重点考虑构件 0.3 m 临近区域的空间关系,并将BIM表征为同构图进行预训练后,采用Feature extraction + GAT的迁移方式在审查任务中取得了最佳性能;
(2) 与未预训练的模型相比,本文方法在BIM模型审查任务中的平均F1分数提升了59.5%(MLP分类器)和72.7%(GAT分类器),能够在建筑全生命周期中提供更精准、全面的信息支持;
(3) 本方法适用于多类BIM模型审查任务,并在错误样本识别上更加严格,仅有极少数错误节点被误判为正确,进一步体现了方法的可靠性。
本研究突破了BIM数据复杂设计知识表征与提取的瓶颈,为未来迁移学习在BIM数据利用中的应用奠定了基础。
引用本文: Han, J., Lu, X.Z., Lin, J.R.* (2025). Pretrained Graph Neural Network for Embedding Semantic, Spatial, and Topological Data in Building Information Models. Computer-Aided Civil and Infrastructure Engineering, 1-25. doi: 10.1111/mice.70073
---End---
建筑结构生成式智能设计软件:
相关研究
学术报告视频
专著
人工智能与机器学习
---结构智能设计
建筑平面您说咋改就咋改,剩下的都交给AI了|新论文:ChatHouseDiffusion:提示词引导的建筑平面图生成与编辑方法
三大生成式AI + 三大优化算法,谁是BRB加固设计的最优组合?| 新论文:钢筋混凝土框架结构BRB智能加固设计方法对比分析
---其他土木工程领域人工智能研究
城市灾害模拟与韧性城市
高性能结构与防倒塌
新论文:抗震&防连续倒塌:一种新型构造措施
长按识别二维码,关注我们的科研动态
