新论文 | BIGNet：融合BIM语义、空间、拓扑多维表征的预训练图神经网络

韩进陆新征课题组

2025年10月16日 16:00

转载自公众号：智能土木ABC

论文：Han, J., Lu, X. Z., & Lin, J. R. (2025). Pretrained graph neural network for embedding semantic, spatial, and topological data in building information models. Computer‐Aided Civil and Infrastructure Engineering.

DOI: https://doi.org/10.1111/mice.70073

太长不看版

BIM作为建设工程的完整数字模型，它不仅包括工程实体的三维形体，还囊括了丰富的语义、空间、材料等多维信息，是工程师知识与智慧的结晶。因此，如何高效挖掘、提炼并复用BIM蕴含的丰富工程知识，已成为行业和学界的关注焦点。近年来，大模型等先进AI技术的发展为解决类似难题带来了新思路。其基本思路是利用复杂的深度神经网络学习海量文本、图像等数据中的复杂规律，并将其应用于系列文本对话、图像处理识别等任务。然而，如何让大模型高效地学习和处理BIM模型丰富而又高度关联的语义、空间、拓扑特征仍是领域面临的基础性难题之一。

因此，本研究提出了首个面向BIM模型的大规模图神经网络——BIGNet，旨在学习并复用多维度的BIM设计特征。首先，研究构建了一种可扩展的图表示方法，将BIM构件的“语义-空间-拓扑”特征进行编码，并建立了包含近百万节点和350万边的超大规模数据集。随后，基于GraphMAE2模型，引入新的消息传递机制与节点掩码训练策略，提出并构建了BIGNet模型。

多项BIM相关设计任务测试显示，BIGNet表现出显著优势。 BIGNet相比未预训练模型在平均F1分数上提升了72.7%，充分证明了其在学习与迁移BIM设计知识方面的有效性。研究同时揭示了不同网络特征对其性能的影响：1）同构图比异构图在设计特征学习上效果更佳；2）在30厘米半径内引入局部空间关系能进一步提升性能；3）基于图注意力网络（GAT）的特征提取方案取得最佳迁移效果。有关研究为智能设计带来了新思路，也为未来BIM全生命周期的智能化管理奠定了基础。

研究背景

近年来，建筑信息模型（Building Information Modeling，BIM）在可视化、人机协同设计、全生命期评估等方面取得了广泛应用，为工程设计和施工带来极大的便利。BIM的价值在于，它不仅仅是一个三维模型，更是一个融合了语义、空间、材料等多维信息的完整数据模型。在大量历史BIM模型中，蕴藏着建筑门窗的常见取值范围、构件之间的空间布局和连接方式等“设计规律”。这些规律源于无数工程师的实践经验，凝结着宝贵的工程智慧。因此，如何从海量BIM数据中挖掘、提炼并复用这些知识，已经成为行业和学界共同关注的焦点。

与此同时，人工智能的发展为这一难题带来了新的契机。AI在处理非线性和模糊问题方面展现出强大能力，能够帮助我们从复杂的工程数据中学习规律。但BIM模型的数据结构复杂，既包含三维几何信息，也包含大量非几何信息，而机器学习通常需要结构化的数据作为输入。这就带来一个新的挑战：如何把庞杂的BIM数据表征（“翻译”）为便于机器理解的形式，成为智能建造迈向下一步的关键。

除了BIM模型本身数据表征复杂这一难题外，缺乏足够的标注数据也是制约深度学习在BIM领域应用的一大瓶颈。毕竟，人工标注往往耗时耗力，而建筑工程的专业性又使得标注成本更高。近几年兴起的大模型及预训练、迁移学习相结合的范式为这一问题提供了新的思路。该范式能够利用海量无标注数据进行自监督学习，从中提炼出复杂的设计规律和工程经验，而这些通用知识又可以迁移到不同任务中去使用。受此启发，本研究将探索通过预训练GNN大模型的方法实现从BIM模型中学习并复用多维度的设计特征，并支持多种下游任务。从而，利用BIGNet让隐藏在复杂BIM模型里的设计知识真正“活”起来，为智能化的建筑设计与施工提供了强有力的支撑。

图1 流程图

研究方法

2.1 面向BIM的可扩展图表示方法

针对三维模型表征难题，提出了BIM“语义-空间-拓扑”多维特征的图表征方法。具体而言，基于Revit软件的API 接口开发BIM数据特征提取算法，提取模型中不同专业构件的属性及其相互间的拓扑关系，并将其以图节点和节点属性的形式表征为网络图结构形式，从而为后续学习和迁移模型中的设计规律奠定数据集基础。具体的属性提取方法如表1所示，图构造方法如图2、3所示：

表1 构件语义、拓扑与空间特征的统一嵌入

图2 BIM模型的图表征方法

图3 BIM图表征示例

需要注意的是，图结构可以分为同构图（homogeneous graph）和异构图（heterogeneous graph）。在同构图中，所有节点都代表同一类型的实体，所有边也都是同一类型的关系；而在异构图中，节点和边的类型可以不同。不同的图结构会影响神经网络在训练时的消息传递机制，从而显著影响模型的学习效果。因此，在后续实验中，我们将比较两种图结构对模型性能的影响。

此外，本研究提出的表征方法可以将BIM模型中的错误检测转换为节点分类问题，从而显著简化模型审查任务。同时本方法也具有良好的可扩展性，可以根据实际应用中的下游任务增加或减少图节点和节点属性。

2.2 BIGNet架构

本研究借鉴了部分GraphMAE2图神经网络预训练的架构学习构件的隐式空间排布规律，并进行改进扩大了应用范围，使其同时适用于同构图和异构图。通过遮蔽输入图中部分节点的方法，将网络预训练问题转化为节点特征解码重构的问题，促使模型自监督学习从局部信息恢复整个图形结构，如图4所示。

图4 GraphMAE2架构

在BIM数据中，两个语义节点之间往往夹着一个拓扑或空间节点。为了让模型在学习时不仅关注单个构件，还能理解周边构件的属性，我们在编码器和解码器中都采用了两层GAT网络。这样既能保证信息传递的完整性，又能控制计算成本。相比之下，已有的GraphMAE2方法只适用于同构图，而本研究则进一步探索了同构图和异构图对模型表现的影响。考虑到构件之间真实的物理关系，我们还对消息传递机制进行了改进，如图5所示。

图5 两层GAT网络消息传递机制

BIGNet让模型在编码时不仅能看见单个构件，还能理解它与周围构件的空间与拓扑关系。这样一来，模型就能捕捉到BIM数据中更深层次的空间排布规律，同时具备更强的全局特征表达能力。得益于此，BIGNet在小样本条件下也能顺利完成迁移学习任务。需要说明的是，在下游应用中，我们只保留encoder，用它来生成特征嵌入或进行微调，decoder和projector则会被舍弃。

2.3 BIGNet在不同场景迁移学习中的表现

为了全面验证 BIGNet 的表现，我们挑选了工程中常见的三类错误场景：1）语义错误：构件的类别或属性设置不当，比如把墙体错误地建成了梁族，后续造价和维护就会出问题；2）取值范围错误：构件参数不符合行业规范，比如门的高度低于 200 cm 或高于 240 cm；3）拓扑关联错误：构件之间的连接关系出错或丢失，比如机电（MEP）构件与其连接件在修改或移动后出现缝隙，或者几何上虽相连，但属性关系却消失。需要注意的是本研究提出的方法可以实现将BIM模型中的错误检测转换为节点分类问题，如图6所示。

图6 将BIM审查问题转换为节点分类问题

BIGNet的迁移学习有两种方式：特征提取和微调。前者只用encoder提特征，后者会更新参数以适应新任务。分类器上，我们测试了MLP和GAT两种选择，最终形成三种方案：1）特征提取+MLP；2）特征提取+GAT；3）微调+MLP（如图7所示）。

图7 三种迁移学习策略

实验设置与结果

3.1 实验设置

本研究重点考察两组影响因素：1）图表征方法（参数见表2）；2）迁移学习方法（参数见表3）。由于图表征与预训练、迁移学习属于相对独立的过程，本文不考虑二者的耦合效应。同时，为验证 BIGNet 的有效性，设置未预训练模型作为对照组。

表2 图表征方法探讨

表3 迁移学习方法探讨

3.2 实验结果

1）不同图结构对模型性能的影响

实验结果表明：同构图比异构图更准、更快。虽然异构图能捕捉更多细节，但它太复杂、训练成本高，本研究里耗时甚至是同构图的5倍。反而是结构更简单的同构图，在小样本和有限资源条件下表现更好，也证明它足以让模型学到有效的节点关系。

图8 不同图结构的F1分数

2）空间关系取值范围对模型性能的影响

从图8可知，0.3 米的空间范围比 0.6 米更合适。虽然更大的范围能带来更多位置信息，但也让节点数暴增，增加了错误与正确节点的不平衡；而范围太小又会信息不足，导致判断失准。最终结果表明，0.3 米是最佳平衡点：既保证了信息充足，又避免了过度复杂。在后续研究中，我们也将空间关系的取值范围固定为 0.3 米。

3）不同迁移学习方法对模型性能的影响

从图9可知，在异构图中，微调（Fine-tuning）是效果最好的方法，原因在于数据量有限，直接从头训练难以奏效，微调现有参数更合适。但整体来看，异构图的表现还是不如同构图，这和之前的分析一致。因此，我们后续重点关注同构图的结果。

图9 不同迁移学习方法的F1分数

此外，和传统方法比，我们的方法在F1-score上提升了59.5%（MLP）和72.7%（GAT）。这说明它不仅能学到构件的属性，还能理解构件间的拓扑和空间关系，从而大幅提升模型对隐含设计规律的捕捉能力。换句话说，我们提出的BIM专属图数据集和预训练模型，让错误检测更准、更快，也能适用于多种BIM模型校核任务。

研究结论

本研究探索提出了基于大模型从既有BIM模型中提取、学习与复用设计经验的方法。首先，提出了一种针对BIM模型“语义-空间-拓扑”多维特征的图表征方法，并构建了相应的大规模预训练图神经网络BIGNet。据我们所知，这是直接面向多维BIM图数据构建大型预训练网络的初始探索。随后，通过基于迁移学习的多项BIM模型审查任务验证了所提方法的有效性，得到以下结论：

(1) 当重点考虑构件 0.3 m 临近区域的空间关系，并将BIM表征为同构图进行预训练后，采用Feature extraction + GAT的迁移方式在审查任务中取得了最佳性能；

(2) 与未预训练的模型相比，本文方法在BIM模型审查任务中的平均F1分数提升了59.5%（MLP分类器）和72.7%（GAT分类器），能够在建筑全生命周期中提供更精准、全面的信息支持；

(3) 本方法适用于多类BIM模型审查任务，并在错误样本识别上更加严格，仅有极少数错误节点被误判为正确，进一步体现了方法的可靠性。

本研究突破了BIM数据复杂设计知识表征与提取的瓶颈，为未来迁移学习在BIM数据利用中的应用奠定了基础。

引用本文: Han, J., Lu, X.Z., Lin, J.R.* (2025). Pretrained Graph Neural Network for Embedding Semantic, Spatial, and Topological Data in Building Information Models. Computer-Aided Civil and Infrastructure Engineering, 1-25. doi: 10.1111/mice.70073

---End---

建筑结构生成式智能设计软件：

3分钟视频演示剪力墙结构智能设计完整操作流程

3分钟视频演示框架结构智能设计完整操作流程

相关研究

学术报告视频

专著

人工智能与机器学习

---结构智能设计

---其他土木工程领域人工智能研究

城市灾害模拟与韧性城市

高性能结构与防倒塌

长按识别二维码，关注我们的科研动态

阅读原文