cover_image

计算机能否读懂一本规范?| 新论文:基于文本分类的建筑领域规范文本机器可读性评估与提升

郑哲、周育丞等 陆新征课题组
2023年10月13日 10:15

DOI:https://doi.org/10.1016/j.engappai.2023.107207

50天免费访问链接https://authors.elsevier.com/a/1htjT_LfeK6udF


00

太长不看版

让计算机读懂建筑结构规范文本是实现建筑结构智能设计与智能建造的关键环节之一。那么,让计算机完全读懂一本规范究竟有多难?怎样才能提升计算机理解工程设计规范的能力呢?

为了回答以上问题,本研究从单个条文及整体规范文档两个层面提出了建筑结构规范机器可读性的定量评价指标;并以团队研发的建筑领域大语言模型为基础(试用网址:ai-structure.com:土木工程自然语言规则AI解译模块上线测试,建立了基于文本分类的规范机器可读性自动评价与改进方法。试验表明,本方法可以高达96%的准确率判断规范条文的机器可读性,并可增强下游规范条文自动解译任务,性能提升4%

基于上述方法,本研究对我国建筑结构、给排水、电气、暖通、消防等不同领域的150余本相关规范进行了分析。结果表明,其机器可读性位于10%至44%,总体平均值仅有34.4%。这意味着既有规范文本仅有约三分之一的内容可由计算机自动解析和推理,让计算机完全理解设计规范仍然任重道远。未来仍需开展大量工作,实现复杂设计规范知识的计算机完全可读与可用。


01

引言

设计是保障建筑工程质量与效率的关键环节,设计质量的好坏对工程造价、工期、安全等有决定性影响。传统依赖人工的设计审查方式正逐渐成为制约设计质量与效率的瓶颈,自动规则审查的重要性也越来越凸显,自动规则解译作为其中关键的一环得到了广泛的研究。但是,现有的研究主要是基于手工或半自动的方式分析单个条文的机器可读性。很少有研究分析整个建筑规范的机器可读性,以便对现有建筑规范进行优化和修订。

为了更好地评估现有建筑规范的机器可读性,本文提出了一种基于文本分类的机器可读性自动评估方法。

首先,提出了一种适合评估每个条文机器可读性的类别标准,并根据提出的类别标准构建了一个训练数据集。

其次,训练了一个利用迁移学习技术的深度学习模型RuleBERT,用于自动对每个条文进行分类,该方法优于广泛使用的传统深度学习模型。

最后,我们提出了一种基于RuleBERT模型对整个建筑规范进行机器可读性评估的方法,并将其应用于一系列中国建筑规范的整体机器可读性评估。整体研究流程如图1所示。

研究结果表明,所选择的150多部中国建筑规范平均机器可读性只有34.40%,该结果与相关学者人工评估结果相近。该结果还说明将整个法规文件完全转化为计算机可处理的格式仍然很困难。为了进一步提高建筑规范的机器可读性,领域专家的知识强大的算法更丰富的数据集小样本问题是未来需要关注的研究重点。

图1 整体研究流程


02

分类模型构建

首先提出了用于衡量条文机器可读性的分类标准,如表1所示。然后基于该类别标准构建了用于模型训练的数据集。采用BERT模型进行训练,并利用领域语料库采用MLM(Masked language model)来增强模型在小样本情况下的性能,如图2所示。最后,对模型进行微调,以更好地适应下游文本分类任务,基本训练过程如图3所示。

表1 条文的类别及机器可读性


图2 领域语料库增强预训练过程

图3 文本分类模型基本训练过程


各文本分类模型的性能如图4所示,原始的BERT模型比其他传统的深度学习模型性能好,增强的BERT模型(即RuleBERT)的性能比原始BERT模型更好。

图4 在文本分类数据集上获得的加权F1分数


03

基于机器可读性分类的条文解译算法增强

将训练好的分类模型和所提出的条文级机器可读性评估方法集成到自动规则解译方法中,以提高自动解译的性能。利用课题组之前提出的语法树结构和自动规则解译方法对《建筑防火设计规范》(GB 50016–2014)中的主要条文进行解译(包含不可解译条文)。利用训练好的RuleBERT进行文本分类操作之后再次对条文进行解译,结果的准确率从68%提高到了72%,如表2所示。

要注意的是,此前有关算法性能评测均在人工筛选出的机器可解译条文数据集上进行性能评测,而本实验则直接在原始条文数据集上进行性能评测。由于原始数据包括不可解译条文,因此成功解译的比例看起来较低。

表2 规则解译算法性能提升情况


04

文档级机器可读性评估

基于前述条文级可读性分类标准,本研究将7种条文类别分为3组,如表3所示。并在此基础上,提出一个评估建筑规范文档级机器可读性的定量指标,计算公式如下:

表3 文档级机器可读性评价指标


结合训练好的分类模型对中国150多部建筑规范进行机器可读性评估分析,包括结构、给排水、电气、暖通、消防等领域,如表4所示,总体平均机器可读性为34.40%,评估结果与专家人工评估的结果吻合良好,验证了我们方法的合理性。其中,消防领域建筑规范可读性最高。此外,不同层面的规范机器可读性排名为GB (The national level,国家标准)> HB (The industrial level,行业标准)> DB(The local level,地方标准)

表4 不同领域建筑规范的机器可读性


对防火领域的建筑规范文档级机器可读性进行评估,结果如表5所示。当一个建筑规范的机器可读性值大于50%时被定义为高度可解译的规范,根据表中信息可以得到不同层面的消防领域规范机器可读性排名为GB>HB>DB。

表5 消防领域规范的可读性


05

结论

本研究提出了一种新的方法,来自动评估和提高单个条文和建筑规范的机器可读性,以便对现有建筑规范进行优化和修订,促进自动规则解译的研究和应用,主要结论可以总结如下:

(1)本文基于对中国设计规范和BIM模型数据结构的研究,提出了一种基于条文的分类标准,基于该标准标注构建了一个用于深度学习模型训练的文本分类数据集。构建的数据集已经开源(访问链接:https://github.com/SkydustZ/Text-Classification-Based-Approach-for-Evaluating-and-Enhancing-Machine-Interpretability-of-Building/tree/main/CivilRules/dataset),可以用于训练和测试,为自动规则审查的发展做出贡献。

(2)采用了一种预训练方法,有效解决了小样本问题,得到了RuleBERT模型,可以更好地适应文本分类的下游任务,训练代码和训练好的模型已经开源(访问链接:https://github.com/SkydustZ/Text-Classification-Based-Approach-for-Evaluating-and-Enhancing-Machine-Interpretability-of-Building),可以提高文本分类的准确性,促进自动规则解译的广泛应用。

(3)对《建筑防火设计规范》(GB 50016–2014)中的条文进行解译,实验结果表明,当使用提出的方法时,条文级自动规则解译的准确率提高了4%。

(4)提出了一个文档级机器可读性评估指标,完成了两个评估任务。首先,评估了不同领域和不同层面中国建筑规范的机器可读性。其次,评估了消防领域建筑规范的机器可读性。这是第一次大规模对中国建筑规范进行机器可读性评估,可以为现有规范的优化和修订提供指导。


06

结语

本研究是对规范机器可读性大规模评估的一次初步尝试,由于数据和方法局限,尚存在诸多不足,敬请各位专家批评指正!


引用本文:Zheng, Z., Zhou, Y.C., Chen, K.Y., Lu, X.Z., She, Z.T., Lin, J.R. (2024). A Text Classification-based Approach for Evaluating and Enhancing the Machine Interpretability of Building Codes. Engineering Applications of Artificial Intelligence, 127, 107207. doi: 10.1016/j.engappai.2023.107207


---End---

智能设计平台网站
AIstructure-Copilot:嵌入CAD平台的结构智能设计助手


相关研究

学术报告视频

  1. 《从基于模拟的结构设计到基于人工智能的结构设计》学术报告视频

  2. 混凝土结构的智能设计和对专业教学的思考》学术报告视频

  3. 《基于数字孪生的城市防灾减灾研究》学术报告视频

  4. 《地震巨灾情景构建》科普报告视频

  5. 《城市抗震弹塑性分析及其在情景构建与地震应急中的应用》学术报告视频


专著

  1. 英文版《工程地震灾变模拟:从高层建筑到城市区域(第2版)》出版

  2. 专著《城市抗震弹塑性分析》出版


人工智能与机器学习

---结构智能设计

  1. ai-structure.com 剪力墙结构生成式智能设计系统内测邀请

  2. 如何更好的融合基于模拟的设计和基于人工智能的设计  

  3. 左右互搏大法 | 新论文及发明专利:基于结构优化和半监督学习方法提升AI设计效果

  4. 揭秘:图神经网络如何精细考虑抗震设计条件影响?| 新论文:设计条件嵌入GNN的剪力墙布置智能设计方法

  5. 揭秘:AI如何做到1秒内算出用钢量? | 新论文:基于知识增强图神经网络的建筑结构材料用量评估方法

  6. 新论文:基于图神经网络的剪力墙布置人工智能设计方法

  7. 视频:建筑结构生成式智能设计在实际投标项目中的应用

  8. 除了剪力墙结构,AI能不能设计框架结构?| 论文和发明专利:基于图神经网络的框架梁智能化布置

  9. 老师划重点啦,AI工程师学会了么?| 新论文:注意力增强的剪力墙结构人工智能设计方法

  10. 新论文和发明专利 | 规则增强的框架-核心筒结构人工智能设计方法

  11. 新论文 | 剪力墙结构智能化生成式设计方法:从数据驱动到物理增强

  12. 简便高效的建筑结构AI设计系统 | 新论文:集成式智能生成设计系统及其在剪力墙结构上的应用

  13. 利用设计文本指导AI建筑结构设计 | 新论文及发明专利:融合文本和图像数据的建筑结构AI设计方法

  14. 新论文:面向自动合规审查的知识增强语义对齐和自动规则解译方法

  15. 新论文:融合自然语言处理与上下文无关文法的审图规则自动解译方法

  16. 新论文及发明专利 | 基于深度学习的楼盖结构智能化设计方法

  17. 新论文:面向建筑领域自然语言处理的领域语料库及预训练模型

  18. 用“图”和“图”来生成“图”?中文快不够用了 | 发明专利:多模态输入深度神经网络、框架结构梁柱设计方法及装置

  19. AI想做结构设计?它得先学结构力学!| 新论文及发明专利:物理增强的剪力墙结构智能化设计方法

  20. AI+PKPM | 给个建筑户型图,结构设计全自动

  21. 糟糕!结构高度从50m改为100m了。AI:5秒完成新结构方案 | 发明专利:融合文本和图像数据的建筑结构AI设计方法

  22. 揭秘人工智能设计剪力墙结构的科学原理 | 新论文:基于生成对抗网络的剪力墙结构设计方法

  23. 用人工智能进行结构方案设计| 发明专利:基于对抗生成网络的剪力墙结构布置方法

  24. 5分钟!从设计结构方案到完成计算书 | 人工智能设计剪力墙结构案例演示

  25. 新发明专利:一种将规范文本自动转为可计算逻辑规则的方法及系统


---其他土木工程领域人工智能研究

  1. 三个臭皮匠,顶个诸葛亮 | 新论文:用深度集成学习来智能构建滞回模型

  2. 新论文:结构响应行为预测的深度学习模型有N种,该怎么选?

  3. 新论文:智能建造研究进展综述—中国与发达国家的对比

  4. 新论文:基于单目视觉和深度学习位姿估计的结构三维位移测量

  5. 提升小样本下预测性能近一个数量级 新论文 |  神经网络响应时程预测中的迭代自迁移方法 (附数据集和程序)

  6. 新论文:使用深度学习超分辨率技术提升基于计算机视觉的位移测量精度
  7. 新论文 | 基于深度学习的滞回模型如何拥有“误差自纠偏”能力?(附数据集和程序)

  8. 新论文 | 倾斜摄影点云+深度学习=城市风环境自动化模拟

  9. 新论文 | 卷积神经网络 + 小波时频图:基于地震动时频域特征的震害评估新方法

  10. 他山之石可以攻玉 | 新论文:基于深度迁移学习的结构地震响应识别

  11. 新论文:为提升AI振动识别效果,小波、HHT、MFCC、CNN、LSTM我们都试一试

  12. 如何将地震破坏力评估加速1500倍?| 新论文:基于LSTM的地震破坏力实时评估

  13. 新论文:基于机器学习方法的多元地震动强度指标比选与实时震害预测

  14. 新论文:给振动信号拍个照,可以提升振动控制效果!

  15. 这栋楼是什么结构的,元芳,你怎么看?——大人,时代变了!|新论文:使用机器学习方法预测城市建筑结构类型

  16. 新论文:基于无人机与深度学习的建筑震害评估方法

  17. 新论文:无人机+机器学习+城市弹塑性分析=震后近实时损失预测


城市灾害模拟与韧性城市

  1. 新论文:通过网格多路径建模优化的基于机器视觉建筑结构振动识别方法

  2. 上班的电梯好挤啊,这时候地震了怎么办?| 新论文:地震下电梯被困人员评估

  3. 新论文:台风导致的港口运营中断对中国沿海地区造成的经济影响评估

  4. 新论文 | 基于相位的结构运动识别

  5. 新论文 | 复杂地形下场地-城市效应的振动台试验和数值模拟

  6. 新论文 | 传感器质量和密度对震后快速评估影响的成本效益分析

  7. 提升震害分析精度,更多数量 or 更高质量的加速度计? | 新论文:加速度计类型对地震动记录和震损评估的影响

  8. 新论文 | 基于倾斜摄影、深度学习和CFD的城市尺度窗户风损评估

  9. 新论文 | 强震台网密度对震害评估的影响

  10. 新论文:城市尺度树木风灾破坏近实时评估:方法框架及清华园案例应用

  11. 新论文:基于实测地震动的近实时地震滑坡预测方法(并附源程序)

  12. 新论文:基于实测地震记录的区域地震动场模拟方法

  13. 新论文:“场地-城市”效应对区域震害评估的定量影响分析

  14. 新论文:基于城市信息模型、并同时适用于城市建筑群和单体重要建筑的多灾害模拟框架

  15. 新论文:台风风灾对港口运营的经济影响:以中国港口为例

  16. 新论文:基于BIM与虚拟现实的建筑震后火灾救援场景模拟

  17. 新论文:社区地震安全韧性评估系统及社区应用示范

  18. 新论文:武汉火神山医院病房有害气体的高空排放设计和分析

  19. 新论文:主余震作用下区域建筑震害预测方法

  20. 新论文:城市抗震弹塑性分析的开源框架

  21. 新论文:考虑劳动力资源约束的城市尺度建筑抗震韧性模拟和震后维修规划

  22. 新论文:结合BIM和FEMA P-58的建筑地震损失预测方法

  23. 新论文:扔砖头、跳盒子,这也是做科学试验哦!| 地震次生坠物情境中的人员疏散模拟

  24. 综述:城市抗震弹塑性分析及其工程应用

  25. 新论文:适用于多LOD BIM的建筑地震损失评估

  26. 新论文:城市建筑群多LOD震害模拟及北京CBD算例

  27. 美国NSF SimCenter+清华城市弹塑性分析=旧金山184万建筑地震模拟

  28. 新论文:BIM+新一代性能化设计=喷淋系统破坏后的地震次生火灾模拟

  29. 新论文:村镇建筑群火灾蔓延模拟与案例

  30. 新论文:建设地震韧性城市所面临的挑战

  31. 新论文:烈焰焚城 | 地震次生火灾的精细化和高真实感模拟

  32. 新论文:城市韧性——基于“三度空间下系统的系统”的思考

  33. 新论文:城市抗震弹塑性分析中如何确定高层建筑的损伤程度?


高性能结构与防倒塌

  1. 转载:抗震性能化专题Ⅶ | 陆新征等,建筑结构防地震倒塌性能设计

  2. 新论文:带可更换脚部件装配式RC剪力墙试验研究

  3. 新论文:面向多层RC框架的连续倒塌易损性简化评估方法

  4. 新论文 | 一致阻尼模型在OpenSees中的实现(附程序与说明)

  5. 新阻尼模型论文 | 频域分布任性变,开源程序免费领

  6. 新论文:中柱节点向上和向下冲剪破坏引起的板柱子结构连续倒塌研究

  7. 新论文:有限元携手物理引擎,倒塌模拟新思路

  8. 新论文:美国佛罗里达公寓大楼倒塌的初步分析和讨论

  9. 综述论文:建筑结构抗震“体系能力设计法”综述

  10. 新论文:不同钢筋构造对RC板柱节点冲剪破坏后性能的加强作用

  11. 新论文:地震-连续倒塌综合韧性防御超高层体系

  12. 新论文:基于数字孪生的强震下大跨斜拉桥倒塌易损性评估

  13. 新论文丨不同冲剪方向下板柱节点抗倒塌性能研究

  14. 新论文:大跨斜拉桥的非线性模型更新及倒塌预测

  15. 新论文:新一代地震-连续倒塌综合防御组合框架——综合韧性防御组合框架

  16. 新论文:中柱失效后混凝土板柱结构承载性能影响因素研究

  17. 新论文:不同冲剪方向下板柱节点抗倒塌性能研究

  18. 新论文:次边缘柱失效后钢筋混凝土平面框架连续倒塌承载力的试验分析和计算评估

  19. 新论文:基于集群计算的大跨斜拉桥精细有限元模型更新

  20. 新论文:钢筋混凝土板柱节点冲切及冲切破坏后行为的数值模拟

  21. 新论文:边柱以及边中柱失效后平板结构连续倒塌行为试验研究

  22. 新论文:抗震&防连续倒塌:一种新型构造措施

  23. 新论文:混凝土梁柱子结构连续倒塌动力效应的试验研究

  24. 层间位移角判别准则不适用于剪力墙,怎么办?|新论文:基于曲率的剪力墙损伤评估方法

  25. 新论文:地震-连续倒塌综合防御组合框架结构体系研究

  26. 新论文:改变框架-核心筒结构剪力调整策略对其抗震性能影响的研究

  27. 新论文:新型地震和连续倒塌综合防御韧性PC框架承载力计算方法

  28. 新论文:角柱失效后平板结构连续倒塌行为实验研究

  29. 新论文:受折纸启发的可更换承载-耗能双功能耗能器

  30. 新综述论文:21世纪建筑结构连续倒塌和鲁棒性的研究和实践

  31. 新论文:中柱失效后板柱结构连续倒塌传力机理研究

  32. 新论文:一根钢筋混凝土梁,承载力你能算对么?| 梁的压拱效应计算方法

  33. 新论文:这个混凝土框架能抗震,能防连续倒塌,还功能可恢复,您不进来看看么?

  34. 新论文:一个好汉三个帮|带端部阻尼器伸臂桁架的抗震性能试验研究

  35. 新论文:防屈曲支撑伸臂桁架?几个“狗骨头”可少不了!

  36. 新论文:考虑楼板影响的钢筋混凝土框架边柱连续倒塌试验

  37. 新论文:提高地震荷载分项系数,抗震安全性提高了多少?

  38. 新论文:采用减振子结构来控制超高层建筑的地震楼面加速度

  39. 新论文:500m级超高层建筑简化模型及其在结构体系对比中的应用

  40. 课题组2015年的论文:超高层建筑火灾结构安全分析

  41. 606m 超高层建筑OpenSees模型


    长按识别二维码,关注我们的科研动态