cover_image

新论文:结构响应行为预测的深度学习模型有N种,该怎么选?

徐永嘉等 陆新征课题组
2023年06月21日 11:30


论文链接:https://doi.org/10.1177/13694332231184322


太长不看版

目前,已经有大量学者提出了可用于结构(构件/材料)响应时程预测的深度学习模型。为了给该领域内神经网络模型的选择提供参考,并开展网络架构进一步优化,本研究开展了以下工作:


  1. 建立并开源了不同尺度的数据集,针对部分典型神经网络模型进行了案例分析与比较;

  2. 针对门控循环网络(LSTM/GRU)和注意力机制网络(Transformer等)的长、短期记忆能力进行了分析与解释;

  3. 提出了通用、易执行的网络架构优化方法:(a) 多层次shortcut和(b)带权重的特征融合机制。


数据、模型与程序开源

本研究的基础数据集(以及课题组整理的其他一些相关数据、相应的说明文档)可以从下面的链接处下载。本研究提出的网络架构的示例性代码也附在同一链接中。

https://github.com/XYJ0904/Weighted-Pyramid-Stacked-Network

如有任何意见或建议,欢迎通过文末的联系方式向作者提出。


01 研究背景

基于深度神经网络构建结构(构件/材料等也可,下同)响应行为的代理模型,近年来得到很多研究者的关注。此类方法具有拟合能力强、端到端(无需人为干预中间过程)、可以取得“精度-效率”的良好平衡等优点。在诸多相关研究中,如何选取合适的网络架构已然成为一个焦点问题。此外,既有神经网络普遍采用基于单一层次特征的预测模式或等权重的特征融合机制,这不利于神经网络把握受历史行为高度影响的复杂响应特征。为了解决上述问题,本研究开展了网络比选、不同架构能力分析、架构优化等系列工作。


02 数据集构建


本研究共采用了结构、构件和材料三个尺度的8个特征不同的数据集,以开展更为全面、深入的对比,如图1和表1所示。

案例1-2:带阻尼的3层框架层模型(MRFDBF案例)、基于BoucWen滞回关系的层模型(BoucWen案例)响应行为数据集

案例3-4:基于支撑的精细有限元模型模拟得到的响应行为数据集(构建正则化&未正则化的两个数据集)(案例Huang-N和Huang)

案例5-8:不同特征的Giuffré-Menegotto-Pinto材料(OpenSees steel 02)的滞回行为数据集(案例OP-1至OP-4)


图1 研究案例示意图


表1 研究案例基本信息概述

03 架构选取与对比结果

本研究选取几种典型网络架构,包括很早提出但仍然常见的Multi Layer Perception(MLP)(亦称Fully Connected Network(FCN)或者Artificial Neural Network(ANN)),门控循环架构的代表Long Short-term Memory Neural Network(LSTM),适用于时程学习的卷积神经网络的代表One-Dimensional Convolutional Neural Network(1D-CNN),强化局部关联性的Recursive LSTM(Rec-LSTM),基于注意力机制的典型网络架构Transformer(Trans),融合物理机制和神经网络的PhyCNN,以及融合门控架构和注意力机制的Unrolled Attention Sequence-to-Sequence(UA)网络。

基于上述八个不同的数据集,本研究开展了网络训练、验证与测试,得到结果如图2所示。其中,纵轴为Normalized Loss,含义为“将每个案例中表现最差的网络的Loss调整为1.0”后的损失函数相对值。可以看出,在参与对比的网络架构中,UA网络表现最佳,LSTM其次,而MLP网络表现最差。

图2 八个数据集上各个网络Normalized Loss平均值(PhyCNN结果详见论文)


表2 测试集MSE(绝对值)

04 长、短期记忆能力试验与分析

相较LSTM网络,UA网络在门控机制的基础上引入了注意力机制,并取得了更好的总体表现。然而,在部分案例上(OP-2和OP-3),LSTM网络的表现更优。在其他学者的研究中,在“引入了注意力机制后网络表现是否提升”这一问题上,得到的结论也有所不同(详见论文)。这为网络架构的选取带来了挑战。

本文分析认为,LSTM网络采用门控机制(GRU类似),隐式的考虑各个时间步之间的关联性,具有良好的短期记忆能力。但由于梯度消失等因素难以克服,因此长期记忆能力不佳。而以注意力机制为基础的网络,基于注意力运算显式的关联各个历史时间步,因此具有良好的全局(长期)记忆能力。但由于注意力值的长尾分布等特性,可能导致短期记忆能力较LSTM差。

为验证上述分析,本研究设计了一个“记忆试验”。该试验中,输入为长2000步的时间序列,而输出则为输入序列的拷贝,但向后推移了D个时间步,如图3所示。本研究中,建立了15个不同的数据集,分别取D为10、20、30、40、50、60、70、80、90、100、200、500、1000、1500和1900。每个数据集均包含1000条随机起点的样本(700训练,200验证,100测试)。

图3 记忆试验中的输入、输出示意图


随后,本研究基于LSTM网络和以注意力机制为基础的Transformer网络,开展了网络训练与测试,得到如图4所示的结果。可以看出,Transformer网络在不同间隔D的情况下,表现变化幅度不大。但当D ≤ 50时,LSTM网络的性能优于Transformer数个数量级;而当D ≥ 60时,结论完全相反。需要指出,研究过程中多次调整了网络的超参数(如隐藏层维度、层数、初始学习率等),但并不会改变上述结论。


图4 不同间隔D下的网络测试表现


进一步的,选取D = 50和D = 60两种情况下的关键案例进行分析(如图5所示),可以看出,D = 50时LSTM网络近乎完美的复制了输入序列,而D = 60时则几乎遗忘了所有信息(预测结果几乎恒为0)。


图5 LSTM网络在两个临界数据集上的典型预测案例


05 网络架构优化:Pyramid Networks

经典网络架构的最终预测与输出层普遍仅接受最近一个隐藏层的特征,并据此开展预测。而多个层次特征融合,在计算机视觉等领域已经被证实是一种行之有效的性能优化方法。因此,本研究提出了在基础架构中添加多层次shortcut的方法,以将不同层次的特征纳入网络的输出层,实现网络性能优化。


图6 融合多层次shortcut的网络架构示意图(以优化后的Transformer为例)


同时,在设计合理的神经网络中,越深层次的特征与输出的关联性应当越密切,等权重的对待各层次特征并不合理。因此,本研究提出了一个带权重的特征融合机制,按照特征所对应的隐藏层的深度赋予特征不同的权重,进而优化网络性能。


图7 带权重的特征融合机制


引入了多层次shortcut和带权重的特征融合机制的网络被称为Pyramid Networks。需要指出,该架构优化可以在多种基础架构上适用(如LSTM/GRU、Transformer、UA网络等),是通用、易执行的。在前述8个数据集上,本研究开展了权重选择的优化以及网络架构的比选(详见论文)。随后,开展了Pyramid Networks和其基础网络架构的对比与验证,如表3所示。可以看出,在87.5%的案例上,优化后的Pyramid Networks都取得了更好的表现。从图8-10则可以看出,网络预测结果与真实值吻合良好。


表3 Pyramid Networks与基础网络架构的测试集MSE对比

图8 Pyramid-LSTM典型预测案例


图9 Pyramid-Transformer典型预测案例


图10 Pyramid-GA典型预测案例


06 结论

本研究选取了8个不同的尺度的数据集,针对部分典型模型进行了分析比较。在参与比选的网络架构中,UA网络表现最佳,LSTM和Transformer网络其次,MLP网络表现最差。同时,本研究开展了LSTM网络和Transformer的长短期记忆能力对比,证明LSTM网络具有良好的短期记忆能力,而Transformer等注意力机制网络具有良好的全局(长期)记忆能力。此外,本研究还提出了多层次shortcut和带权重的特征融合机制两项通用、易执行的网络架构优化方法。案例分析证明,在不同的基础架构上,上述优化方法均有利于提升模型表现。


联系我们

如您有任何意见或建议,欢迎联系:

徐永嘉 博士 [email protected]


---End---

智能设计平台网站
ai-structure.com 剪力墙结构生成式智能设计系统内测邀请


相关研究

学术报告视频

  1. 《从基于模拟的结构设计到基于人工智能的结构设计》学术报告视频

  2. 混凝土结构的智能设计和对专业教学的思考》学术报告视频

  3. 《地震巨灾情景构建》科普报告视频

  4. 《城市抗震弹塑性分析及其在情景构建与地震应急中的应用》学术报告视频


专著

  1. 英文版《工程地震灾变模拟:从高层建筑到城市区域(第2版)》出版

  2. 专著《城市抗震弹塑性分析》出版


人工智能与机器学习

---结构智能设计

  1. ai-structure.com 剪力墙结构生成式智能设计系统内测邀请

  2. 如何更好的融合基于模拟的设计和基于人工智能的设计  

  3. 新论文:基于图神经网络的剪力墙布置人工智能设计方法

  4. 视频:建筑结构生成式智能设计在实际投标项目中的应用

  5. 除了剪力墙结构,AI能不能设计框架结构?| 论文和发明专利:基于图神经网络的框架梁智能化布置

  6. 老师划重点啦,AI工程师学会了么?| 新论文:注意力增强的剪力墙结构人工智能设计方法

  7. 新论文和发明专利 | 规则增强的框架-核心筒结构人工智能设计方法

  8. 新论文 | 剪力墙结构智能化生成式设计方法:从数据驱动到物理增强

  9. 简便高效的建筑结构AI设计系统 | 新论文:集成式智能生成设计系统及其在剪力墙结构上的应用

  10. 利用设计文本指导AI建筑结构设计 | 新论文及发明专利:融合文本和图像数据的建筑结构AI设计方法

  11. 新论文:面向自动合规审查的知识增强语义对齐和自动规则解译方法

  12. 新论文:融合自然语言处理与上下文无关文法的审图规则自动解译方法

  13. 新论文及发明专利 | 基于深度学习的楼盖结构智能化设计方法

  14. 新论文:面向建筑领域自然语言处理的领域语料库及预训练模型

  15. 用“图”和“图”来生成“图”?中文快不够用了 | 发明专利:多模态输入深度神经网络、框架结构梁柱设计方法及装置

  16. AI想做结构设计?它得先学结构力学!| 新论文及发明专利:物理增强的剪力墙结构智能化设计方法

  17. AI+PKPM | 给个建筑户型图,结构设计全自动

  18. 糟糕!结构高度从50m改为100m了。AI:5秒完成新结构方案 | 发明专利:融合文本和图像数据的建筑结构AI设计方法

  19. 揭秘人工智能设计剪力墙结构的科学原理 | 新论文:基于生成对抗网络的剪力墙结构设计方法

  20. 用人工智能进行结构方案设计| 发明专利:基于对抗生成网络的剪力墙结构布置方法

  21. 5分钟!从设计结构方案到完成计算书 | 人工智能设计剪力墙结构案例演示

  22. 新发明专利:一种将规范文本自动转为可计算逻辑规则的方法及系统


---其他土木工程领域人工智能研究

  1. 新论文:智能建造研究进展综述—中国与发达国家的对比

  2. 新论文:基于单目视觉和深度学习位姿估计的结构三维位移测量

  3. 提升小样本下预测性能近一个数量级 新论文 |  神经网络响应时程预测中的迭代自迁移方法 (附数据集和程序)

  4. 新论文:使用深度学习超分辨率技术提升基于计算机视觉的位移测量精度
  5. 新论文 | 基于深度学习的滞回模型如何拥有“误差自纠偏”能力?(附数据集和程序)

  6. 新论文 | 倾斜摄影点云+深度学习=城市风环境自动化模拟

  7. 新论文 | 卷积神经网络 + 小波时频图:基于地震动时频域特征的震害评估新方法

  8. 他山之石可以攻玉 | 新论文:基于深度迁移学习的结构地震响应识别

  9. 新论文:为提升AI振动识别效果,小波、HHT、MFCC、CNN、LSTM我们都试一试

  10. 如何将地震破坏力评估加速1500倍?| 新论文:基于LSTM的地震破坏力实时评估

  11. 新论文:基于机器学习方法的多元地震动强度指标比选与实时震害预测

  12. 新论文:给振动信号拍个照,可以提升振动控制效果!

  13. 这栋楼是什么结构的,元芳,你怎么看?——大人,时代变了!|新论文:使用机器学习方法预测城市建筑结构类型

  14. 新论文:基于无人机与深度学习的建筑震害评估方法

  15. 新论文:无人机+机器学习+城市弹塑性分析=震后近实时损失预测


城市灾害模拟与韧性城市

  1. 新论文:通过网格多路径建模优化的基于机器视觉建筑结构振动识别方法

  2. 上班的电梯好挤啊,这时候地震了怎么办?| 新论文:地震下电梯被困人员评估

  3. 新论文:台风导致的港口运营中断对中国沿海地区造成的经济影响评估

  4. 新论文 | 基于相位的结构运动识别

  5. 新论文 | 复杂地形下场地-城市效应的振动台试验和数值模拟

  6. 新论文 | 传感器质量和密度对震后快速评估影响的成本效益分析

  7. 提升震害分析精度,更多数量 or 更高质量的加速度计? | 新论文:加速度计类型对地震动记录和震损评估的影响

  8. 新论文 | 基于倾斜摄影、深度学习和CFD的城市尺度窗户风损评估

  9. 新论文 | 强震台网密度对震害评估的影响

  10. 新论文:城市尺度树木风灾破坏近实时评估:方法框架及清华园案例应用

  11. 新论文:基于实测地震动的近实时地震滑坡预测方法(并附源程序)

  12. 新论文:基于实测地震记录的区域地震动场模拟方法

  13. 新论文:“场地-城市”效应对区域震害评估的定量影响分析

  14. 新论文:基于城市信息模型、并同时适用于城市建筑群和单体重要建筑的多灾害模拟框架

  15. 新论文:台风风灾对港口运营的经济影响:以中国港口为例

  16. 新论文:基于BIM与虚拟现实的建筑震后火灾救援场景模拟

  17. 新论文:社区地震安全韧性评估系统及社区应用示范

  18. 新论文:武汉火神山医院病房有害气体的高空排放设计和分析

  19. 新论文:主余震作用下区域建筑震害预测方法

  20. 新论文:城市抗震弹塑性分析的开源框架

  21. 新论文:考虑劳动力资源约束的城市尺度建筑抗震韧性模拟和震后维修规划

  22. 新论文:结合BIM和FEMA P-58的建筑地震损失预测方法

  23. 新论文:扔砖头、跳盒子,这也是做科学试验哦!| 地震次生坠物情境中的人员疏散模拟

  24. 综述:城市抗震弹塑性分析及其工程应用

  25. 新论文:适用于多LOD BIM的建筑地震损失评估

  26. 新论文:城市建筑群多LOD震害模拟及北京CBD算例

  27. 美国NSF SimCenter+清华城市弹塑性分析=旧金山184万建筑地震模拟

  28. 新论文:BIM+新一代性能化设计=喷淋系统破坏后的地震次生火灾模拟

  29. 新论文:村镇建筑群火灾蔓延模拟与案例

  30. 新论文:建设地震韧性城市所面临的挑战

  31. 新论文:烈焰焚城 | 地震次生火灾的精细化和高真实感模拟

  32. 新论文:城市韧性——基于“三度空间下系统的系统”的思考

  33. 新论文:城市抗震弹塑性分析中如何确定高层建筑的损伤程度?


高性能结构与防倒塌

  1. 新论文:面向多层RC框架的连续倒塌易损性简化评估方法

  2. 新论文 | 一致阻尼模型在OpenSees中的实现(附程序与说明)

  3. 新阻尼模型论文 | 频域分布任性变,开源程序免费领

  4. 新论文:中柱节点向上和向下冲剪破坏引起的板柱子结构连续倒塌研究

  5. 新论文:有限元携手物理引擎,倒塌模拟新思路

  6. 新论文:美国佛罗里达公寓大楼倒塌的初步分析和讨论

  7. 综述论文:建筑结构抗震“体系能力设计法”综述

  8. 新论文:不同钢筋构造对RC板柱节点冲剪破坏后性能的加强作用

  9. 新论文:地震-连续倒塌综合韧性防御超高层体系

  10. 新论文:基于数字孪生的强震下大跨斜拉桥倒塌易损性评估

  11. 新论文丨不同冲剪方向下板柱节点抗倒塌性能研究

  12. 新论文:大跨斜拉桥的非线性模型更新及倒塌预测

  13. 新论文:新一代地震-连续倒塌综合防御组合框架——综合韧性防御组合框架

  14. 新论文:中柱失效后混凝土板柱结构承载性能影响因素研究

  15. 新论文:不同冲剪方向下板柱节点抗倒塌性能研究

  16. 新论文:次边缘柱失效后钢筋混凝土平面框架连续倒塌承载力的试验分析和计算评估

  17. 新论文:基于集群计算的大跨斜拉桥精细有限元模型更新

  18. 新论文:钢筋混凝土板柱节点冲切及冲切破坏后行为的数值模拟

  19. 新论文:边柱以及边中柱失效后平板结构连续倒塌行为试验研究

  20. 新论文:抗震&防连续倒塌:一种新型构造措施

  21. 新论文:混凝土梁柱子结构连续倒塌动力效应的试验研究

  22. 层间位移角判别准则不适用于剪力墙,怎么办?|新论文:基于曲率的剪力墙损伤评估方法

  23. 新论文:地震-连续倒塌综合防御组合框架结构体系研究

  24. 新论文:改变框架-核心筒结构剪力调整策略对其抗震性能影响的研究

  25. 新论文:新型地震和连续倒塌综合防御韧性PC框架承载力计算方法

  26. 新论文:角柱失效后平板结构连续倒塌行为实验研究

  27. 新论文:受折纸启发的可更换承载-耗能双功能耗能器

  28. 新综述论文:21世纪建筑结构连续倒塌和鲁棒性的研究和实践

  29. 新论文:中柱失效后板柱结构连续倒塌传力机理研究

  30. 新论文:一根钢筋混凝土梁,承载力你能算对么?| 梁的压拱效应计算方法

  31. 新论文:这个混凝土框架能抗震,能防连续倒塌,还功能可恢复,您不进来看看么?

  32. 新论文:一个好汉三个帮|带端部阻尼器伸臂桁架的抗震性能试验研究

  33. 新论文:防屈曲支撑伸臂桁架?几个“狗骨头”可少不了!

  34. 新论文:考虑楼板影响的钢筋混凝土框架边柱连续倒塌试验

  35. 新论文:提高地震荷载分项系数,抗震安全性提高了多少?

  36. 新论文:采用减振子结构来控制超高层建筑的地震楼面加速度

  37. 新论文:500m级超高层建筑简化模型及其在结构体系对比中的应用

  38. 课题组2015年的论文:超高层建筑火灾结构安全分析

  39. 606m 超高层建筑OpenSees模型


    长按识别二维码,关注我们的科研动态