news 2026/4/16 15:57:30

《TAML》好文推荐 | 来自中国科学院力学研究所张磊博士 评估大语言模型在计算流体力学领域的知识利用、学习与创造

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
《TAML》好文推荐 | 来自中国科学院力学研究所张磊博士 评估大语言模型在计算流体力学领域的知识利用、学习与创造

以下内容转载自微信公众号“TAML力学快报英文

原文链接:https://mp.weixin.qq.com/s/AOCjm7fiV3RQTzmOlWObjg

Theoretical and Applied Mechanics Letters

大语言模型的快速发展引起了广泛关注,尤其在科学计算领域。计算流体力学问题复杂多样,既有成熟数值方法可解决的常规问题,也有需新方法或创新突破的难题。本研究聚焦于评估推理型模型(DeepSeek R1和OpenAI o3-mini-high)和非推理型模型(DeepSeek V3和ChatGPT 4o)在计算流体力学领域的三种能力:利用知识、学习知识和创造知识。

图片来自 Elsevier

研究亮点

本文提出三类基准问题,用于系统评估大语言模型(LLM)在计算流体力学(CFD)中对知识的利用、学习与创造能力。具体包括:

  • 传统计算流体力学问题,可利用大语言模型知识中已有数值方法求解,如顶盖驱动方腔流动与Sod激波管问题。

  • 需引入新方法求解的问题,例如求解奇异摄动对流-扩散方程所需的钱氏物理信息神经网络(Chien-PINN)。

  • 需方法创新的难题,如病态的Hilbert线性代数方程组,经典方法无法有效求解。

评估结果表明,推理型模型在CFD问题求解中明显优于非推理型模型,展现出较强的专业适应性。然而,其在自主探索与方法创新方面仍存在明显局限。

研究进展

本研究通过三类基准问题,对比了推理型和非推理型大语言模型的三种能力:

(1)利用已有知识的能力: 要求大语言模型求解CFD中经典的顶盖驱动方腔流动和Sod激波管问题。推理型模型能够给出有效的解,非推理型却无法给出可运行的程序。

(2)学习新知识的能力:要求大语言模型学习新近提出的Chien-PINN方法并求解边界层型奇异摄动问题。推理型和非推理型大语言模型都能给出Chien-PINN的可运行程序,但是只有DeepSeek R1给出了接近参考解的结果,其它模型的结果与参考解相差明显。这是因为DeepSeek R1正确地设置了边界层的位置和厚度,OpenAI o3-mini-high只正确地设置了边界层的位置,而非推理模型无法正确地设置这两种参数。

(3)创造新知识的能力:要求大语言模型尝试求解病态的Hilbert线性代数方程组。所有模型均无法有效求解该问题。其中,DeepSeek R1的思考过程指出了经典方法失效的原因并估计了高阶Hilbert矩阵的条件数的量级,探讨了可能的解决策略,但是遗憾的是并没有使用这些策略。

研究结论

本研究通过三类CFD问题评估大语言模型的科学计算能力。

(1) 推理型模型(DeepSeek R1和OpenAI o3-mini-high)在经典CFD问题(如顶盖驱动方腔流动、Sod激波管问题)中显著优于非推理型模型(DeepSeek V3和ChatGPT 4o),能生成有效求解代码,而非推理模型的代码常产生致命错误。

(2) 对于需学习新方法求解的问题(如使用Chien-PINN求解边界层型奇异摄动对流-扩散方程),推理模型通过分析方程准确设置边界层参数,将相对L2范数误差控制在2%以内,远超非推理模型50%的误差水平。

(3) 然而,面对高度病态的Hilbert线性代数方程组,所有模型均无法有效求解,但DeepSeek R1能深入分析Hilbert矩阵的条件数并探索可能的改进方案,为研究者提供新思路。

研究结果显示,相较于非推理型模型,推理型大语言模型在知识的利用、学习及创新方面更具潜力,但其自主探索知识的能力仍有待进一步提升。

视频导读

全文下载:

Evaluations of Large Language Models in Computational Fluid Dynamics: Leveraging, Learning and Creating Knowledge

Long Wang , Lei Zhang, Guowei He

https://www.sciencedirect.com/science/article/pii/S2095034925000297

BibTex:

@article{WANG2025100597,

title = {Evaluations of Large Language Models in Computational Fluid Dynamics: Leveraging, Learning and Creating Knowledge},

journal = {Theoretical and Applied Mechanics Letters},

pages = {100597},

year = {2025},

issn = {2095-0349},

doi = {https://doi.org/10.1016/j.taml.2025.100597},

url = {https://www.sciencedirect.com/science/article/pii/S2095034925000297},

author = {Long Wang and Lei Zhang and Guowei He},}

作者介绍

王笼,第一作者,中国科学院力学研究所博士研究生。2022年本科毕业于西北工业大学数学与统计学院。

张磊,共同通讯作者,中国科学院力学研究所特别研究助理。博士毕业于北京大学,获2021年北京大学优秀博士学位论文。主持了国家自然科学基金青年基金项目。他的研究领域为计算力学,数据驱动的有限元和量纲学习方法。

何国威,共同通讯作者,中国科学院院士,中国科学院力学研究所研究员。研究领域为湍流,计算流体力学和机器学习。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/16 11:04:26

多维分类的知识管理系统的设计与实现

4.2系统功能模块设计图4.2 功能结构图4.3数据库设计对程序的功能分析与结构设计之后,也要对程序数据存储的工具进行选择,本程序选用的数据存储仓库是Mysql,选用这个工具就需要根据该数据库的特点进行数据库文件的创建,并设计与之对…

作者头像 李华
网站建设 2026/4/16 11:15:23

【含文档+PPT+源码】基于springboot的旅游路线推荐系统的设计与实现

项目介绍本课程演示的是一款 基于springboot的旅游路线推荐系统的设计与实现,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的 Java 学习者。1.包含:项目源码、项目文档、数据库脚本、软件工具等所有资料2.带你从零开始部署运行本套系统3…

作者头像 李华
网站建设 2026/4/16 11:09:26

Openclaw是什么?2026年Openclaw(Clawdbot)AI 助手一键部署保姆级教程

Openclaw是什么?2026年Openclaw(Clawdbot)AI 助手一键部署保姆级教程。OpenClaw(原名Clawdbot/Moltbot)是一款开源的本地优先AI代理与自动化平台。它不仅能像聊天机器人一样对话,更能通过自然语言调用浏览器、文件系统、邮件等工具…

作者头像 李华
网站建设 2026/4/16 9:06:41

68 @Async异步注解深度实践

@Async异步注解深度实践 本文深入剖析Spring @Async异步注解的核心原理与实战应用,详解线程池配置、异常处理、返回值处理等关键技术,帮助你在企业级项目中正确使用异步编程。 1 为什么需要异步编程? 同步执行的痛点 在企业级应用开发中,同步执行往往会遇到以下问题: 常见场…

作者头像 李华
网站建设 2026/4/16 9:06:59

AI大模型应用开发工程师全解析:月薪60k+的桥梁职业指南

AI大模型应用开发工程师是连接技术与业务的关键角色,负责将复杂AI技术转化为实用产品。其核心职责包括需求分析、技术选型、应用开发、测试优化和部署运维。这一复合型职位月薪可达60k,随着AI技术落地场景的深化,其职业价值将不断提升&#x…

作者头像 李华