news 2026/5/10 21:46:43

【卷卷观察】AI替你改文档,正在偷偷吃掉你的内容——25%静默损坏的真相

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【卷卷观察】AI替你改文档,正在偷偷吃掉你的内容——25%静默损坏的真相

微软研究院测了19个主流大模型做长文档编辑。即使最强的Gemini 3.1 Pro、Claude 4.7 Opus和GPT-5.5,平均损坏25%的文档内容。而且这些错误是静默的——不逐字对比,根本看不出来。

读完DELEGATE-52论文我的反应是:卧槽,我每天都在干这事。

让AI帮忙润色文档、改代码、整理笔记。默认它能原封不动保留我没说要改的部分。这篇论文告诉我:没说要改的部分,四分之一被偷偷动了。

52个领域、19个模型,全跪

DELEGATE-52,名字起得到位——DELEGATE就是"委托"。测试逻辑简单:给模型一份文档,让它执行编辑任务(改格式、调结构、修内容),然后检查改动之外的部分有没有损坏。

52个领域,代码到晶体学到乐谱。19个模型,开源小模型到顶级商用全上。

结果:全军覆没。

前沿模型平均损坏率约25%。坏的还不是均匀分布的——是"稀疏但严重"的错误,冷不丁给你来一下。最要命的是累积效应:改的轮次越多,损坏越狠。

这叫静默损坏(silent corruption)。AI不会说"我把这部分改坏了"。它自信地把一份读起来通顺、看起来完整的文档交给你,里面悄悄掺了错。

你发现不了。直到出事了。

为什么读-改-写会有25%损坏?

先说清实验设计,不然容易被喷带节奏。

论文用的工具是基础版:read_file()读,write_file()写。模型把整份文档读进去、理解任务、然后重新生成整份文档——等于在模型参数里"过了一遍"再吐出来。

打个比方:你让同事改PPT里一页,同事说好,把整个PPT重做了一遍。他改了你要改的那页,但其他页因为记忆

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 21:30:41

用PS+Unity粒子系统,5分钟搞定游戏里那种‘滋滋作响’的闪电材质

用PSUnity粒子系统5分钟打造高动态闪电特效 闪电特效一直是游戏开发中极具视觉冲击力的元素之一。无论是角色技能释放、场景氛围营造还是UI动效设计,恰到好处的闪电效果都能显著提升游戏质感。传统做法往往需要复杂Shader编程或依赖第三方插件,而本文将揭…

作者头像 李华
网站建设 2026/5/10 21:16:00

QtMqtt模块编译实战:从源码到集成的关键步骤与排错指南

1. 为什么需要手动编译QtMqtt模块 MQTT协议在物联网领域应用广泛,但Qt官方发行版中并不包含MQTT模块。这就好比买了一台组装电脑,却发现显卡需要自己另外安装。QtMqtt模块作为Qt的扩展组件,目前需要通过源码编译的方式集成到开发环境中。 我去…

作者头像 李华