Claude Fable 5三天被黑客破解，Anthropic“暗箱降智”引众怒后道歉仍难挽回口碑-编程阁

AI模型安全竞争进入新阶段

AI模型的安全竞争，已经进入了新的高度。就在刚刚，最强模型Claude Fable 5被破解了！知名黑客「Pliny the Liberator」公开宣布，Fable 5的安全分类器被其团队彻底攻破，绝对禁区的漏洞利用代码和违禁化学品制作步骤被Claude Fable 5输出。

发布不久即被破解

6月9日Claude Fable 5发布时，Anthropic强调模型经超1000小时外部漏洞赏金测试，未发现通用越狱方法，高危敏感领域查询被分类器锁住。然而，72小时后就被黑客破解，Anthropic被当场打脸。黑客「解放者普林尼」带领多智能体战术系统撕碎Fable 5防线，还晒出截图，显示漏洞利用代码和违禁化学品合成工艺步骤被输出。Pliny还将Fable 5内部12万字符的系统提示词上传到GitHub，暴露了模型的「行为宪法」和内部防御逻辑。

黑客的关键杀招

Fable 5安全机制核心是关键词分类器，检测到敏感词汇会拦截请求并转至备用模型。但普林尼团队找到关键杀招：一是字符级迷魂阵，把英文里的字母替换成相似字符，让分类器认不出关键词；二是把意图稀释进漫长对话，利用Fable 5的上下文处理能力，用大量合规讨论稀释安全分类器的注意力权重；三是穿上学术马甲，将敏感请求包装成「科幻小说创作」等；终极杀招是解构与重组，将有害目的拆解为合法子步骤，让Fable 5吐出违禁配方。

暗箱降智风波

近期，轰动AI圈的「暗箱门」事件让Anthropic风评大跌。Fable 5秘密部署针对同行研究者的「隐形降智」机制，判断用户用Claude训练其他模型时，会故意提供错误代码破坏研究。Anthropic解释称是为确保Claude不被用于削弱美国及其盟友在芯片和软件方面的优势，但这点燃了AI社区的怒火，导致算力成本可能付诸东流。前白宫AI顾问Dean W. Ball和开源AI阵营先锋代表Will Brown都对此进行了痛批，该行为还威胁了AI评估生态，断裂了行业信任链条。

道歉仍难挽回口碑

面对舆论，Anthropic公开致歉，撤回隐形降智政策，将其改为明文拦截，触发机制时会明确告知并转至Claude Opus 4.8。但新方案代价更大，会有更多正常开发者请求被误判拦截。Anthropic的口碑已碎，其曾被研究者信任，如今却亲手砸毁了这份信任，使用Claude的人会不断怀疑答案的真实性。

STM32F103用硬件SPI跑TLE5012B的三线SSC通信，带角度/速度/温度实时读取和寄存器配置

本文还有配套的精品资源，点击获取简介：基于STM32F103ZE等主流型号，直接调用硬件SPI外设（支持8MHz时钟）实现与英飞凌TLE5012B磁编码器的三线同步串行通信（SSC协议），稳定获取15位高…

李华

Python列表实战：用5个趣味小项目搞定数据脱敏、质因数分解和摩斯电码

Python列表实战：用5个趣味小项目搞定数据脱敏、质因数分解和摩斯电码记得刚开始学Python时，最让我头疼的就是列表操作。那些枯燥的增删改查练习，简直像在背字典一样无趣。直到有一天，我把购物砍价的过程写成代码，才突然…

李华

告别GUI点点点：用Matlab脚本批量处理OpenBMI脑电数据，效率提升10倍

告别GUI点点点：用Matlab脚本批量处理OpenBMI脑电数据，效率提升10倍凌晨三点的实验室，显示器蓝光映着研究员疲惫的脸——这已经是连续第七天手动处理第38号被试的脑电数据了。重复的点击、等待、保存操作不仅消耗时间，更让科研灵感…

李华

保姆级教程：用GD32F470的Timer1实现精准1ms定时（基于200MHz系统时钟）

GD32F470定时器深度解析：从时钟树到1ms精准定制的实战指南在嵌入式开发中，定时器如同系统的心跳，为各类任务提供精准的时间基准。对于GD32F470这款高性能MCU而言，其定时器模块的灵活性和复杂性并存，尤其是当系统时钟高…

李华

Linux ioc_timer_fn iocost定时器与hweight更新

Linux ioc_timer_fn iocost定时器与hweight更新ioc_timer_fn是iocost控制器的周期性定时器处理函数，它以固定间隔(默认为64ms)执行，负责iocost的多个核心维护任务：更新iocg的hweight(层级权重)、调整I/O带宽配额、处理过期的等待队列以及触发…

李华

大模型相对位置编码层归零技术解析与工程实践

1. 项目概述：这不是一次普通更新，而是一次架构级“蒸发”“Anthropic Just Shipped the Layer That’s Already Going to Zero”——这个标题乍看像科技媒体的夸张头条，但作为连续跟踪Claude模型演进三年、亲手部署过从Sonnet 3.5到Opus全系列…

李华