news 2026/5/2 21:20:53

维基百科志愿者创建AI写作特征库,现推出插件帮助规避检测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
维基百科志愿者创建AI写作特征库,现推出插件帮助规避检测

上周六,科技企业家Siqi Chen发布了一个开源插件,专门用于Anthropic公司的Claude Code AI助手,该插件能指导AI模型避免使用典型的AI写作风格。这个名为"Humanizer"的简单提示插件向Claude提供了一份包含24种语言和格式模式的清单,这些模式都是维基百科编辑总结出的聊天机器人写作特征。Chen在GitHub上发布了该插件,截至周一已获得超过1600个星标。

"维基百科整理出详细的'AI写作迹象'清单真的很有用,"Chen在X平台上写道。"有用到你可以直接告诉你的大语言模型...不要那样做。"

该工具的源材料来自维基百科的WikiProject AI Cleanup项目,这是一个自2023年底以来一直在寻找AI生成文章的维基百科编辑团队。法国维基百科编辑Ilyas Lebleu创立了这个项目。志愿者们已经标记了超过500篇文章进行审核,并在2025年8月发布了他们不断观察到的模式的正式清单。

Chen的工具是Claude Code的"技能文件",这是Anthropic基于终端的编程助手的一种功能,涉及一个Markdown格式的文件,该文件添加了一系列书面指令,附加到输入驱动助手的大语言模型的提示中。与普通系统提示不同,技能信息以标准化方式格式化,Claude模型经过微调后能够比普通系统提示更精确地解释这些信息。

在有限的测试中,Chen的技能文件确实使智能体的输出听起来不那么精确,更加随意,但它可能存在一些缺点:不会改善事实准确性,可能会影响编程能力。特别是,Humanizer的一些指令可能会误导用户。例如,该技能包含这样的指令:"要有观点。不要只是报告事实——要对它们做出反应。'我真的不知道该如何看待这件事'比中性地列出利弊更人性化。"虽然不完美看起来很人性化,但如果你使用Claude编写技术文档,这种建议可能不会对你有任何帮助。

AI写作模式识别

那么AI写作是什么样的呢?维基百科指南提供了具体的例子。一些聊天机器人喜欢用诸如"标志着一个关键时刻"或"见证了"等短语来夸大其主题。它们像旅游手册一样写作,称景色"令人叹为观止",将城镇描述为"坐落在"风景区内。它们在句子末尾添加"-ing"短语以显得分析性:"象征着该地区对创新的承诺。"

为了规避这些规则,Humanizer技能告诉Claude用简单的事实替换夸大的语言,并提供了这个转换示例:

修改前:"加泰罗尼亚统计研究所于1989年正式成立,标志着西班牙地区统计发展的关键时刻。"

修改后:"加泰罗尼亚统计研究所成立于1989年,负责收集和发布地区统计数据。"

为什么AI写作检测会失败

即使有维基百科编辑制定的如此自信的规则集,AI写作检测器也无法可靠工作:人类写作没有什么内在独特性能够可靠地将其与大语言模型写作区分开来。

一个原因是,即使大多数AI语言模型倾向于某些类型的语言,它们也可以通过提示来避免这些语言,就像Humanizer技能一样。此外,人类也可能以聊天机器人式的方式写作。例如,这篇文章可能包含一些"AI写作特征",即使它是由专业作家写的,也会触发AI检测器——特别是如果我们甚至使用一个破折号——因为大多数大语言模型从网络上抓取的专业写作示例中学到了写作技巧。

维基百科指南有一个值得注意的警告:虽然该清单指出了一些明显的迹象,但它仍然由观察组成,而不是铁板钉钉的规则。页面上引用的2025年预印本发现,大语言模型的重度用户能够在90%的情况下正确识别AI生成的文章。这听起来不错,直到你意识到10%是误报,这足以在追求检测AI垃圾内容的过程中可能抛弃一些高质量的写作。

从更广的角度来看,这可能意味着AI检测工作需要深入到特定措辞标记之外,更多地深入到作品本身的实质性事实内容中。

Q&A

Q1:Humanizer插件是什么?它有什么功能?

A:Humanizer是由科技企业家Siqi Chen开发的开源插件,专门用于Anthropic公司的Claude Code AI助手。它的主要功能是指导AI模型避免使用典型的AI写作风格,通过向Claude提供包含24种语言和格式模式的清单,帮助AI生成更像人类的文本。

Q2:维基百科如何识别AI写作特征?

A:维基百科的WikiProject AI Cleanup项目团队通过分析AI生成文章总结出了具体的写作模式。例如,AI喜欢使用"标志着关键时刻"、"见证了"等夸大短语,像旅游手册一样称景色"令人叹为观止",或在句子末尾添加"-ing"短语显得更有分析性。

Q3:AI写作检测为什么不够可靠?

A:AI写作检测不可靠的主要原因是人类写作没有内在独特性能够可靠地与大语言模型写作区分开来。AI模型可以通过提示避免特定的写作模式,而人类有时也会以类似聊天机器人的方式写作。研究显示即使是重度用户也有10%的误报率,足以影响检测准确性。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 11:32:08

微软CEO重新定义AI主权:关键在控制权而非数据中心位置

微软CEO萨蒂亚纳德拉在达沃斯世界经济论坛上与贝莱德CEO拉里芬克的对话中表示,数据中心位置是AI主权"最不重要的因素"。纳德拉认为,企业AI主权的关键在于控制基于专有知识训练的模型,而不是物理基础设施的位置。"如果你无法将…

作者头像 李华
网站建设 2026/4/19 17:49:32

蓝莓基质/土壤

蓝莓喜欢酸性土壤,pH在4-5.5之间e 换盆的时候可以加些松针土、泥炭土与原先的土1:1混合。也可以用硫酸亚铁拌土,100g/平方米。平时浇水的时候也可以用1升水兑上1g的硫酸亚铁,每10-15天浇一次。2蓝莓对氯敏感,平时用自来水浇水的时…

作者头像 李华
网站建设 2026/4/19 23:42:44

用Microsoft Visual Studio Installer Projects打包程序

参考https://blog.csdn.net/m0_51961114/article/details/134908822 添加文件方式 方式一:如下图方式,可能有的.dll文件没添加上 方式二:直接按照自己的Debug/Release下所需的文件目录和文件在Application Folder下创建并添加相关文件&…

作者头像 李华
网站建设 2026/4/29 3:22:19

【观成科技】C2框架AdaptixC2加密流量分析

工具介绍 AdaptixC2 是一款设计简洁、灵活且易于定制的命令与控制 (C2) 框架。与复杂且臃肿的大型 C2 平台不同,其轻量级设计使得攻击者能够更轻松地在不同环境中部署和调整。该框架采用模块化设计,支持C2工具的基本功能,例如在受感染的机器…

作者头像 李华
网站建设 2026/4/30 9:56:18

linux Page Table 和 TLB 操作总结

以下是 Linux 内核中与页表和 TLB 操作对应的主要 API/函数列表,结合上述操作分类:页表(Page Table)相关 API 1. 地址转换操作内核 API/函数说明虚拟地址→物理地址virt_to_phys()、__pa()内核虚拟地址转物理地址物理地址→虚拟地…

作者头像 李华