维基百科志愿者创建AI写作特征库，现推出插件帮助规避检测-编程阁

上周六，科技企业家Siqi Chen发布了一个开源插件，专门用于Anthropic公司的Claude Code AI助手，该插件能指导AI模型避免使用典型的AI写作风格。这个名为"Humanizer"的简单提示插件向Claude提供了一份包含24种语言和格式模式的清单，这些模式都是维基百科编辑总结出的聊天机器人写作特征。Chen在GitHub上发布了该插件，截至周一已获得超过1600个星标。

"维基百科整理出详细的'AI写作迹象'清单真的很有用，"Chen在X平台上写道。"有用到你可以直接告诉你的大语言模型...不要那样做。"

该工具的源材料来自维基百科的WikiProject AI Cleanup项目，这是一个自2023年底以来一直在寻找AI生成文章的维基百科编辑团队。法国维基百科编辑Ilyas Lebleu创立了这个项目。志愿者们已经标记了超过500篇文章进行审核，并在2025年8月发布了他们不断观察到的模式的正式清单。

Chen的工具是Claude Code的"技能文件"，这是Anthropic基于终端的编程助手的一种功能，涉及一个Markdown格式的文件，该文件添加了一系列书面指令，附加到输入驱动助手的大语言模型的提示中。与普通系统提示不同，技能信息以标准化方式格式化，Claude模型经过微调后能够比普通系统提示更精确地解释这些信息。

在有限的测试中，Chen的技能文件确实使智能体的输出听起来不那么精确，更加随意，但它可能存在一些缺点：不会改善事实准确性，可能会影响编程能力。特别是，Humanizer的一些指令可能会误导用户。例如，该技能包含这样的指令："要有观点。不要只是报告事实——要对它们做出反应。'我真的不知道该如何看待这件事'比中性地列出利弊更人性化。"虽然不完美看起来很人性化，但如果你使用Claude编写技术文档，这种建议可能不会对你有任何帮助。

AI写作模式识别

那么AI写作是什么样的呢？维基百科指南提供了具体的例子。一些聊天机器人喜欢用诸如"标志着一个关键时刻"或"见证了"等短语来夸大其主题。它们像旅游手册一样写作，称景色"令人叹为观止"，将城镇描述为"坐落在"风景区内。它们在句子末尾添加"-ing"短语以显得分析性："象征着该地区对创新的承诺。"

为了规避这些规则，Humanizer技能告诉Claude用简单的事实替换夸大的语言，并提供了这个转换示例：

修改前："加泰罗尼亚统计研究所于1989年正式成立，标志着西班牙地区统计发展的关键时刻。"

修改后："加泰罗尼亚统计研究所成立于1989年，负责收集和发布地区统计数据。"

为什么AI写作检测会失败

即使有维基百科编辑制定的如此自信的规则集，AI写作检测器也无法可靠工作：人类写作没有什么内在独特性能够可靠地将其与大语言模型写作区分开来。

一个原因是，即使大多数AI语言模型倾向于某些类型的语言，它们也可以通过提示来避免这些语言，就像Humanizer技能一样。此外，人类也可能以聊天机器人式的方式写作。例如，这篇文章可能包含一些"AI写作特征"，即使它是由专业作家写的，也会触发AI检测器——特别是如果我们甚至使用一个破折号——因为大多数大语言模型从网络上抓取的专业写作示例中学到了写作技巧。

维基百科指南有一个值得注意的警告：虽然该清单指出了一些明显的迹象，但它仍然由观察组成，而不是铁板钉钉的规则。页面上引用的2025年预印本发现，大语言模型的重度用户能够在90%的情况下正确识别AI生成的文章。这听起来不错，直到你意识到10%是误报，这足以在追求检测AI垃圾内容的过程中可能抛弃一些高质量的写作。

从更广的角度来看，这可能意味着AI检测工作需要深入到特定措辞标记之外，更多地深入到作品本身的实质性事实内容中。

Q&A

Q1：Humanizer插件是什么？它有什么功能？

A：Humanizer是由科技企业家Siqi Chen开发的开源插件，专门用于Anthropic公司的Claude Code AI助手。它的主要功能是指导AI模型避免使用典型的AI写作风格，通过向Claude提供包含24种语言和格式模式的清单，帮助AI生成更像人类的文本。

Q2：维基百科如何识别AI写作特征？

A：维基百科的WikiProject AI Cleanup项目团队通过分析AI生成文章总结出了具体的写作模式。例如，AI喜欢使用"标志着关键时刻"、"见证了"等夸大短语，像旅游手册一样称景色"令人叹为观止"，或在句子末尾添加"-ing"短语显得更有分析性。

Q3：AI写作检测为什么不够可靠？

A：AI写作检测不可靠的主要原因是人类写作没有内在独特性能够可靠地与大语言模型写作区分开来。AI模型可以通过提示避免特定的写作模式，而人类有时也会以类似聊天机器人的方式写作。研究显示即使是重度用户也有10%的误报率，足以影响检测准确性。