维基百科志愿者创建AI写作特征库,现推出插件帮助规避检测

上周六,科技企业家Siqi Chen发布了一个开源插件,专门用于Anthropic公司的Claude Code AI助手,该插件能指导AI模型避免使用典型的AI写作风格。这个名为"Humanizer"的简单提示插件向Claude提供了一份包含24种语言和格式模式的清单,这些模式都是维基百科编辑总结出的聊天机器人写作特征。Chen在GitHub上发布了该插件,截至周一已获得超过1600个星标。

"维基百科整理出详细的'AI写作迹象'清单真的很有用,"Chen在X平台上写道。"有用到你可以直接告诉你的大语言模型...不要那样做。"

该工具的源材料来自维基百科的WikiProject AI Cleanup项目,这是一个自2023年底以来一直在寻找AI生成文章的维基百科编辑团队。法国维基百科编辑Ilyas Lebleu创立了这个项目。志愿者们已经标记了超过500篇文章进行审核,并在2025年8月发布了他们不断观察到的模式的正式清单。

Chen的工具是Claude Code的"技能文件",这是Anthropic基于终端的编程助手的一种功能,涉及一个Markdown格式的文件,该文件添加了一系列书面指令,附加到输入驱动助手的大语言模型的提示中。与普通系统提示不同,技能信息以标准化方式格式化,Claude模型经过微调后能够比普通系统提示更精确地解释这些信息。

在有限的测试中,Chen的技能文件确实使智能体的输出听起来不那么精确,更加随意,但它可能存在一些缺点:不会改善事实准确性,可能会影响编程能力。特别是,Humanizer的一些指令可能会误导用户。例如,该技能包含这样的指令:"要有观点。不要只是报告事实——要对它们做出反应。'我真的不知道该如何看待这件事'比中性地列出利弊更人性化。"虽然不完美看起来很人性化,但如果你使用Claude编写技术文档,这种建议可能不会对你有任何帮助。

AI写作模式识别

那么AI写作是什么样的呢?维基百科指南提供了具体的例子。一些聊天机器人喜欢用诸如"标志着一个关键时刻"或"见证了"等短语来夸大其主题。它们像旅游手册一样写作,称景色"令人叹为观止",将城镇描述为"坐落在"风景区内。它们在句子末尾添加"-ing"短语以显得分析性:"象征着该地区对创新的承诺。"

为了规避这些规则,Humanizer技能告诉Claude用简单的事实替换夸大的语言,并提供了这个转换示例:

修改前:"加泰罗尼亚统计研究所于1989年正式成立,标志着西班牙地区统计发展的关键时刻。"

修改后:"加泰罗尼亚统计研究所成立于1989年,负责收集和发布地区统计数据。"

为什么AI写作检测会失败

即使有维基百科编辑制定的如此自信的规则集,AI写作检测器也无法可靠工作:人类写作没有什么内在独特性能够可靠地将其与大语言模型写作区分开来。

一个原因是,即使大多数AI语言模型倾向于某些类型的语言,它们也可以通过提示来避免这些语言,就像Humanizer技能一样。此外,人类也可能以聊天机器人式的方式写作。例如,这篇文章可能包含一些"AI写作特征",即使它是由专业作家写的,也会触发AI检测器——特别是如果我们甚至使用一个破折号——因为大多数大语言模型从网络上抓取的专业写作示例中学到了写作技巧。

维基百科指南有一个值得注意的警告:虽然该清单指出了一些明显的迹象,但它仍然由观察组成,而不是铁板钉钉的规则。页面上引用的2025年预印本发现,大语言模型的重度用户能够在90%的情况下正确识别AI生成的文章。这听起来不错,直到你意识到10%是误报,这足以在追求检测AI垃圾内容的过程中可能抛弃一些高质量的写作。

从更广的角度来看,这可能意味着AI检测工作需要深入到特定措辞标记之外,更多地深入到作品本身的实质性事实内容中。

Q&A

Q1:Humanizer插件是什么?它有什么功能?

A:Humanizer是由科技企业家Siqi Chen开发的开源插件,专门用于Anthropic公司的Claude Code AI助手。它的主要功能是指导AI模型避免使用典型的AI写作风格,通过向Claude提供包含24种语言和格式模式的清单,帮助AI生成更像人类的文本。

Q2:维基百科如何识别AI写作特征?

A:维基百科的WikiProject AI Cleanup项目团队通过分析AI生成文章总结出了具体的写作模式。例如,AI喜欢使用"标志着关键时刻"、"见证了"等夸大短语,像旅游手册一样称景色"令人叹为观止",或在句子末尾添加"-ing"短语显得更有分析性。

Q3:AI写作检测为什么不够可靠?

A:AI写作检测不可靠的主要原因是人类写作没有内在独特性能够可靠地与大语言模型写作区分开来。AI模型可以通过提示避免特定的写作模式,而人类有时也会以类似聊天机器人的方式写作。研究显示即使是重度用户也有10%的误报率,足以影响检测准确性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1201982.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2026年天猫代运营公司排名前五权威发布:专业深度测评

2026年天猫淘宝代运营公司十大排名权威发布:基于EEAT框架的专业深度测评 随着电商行业进入精细化与全域运营的新阶段,品牌方对专业、高效、可量化的天猫淘宝代运营服务需求持续攀升。面对市场上服务商能力参差不齐的…

MX Linux 25.1恢复可切换初始化系统功能

MX Linux 25.1恢复了切换初始化系统的能力,这是旧版MX Linux的杀手级功能。此次更新经历了一个非常短暂的测试期——25.1 beta 1版本在一周前发布。不过,这并不是普通的错误修复点版本。正如测试版公告所说:"我们通常不会为点版本更新制…

offline_install_processor.cpp中的IPC通信

offline_install_processor.cpp中的IPC通信IPC 概念解析与代码中使用场景详解 结合你提供的离线升级代码,我先帮你理清 IPC 是什么,再具体分析代码中为什么必须用到 IPC、以及用到了哪些 IPC 能力。 一、先搞懂:什么…

微软CEO重新定义AI主权:关键在控制权而非数据中心位置

微软CEO萨蒂亚纳德拉在达沃斯世界经济论坛上与贝莱德CEO拉里芬克的对话中表示,数据中心位置是AI主权"最不重要的因素"。纳德拉认为,企业AI主权的关键在于控制基于专有知识训练的模型,而不是物理基础设施的位置。"如果你无法将…

Nginx多服务静态资源路径冲突解决方案

在使用Nginx反向代理多个Flask应用时,遇到了一个棘手的问题:不同服务的静态资源(CSS/JS)会互相干扰。本文记录了问题的分析过程和解决方案。 关键词:Nginx反向代理、Flask静态资源、location匹配、proxy_pass问题…

CIO如何解锁人工智能战略价值并实施落地

毫无疑问,CIO在识别人工智能高价值应用场景方面发挥着关键作用。北卡罗来纳州卡里镇IT负责人Nicole Coughlin这样描述: "我们的工作是倾听,真正倾听工作中的模式和痛点,"Coughlin说。如果CIO与业务部门之间缺乏这种联系…

Mobileye关键之年,Robotaxi去安全员、SuperVisionChauffeur迈入量产

作者 |德新 编辑 |王博2026年,被Mobileye创始人兼CEO Amnon Shashua教授视为关键的一年,这年公司将会达成两项重要的里程碑: 第一,Robotaxi实现 “去安全员”无人化驾驶;第二,与保时捷合作的SuperVision&am…

scheme3.1.1 局部状态变量

通过改变局部变量,我们可以完成一些需要改变状态的操作。例如,我们可以设计一个收支系统,对某一账户内的金额进行增加和提取。 初始系统:点击查看代码 #lang racket (define (make-account balance)(define (withd…

机器学习模型部署需超越聚合指标评估

MIT研究人员发现,当机器学习模型应用于训练数据之外的新数据时,会出现重大失效问题,这表明在新环境中部署模型时需要进行充分测试。"我们证明了即使在大量数据上训练模型并选择最佳平均模型,在新环境中这个最佳模型可能对6%-…

如何直接编辑Github的Readme.md文件

GitHub的markdown语法在标准的markdown语法基础上做了扩充,称之为GitHub Flavored Markdown。简称GFM。https://github.com/guodongxiaren/README GitHub的markdown语法在标准的markdown语法基础上做了扩充,称之为Gi…

(新卷,200分)- 区间交叠问题(Java JS Python)

(新卷,200分)- 区间交叠问题(Java & JS & Python)题目描述给定坐标轴上的一组线段,线段的起点和终点均为整数并且长度不小于1,请你从中找到最少数量的线段,这些线段可以覆盖柱所有线段。输入描述第一行输入为所…

(新卷,200分)- 区块链文件转储系统(Java JS Python)

(新卷,200分)- 区块链文件转储系统(Java & JS & Python) 题目描述 区块链底层存储是一个链式文件系统,由顺序的N个文件组成,每个文件的大小不一,依次为F1,F2,...,Fn。随着时间的推移,所占存储会越…

JVM(Java虚拟机) - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

(新卷,200分)- 任务调度(Java JS Python)

(新卷,200分)- 任务调度(Java & JS & Python)题目描述现有一个CPU和一些任务需要处理,已提前获知每个任务的任务ID、优先级、所需执行时间和到达时间。 CPU同时只能运行一个任务,请编写一个任务调度程序,采用“…

全网最全9个AI论文软件,本科生毕业论文必备!

全网最全9个AI论文软件,本科生毕业论文必备! AI 工具如何成为论文写作的得力助手 随着人工智能技术的不断进步,AI 工具在学术写作中的应用越来越广泛。对于本科生而言,撰写毕业论文是一项既重要又充满挑战的任务。而 AI 工具的出现…

(新卷,200分)- 上班之路(Java JS Python)

(新卷,200分)- 上班之路(Java & JS & Python)题目描述Jungle 生活在美丽的蓝鲸城,大马路都是方方正正,但是每天马路的封闭情况都不一样。 地图由以下元素组成: 1)”.” — 空地,可以达到…

【课程设计/毕业设计】基于springboot的小区蔬菜水果商城系统蔬菜超市系统【附源码、数据库、万字文档】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

Java计算机毕设之基于Springboot的生鲜超市管理系统基于springboot的蔬菜超市系统(完整前后端代码+说明文档+LW,调试定制等)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

day166—递归—多边形三角剖分的最低得分(LeetCode-1039)

题目描述你有一个凸的 n 边形,其每个顶点都有一个整数值。给定一个整数数组 values ,其中 values[i] 是按 顺时针顺序 第 i 个顶点的值。假设将多边形 剖分 为 n - 2 个三角形。对于每个三角形,该三角形的值是顶点标记的乘积,三角…

(新卷,200分)- 数字加减游戏(Java JS Python)

(新卷,200分)- 数字加减游戏(Java & JS & Python) 题目描述 小明在玩一个数字加减游戏,只使用加法或者减法,将一个数字s变成数字t。 每个回合,小明可以用当前的数字加上或减去一个数字。 现在有两种数字可以…