始终识别AI生成的文本的前5个AI内容检测器
早在2023年1月,我深入探索了人工智能生成的抄袭内容以及用于对抗它的工具。当时,生成式人工智能的热潮刚刚开始升温。快进到现在,我手上有了最新的更新,反映了这个快速发展领域的最新进展。
当我第一次测试GPT检测器时,三款可用的检测器中最好的一款准确率仅为66%。到了2025年2月,我扩展了测试,纳入了多达10款不同的检测器。结果如何?其中三款表现完美。仅仅几个月后,这个数字跃升至五款。显然,这些工具的精准度日益提高。
我在测试什么以及如何测试
在深入探讨之前,让我们先澄清抄袭的定义。根据Merriam-Webster,“抄袭”意指“窃取并冒充他人的想法或文字为己有;未经来源许可使用他人的作品”。这一定义显然适用于人工智能生成的内容。如果有人使用Notion AI或ChatGPT等人工智能工具,然后未经声明将输出内容据为己有,这仍然是抄袭,简单明了。
为了评估这些人工智能检测器,我使用了五段文本:两段由我撰写,三段由ChatGPT生成。我将每段文本分别通过每个检测器进行测试,记录工具是否能正确识别文本是人工撰写还是人工智能生成。如果检测器给出了百分比,我认为高于70%的结果是人工或人工智能来源的强指标。如果你有兴趣自己尝试,可以在这份文档中找到这些文本段。
总体结果
我在10款不同的检测器上进行了五轮测试,总共完成了50次单独测试。是的,这需要喝很多咖啡!我测试的检测器包括BrandWell、Copyleaks、GPT-2 Output Detector、GPTZero、Grammarly、Monica、Originality.ai、QuillBot、Undetectable.ai、Writer.com和ZeroGPT。
在这次更新中,我新增了Copyleaks和Monica,同时由于Writefull终止了其GPT检测器而将其剔除。Content Guardian想加入测试,但我未能及时设置好账户。
以下是总体结果的概览。如你所见,五款检测器成功正确识别了所有五段文本是人工撰写还是人工智能生成。
David Gewirtz/ZDNET
我还尝试通过比较六次不同测试运行的结果来发现随时间改进的趋势。虽然我增加了检测器的数量并替换了一些,但没有明显的改进模式。唯一一致的结果是,测试5在所有检测器和日期中都被可靠地识别为人工撰写。
David Gewirtz/ZDNET
我将继续测试,希望未来能看到更一致的可靠性。然而,即使有些检测器得分完美,我也不会完全信任这些工具来验证人工撰写的内容。事实证明,非母语者的写作常常被误认为是人工智能生成的内容。
尽管我自己的写作这次大多被识别为人工撰写,但一款检测器(GPTZero)过于不确定而无法判断,另一款(Copyleaks)错误地将其标记为人工智能生成。不同系统的结果可能相当不一致。
每款人工智能内容检测器的表现
BrandWell AI内容检测(准确率40%)
这款工具最初由Content at Scale开发,现由专注于人工智能的营销服务公司BrandWell.ai运营。不幸的是,其准确率相当低。在测试2中,它无法区分人工和人工智能内容,如下图所示:
Screenshot by David Gewirtz/ZDNET
Copyleaks(准确率80%)
具有讽刺意味的是,Copyleaks宣称拥有“超过99%准确率的最高精准度人工智能检测器”,而我测试的检测器中超过一半的表现优于它。不过,营销人员就是营销人员,对吧?这家公司主要服务于教育机构、出版商和企业,致力于确保内容原创性和学术诚信。
Screenshot by David Gewirtz/ZDNET
GPT-2 Output Detector(准确率60%)
这款工具由Hugging Face管理的人工智能公司开发,Hugging Face是一家总部位于纽约的人工智能公司。虽然该公司获得了4000万美元的资金用于开发其自然语言库,但GPT-2检测器似乎是用户使用Hugging Face Transformers库创建的工具。
Screenshot by David Gewirtz/ZDNET
GPTZero(准确率80%)
自从我第一次测试以来,GPTZero有了显著的增长。最初,它只是一个简单的网站,甚至不清楚它是一家公司还是个人兴趣项目。现在,它已成为一家成熟的公司,致力于“保护人类创作”。他们提供人工智能验证工具和抄袭检查器。然而,其表现略有下降。在我最近两次测试中,它正确识别了我的文本为人工撰写,但这次却错误地将其标记为人工智能生成。
Screenshot by David Gewirtz/ZDNET
Grammarly(准确率40%)
Grammarly以帮助作者生成语法正确的文本而闻名,但这不是我在这里测试的内容。它还提供抄袭和人工智能生成内容的检查。在语法检查器中,你会在右下角找到一个抄袭和人工智能文本检查按钮:
Screenshot by David Gewirtz/ZDNET
尽管Grammarly的人工智能检查准确率较低,但它正确识别了测试文本为先前发布的内容。
Monica(准确率100%)
Monica是新进入者,提供一体式人工智能助手,包含多种服务。用户可以选择不同的语言模型。该公司声称Monica是“最佳在线人工智能检测器”,但它似乎通过其他检测器如ZeroGPT、GPTZero和Copyleaks运行内容。有趣的是,GPTZero和Copyleaks在我的测试中表现不佳,但Monica和ZeroGPT却表现出色。它获得了满分,但我会在未来的测试中继续关注它。
Screenshot by David Gewirtz/ZDNET
Originality.ai(准确率100%)
Originality.ai是一家商业服务,同时提供人工智能和抄袭检查。该公司出售使用积分;我为这篇文章使用了30个积分。他们提供每月12.95美元的2000个积分。我通过系统运行了1400字,仅使用了每月分配的1.5%。
Screenshot by David Gewirtz/ZDNET
QuillBot(准确率100%)
在我之前的测试中,QuillBot的结果变化很大——同一文本的多次运行得出了截然不同的分数。然而,这次它始终准确,获得了100%的满分。我将在几个月后再次检查,看它能否保持这种表现。
Screenshot by David Gewirtz/ZDNET
Undetectable.ai(准确率100%)
Undetectable.ai宣称能够“人性化”人工智能生成的文本,使检测器无法识别。作为一名专业作者和教育工作者,我觉得这个功能有点令人不安,感觉像是在作弊。然而,他们的人工智能检测器表现非常出色。
Screenshot by David Gewirtz/ZDNET
人工智能检测器通过了所有五项测试。看到显示其他检测器标记的指标很有趣。该公司解释说:“我们开发了多个基于主要检测器模型的检测算法,以提供联合和基于共识的方法。它们并非直接输入列出的模型,而是根据这些模型生成的结果进行训练。当它说这些模型标记了内容时,是基于我们为这些模型创建和更新的算法。”
我对OpenAI标记有疑问,因为OpenAI的内容检测器因准确率低已于2023年停止使用。尽管如此,Undetectable.ai正确检测了所有五项测试,获得了100%的满分。
Writer.com人工智能内容检测器(准确率40%)
Writer.com是一家为企业团队生成人工智能写作的服务。其人工智能内容检测工具可以扫描生成内容,但准确率较低。它将每段文本都识别为人工撰写,尽管五项测试中有三项是由ChatGPT生成的。
Screenshot by David Gewirtz/ZDNET
ZeroGPT(准确率100%)
自从我上次评估以来,ZeroGPT有了长足的进步。当时,它缺乏明确的公司身份,并且充斥着Google广告。现在,它是一家成熟的SaaS服务,拥有透明的定价和联系信息。其准确率也显著提高,从上次的80%跃升至这次的100%满分。
Screenshot by David Gewirtz/ZDNET
是人工还是人工智能?
你呢?你试过Copyleaks、Monica或ZeroGPT等人工智能内容检测器吗?它们的准确率如何?你是否使用这些工具来保护学术或编辑诚信?你遇到过人工撰写的作品被错误标记为人工智能的情况吗?你更信任哪些检测器来评估原创性?请在下方评论中告诉我们。
通过我们的Tech Today时事通讯,每天早上获取头条新闻到你的收件箱。
你可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在Twitter/X上关注@DavidGewirtz,在Facebook上关注Facebook.com/DavidGewirtz,在Instagram上关注Instagram.com/DavidGewirtz,在Bluesky上关注@DavidGewirtz.com,以及在YouTube上关注YouTube.com/DavidGewirtzTV。
相关文章
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元
AIGCPanel 作为一款强大的本地数字人创作工具,刚刚发布了 2.0.0 版本——被誉为“迄今为止最重大的更新”。 此次核心升级通过工作流引擎和CLI命令行工具,将数字人合成、语音克隆及音视频处理功能有机整合,从而解决了当前AI创作工具分散的问题,实现了从手动组装到自动化生产的转变。1. 核心升级:定义逻辑流程,一键输出AIGCPanel 2.0.0 的突出新功能是工作流引擎:基于节点的组合:
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
相关专题推荐
评论 (4)
0/500
Pas mal cette mise à jour ! 😅 En janvier 2023, les détecteurs d'IA étaient encore balbutiants... C'est fou comme la course aux armements technologiques s'est intensifiée depuis. Est-ce qu'on ne risque pas de tomber dans une surveillance excessive des contenus ? Un peu effrayant comme perspective...
This article on AI content detectors is super insightful! 😊 It's wild how fast this tech is evolving since 2023. Makes me wonder if we'll ever outsmart these tools or if they'll always have the upper hand.
早在2023年1月,我深入探索了人工智能生成的抄袭内容以及用于对抗它的工具。当时,生成式人工智能的热潮刚刚开始升温。快进到现在,我手上有了最新的更新,反映了这个快速发展领域的最新进展。
当我第一次测试GPT检测器时,三款可用的检测器中最好的一款准确率仅为66%。到了2025年2月,我扩展了测试,纳入了多达10款不同的检测器。结果如何?其中三款表现完美。仅仅几个月后,这个数字跃升至五款。显然,这些工具的精准度日益提高。
我在测试什么以及如何测试
在深入探讨之前,让我们先澄清抄袭的定义。根据Merriam-Webster,“抄袭”意指“窃取并冒充他人的想法或文字为己有;未经来源许可使用他人的作品”。这一定义显然适用于人工智能生成的内容。如果有人使用Notion AI或ChatGPT等人工智能工具,然后未经声明将输出内容据为己有,这仍然是抄袭,简单明了。
为了评估这些人工智能检测器,我使用了五段文本:两段由我撰写,三段由ChatGPT生成。我将每段文本分别通过每个检测器进行测试,记录工具是否能正确识别文本是人工撰写还是人工智能生成。如果检测器给出了百分比,我认为高于70%的结果是人工或人工智能来源的强指标。如果你有兴趣自己尝试,可以在这份文档中找到这些文本段。
总体结果
我在10款不同的检测器上进行了五轮测试,总共完成了50次单独测试。是的,这需要喝很多咖啡!我测试的检测器包括BrandWell、Copyleaks、GPT-2 Output Detector、GPTZero、Grammarly、Monica、Originality.ai、QuillBot、Undetectable.ai、Writer.com和ZeroGPT。
在这次更新中,我新增了Copyleaks和Monica,同时由于Writefull终止了其GPT检测器而将其剔除。Content Guardian想加入测试,但我未能及时设置好账户。
以下是总体结果的概览。如你所见,五款检测器成功正确识别了所有五段文本是人工撰写还是人工智能生成。
David Gewirtz/ZDNET
我还尝试通过比较六次不同测试运行的结果来发现随时间改进的趋势。虽然我增加了检测器的数量并替换了一些,但没有明显的改进模式。唯一一致的结果是,测试5在所有检测器和日期中都被可靠地识别为人工撰写。
David Gewirtz/ZDNET
我将继续测试,希望未来能看到更一致的可靠性。然而,即使有些检测器得分完美,我也不会完全信任这些工具来验证人工撰写的内容。事实证明,非母语者的写作常常被误认为是人工智能生成的内容。
尽管我自己的写作这次大多被识别为人工撰写,但一款检测器(GPTZero)过于不确定而无法判断,另一款(Copyleaks)错误地将其标记为人工智能生成。不同系统的结果可能相当不一致。
每款人工智能内容检测器的表现
BrandWell AI内容检测(准确率40%)
这款工具最初由Content at Scale开发,现由专注于人工智能的营销服务公司BrandWell.ai运营。不幸的是,其准确率相当低。在测试2中,它无法区分人工和人工智能内容,如下图所示:
Screenshot by David Gewirtz/ZDNET
Copyleaks(准确率80%)
具有讽刺意味的是,Copyleaks宣称拥有“超过99%准确率的最高精准度人工智能检测器”,而我测试的检测器中超过一半的表现优于它。不过,营销人员就是营销人员,对吧?这家公司主要服务于教育机构、出版商和企业,致力于确保内容原创性和学术诚信。
Screenshot by David Gewirtz/ZDNET
GPT-2 Output Detector(准确率60%)
这款工具由Hugging Face管理的人工智能公司开发,Hugging Face是一家总部位于纽约的人工智能公司。虽然该公司获得了4000万美元的资金用于开发其自然语言库,但GPT-2检测器似乎是用户使用Hugging Face Transformers库创建的工具。
Screenshot by David Gewirtz/ZDNET
GPTZero(准确率80%)
自从我第一次测试以来,GPTZero有了显著的增长。最初,它只是一个简单的网站,甚至不清楚它是一家公司还是个人兴趣项目。现在,它已成为一家成熟的公司,致力于“保护人类创作”。他们提供人工智能验证工具和抄袭检查器。然而,其表现略有下降。在我最近两次测试中,它正确识别了我的文本为人工撰写,但这次却错误地将其标记为人工智能生成。
Screenshot by David Gewirtz/ZDNET
Grammarly(准确率40%)
Grammarly以帮助作者生成语法正确的文本而闻名,但这不是我在这里测试的内容。它还提供抄袭和人工智能生成内容的检查。在语法检查器中,你会在右下角找到一个抄袭和人工智能文本检查按钮:
Screenshot by David Gewirtz/ZDNET
尽管Grammarly的人工智能检查准确率较低,但它正确识别了测试文本为先前发布的内容。
Monica(准确率100%)
Monica是新进入者,提供一体式人工智能助手,包含多种服务。用户可以选择不同的语言模型。该公司声称Monica是“最佳在线人工智能检测器”,但它似乎通过其他检测器如ZeroGPT、GPTZero和Copyleaks运行内容。有趣的是,GPTZero和Copyleaks在我的测试中表现不佳,但Monica和ZeroGPT却表现出色。它获得了满分,但我会在未来的测试中继续关注它。
Screenshot by David Gewirtz/ZDNET
Originality.ai(准确率100%)
Originality.ai是一家商业服务,同时提供人工智能和抄袭检查。该公司出售使用积分;我为这篇文章使用了30个积分。他们提供每月12.95美元的2000个积分。我通过系统运行了1400字,仅使用了每月分配的1.5%。
Screenshot by David Gewirtz/ZDNET
QuillBot(准确率100%)
在我之前的测试中,QuillBot的结果变化很大——同一文本的多次运行得出了截然不同的分数。然而,这次它始终准确,获得了100%的满分。我将在几个月后再次检查,看它能否保持这种表现。
Screenshot by David Gewirtz/ZDNET
Undetectable.ai(准确率100%)
Undetectable.ai宣称能够“人性化”人工智能生成的文本,使检测器无法识别。作为一名专业作者和教育工作者,我觉得这个功能有点令人不安,感觉像是在作弊。然而,他们的人工智能检测器表现非常出色。
Screenshot by David Gewirtz/ZDNET
人工智能检测器通过了所有五项测试。看到显示其他检测器标记的指标很有趣。该公司解释说:“我们开发了多个基于主要检测器模型的检测算法,以提供联合和基于共识的方法。它们并非直接输入列出的模型,而是根据这些模型生成的结果进行训练。当它说这些模型标记了内容时,是基于我们为这些模型创建和更新的算法。”
我对OpenAI标记有疑问,因为OpenAI的内容检测器因准确率低已于2023年停止使用。尽管如此,Undetectable.ai正确检测了所有五项测试,获得了100%的满分。
Writer.com人工智能内容检测器(准确率40%)
Writer.com是一家为企业团队生成人工智能写作的服务。其人工智能内容检测工具可以扫描生成内容,但准确率较低。它将每段文本都识别为人工撰写,尽管五项测试中有三项是由ChatGPT生成的。
Screenshot by David Gewirtz/ZDNET
ZeroGPT(准确率100%)
自从我上次评估以来,ZeroGPT有了长足的进步。当时,它缺乏明确的公司身份,并且充斥着Google广告。现在,它是一家成熟的SaaS服务,拥有透明的定价和联系信息。其准确率也显著提高,从上次的80%跃升至这次的100%满分。
Screenshot by David Gewirtz/ZDNET
是人工还是人工智能?
你呢?你试过Copyleaks、Monica或ZeroGPT等人工智能内容检测器吗?它们的准确率如何?你是否使用这些工具来保护学术或编辑诚信?你遇到过人工撰写的作品被错误标记为人工智能的情况吗?你更信任哪些检测器来评估原创性?请在下方评论中告诉我们。
通过我们的Tech Today时事通讯,每天早上获取头条新闻到你的收件箱。
你可以在社交媒体上关注我的日常项目更新。请务必订阅我的每周更新时事通讯,并在Twitter/X上关注@DavidGewirtz,在Facebook上关注Facebook.com/DavidGewirtz,在Instagram上关注Instagram.com/DavidGewirtz,在Bluesky上关注@DavidGewirtz.com,以及在YouTube上关注YouTube.com/DavidGewirtzTV。
OpenAI 停用 o3 和 GPT-4.5 大型模型
作为人工智能领域的领军企业,OpenAI的每一步技术举措都会在业界引发巨大反响。近日,该公司发布了一项重大公告:将从其ChatGPT平台退役两个经典模型——o3和GPT-4.5。 常被称为“人文天才”的 GPT-4.5 将于 6 月 27 日下线,而以硬核推理能力著称的 o3 则将于 8 月 26 日跟进。经典模型的退役引发怀旧之情这一突如其来的消息让许多付费老用户难以接受,社交社区和讨论区很快充
AIGCPanel 2.0.0 重大更新:工作流引擎开启自动化数字人创作的新纪元
AIGCPanel 作为一款强大的本地数字人创作工具,刚刚发布了 2.0.0 版本——被誉为“迄今为止最重大的更新”。 此次核心升级通过工作流引擎和CLI命令行工具,将数字人合成、语音克隆及音视频处理功能有机整合,从而解决了当前AI创作工具分散的问题,实现了从手动组装到自动化生产的转变。1. 核心升级:定义逻辑流程,一键输出AIGCPanel 2.0.0 的突出新功能是工作流引擎:基于节点的组合:
BuzzFeed 推出专注于垃圾应用的 AI 子公司
在面临重大经营危机的背景下,曾经的数字媒体巨头BuzzFeed正启动一项由人工智能驱动的雄心勃勃的自救实验。 在最近举行的SXSW大会上,联合创始人兼首席执行官乔纳·佩雷蒂宣布成立一家名为Branch Office的子公司,旨在通过一系列由人工智能驱动的消费者应用程序,重新定义“软件即内容”的商业模式。核心产品组合:融合网络梗与社交媒体Branch Office 推出了三款核心应用,每款都旨在捕捉
Pas mal cette mise à jour ! 😅 En janvier 2023, les détecteurs d'IA étaient encore balbutiants... C'est fou comme la course aux armements technologiques s'est intensifiée depuis. Est-ce qu'on ne risque pas de tomber dans une surveillance excessive des contenus ? Un peu effrayant comme perspective...
This article on AI content detectors is super insightful! 😊 It's wild how fast this tech is evolving since 2023. Makes me wonder if we'll ever outsmart these tools or if they'll always have the upper hand.





首页






