ニュース AIに生成されたテキストを一貫して識別する上位5つのAIコンテンツ検出器

AIに生成されたテキストを一貫して識別する上位5つのAIコンテンツ検出器

2025年5月4日
WillCarter
0

2023年1月に、私はAIが生成された盗作の魅力的な世界と、それと戦うために設計されたツールを掘り下げました。当時、生成AIの周りの話題は蒸気を拾い始めたばかりでした。今まで早送りすると、この急速に進化する分野の最新の開発を反映して、私の手に新たな更新があります。

最初にGPT検出器をテストに入れたとき、私が得た最高のものは、利用可能な3つのチェッカーのうちの1つから66%の精度率でした。 2025年2月に早送りすると、テストを拡張して、最大10個の異なるチェッカーを含めるようにしました。結果?それらの3つはそれを完全に釘付けにしました。ほんの数か月後、その数は5にジャンプしました。これらのツールが日ごとに鋭くなっていることは明らかです。

私がテストしていることと私がそれをしていること

より深く潜る前に、盗作の意味を明確にしましょう。 Merriam-Websterによれば、「盗用」するということは、「ソースを称賛せずに、自分のものとして(他の人のアイデアや言葉)を盗んで伝えることを意味します(他の人のアイデアや言葉)。この定義は、確かにAIの生成コンテンツに適用されます。誰かが概念AIやChatGPTなどのAIツールを使用して、AIに功績を与えずに出力を自分のものとして主張している場合、それはまだ盗作であり、単純でシンプルです。

これらのAI検出器を評価するには、5つのブロックのテキストを使用します。2つは私によって書かれ、3つはChatGptによって生成されました。各ブロックを各検出器を個別に実行し、ツールがテキストを人間またはAIに生成したものとして正しく識別しているかどうかに注意してください。検出器がパーセンテージを与える場合、70%を超えるものは人間またはAIの起源の強力な指標と考えています。自分でこれを試してみたい場合は、このドキュメントでテキストブロックを見つけることができます。

全体的な結果

10種類の検出器で一連の5つのテストを実行しました。つまり、50個の個別のテストをなんと実行しました。はい、それはたくさんのコーヒーが必要でした!私がテストした検出器には、Brandwell、Copeleaks、GPT-2出力検出器、Gptzero、Grammarly、Monica、Originality.ai、Quillbot、Untectable.ai、writer.com、およびZerogptが含まれます。

この更新のために、CopeleaksとMonicaをミックスに追加しましたが、GPT検出器を中止してからWritefullを落としました。コンテンツガーディアンは望んでいましたが、テストに間に合うようにアカウントを設定できませんでした。

これが全体的な結果のスナップショットです。ご覧のとおり、5つの検出器が5つのテキストブロックすべてを人間またはAIのいずれかのテキストブロックと正しく識別することができました。

2025-04-Content-detector-001 David Gewirtz/Zdnet

また、6つの異なるテスト実行の結果を比較することにより、時間の経過とともに改善の傾向を見つけようとしました。検出器の数を増やし、いくつかを交換しましたが、改善の明確なパターンはありません。唯一の一貫した結果は、すべての検出器と日付でテスト5が人間として確実に識別されたことです。

2025-04-Content-detector-002 David Gewirtz/Zdnet

私はテストを続け、将来より一貫した信頼性を見たいと思っています。しかし、いくつかの完璧なスコアがあっても、私はこれらのツールを完全に信用して、人間が作成したコンテンツを検証することはできません。結局のところ、非ネイティブスピーカーからの執筆は、多くの場合、AIが生成されたコンテンツと間違えられます。

私自身の執筆は今回の人間としてほとんど識別されていましたが、ある検出器(gptzero)は判断するにはあまりにも不確実であり、別の検出は誤ってそれをAIを生成したと誤ってラベル付けしました。結果は、異なるシステム間で非常に矛盾する可能性があります。

各AIコンテンツ検出器の実行方法

ブランドウェルAIコンテンツ検出(精度40%)

当初、Content at Scaleによって開発されたこのツールは、AIに焦点を当てたマーケティングサービス会社であるBrandwell.aiで動作しています。残念ながら、その精度はかなり低かった。このスクリーンショットで見ることができるように、テスト2の人間とAIのコンテンツを区別できませんでした。

ブランドウェル David Gewirtz/Zdnetのスクリーンショット

コピーリーク(精度80%)

私がテストした検出器の半分以上がより良くなったときに、Copeleaksが「99%以上の精度で最も正確なAI検出器」を誇るのは皮肉です。しかし、ねえ、マーケティング担当者はマーケティング担当者になりますよね?同社は主に、コンテンツの独創性と学問の完全性を確保しようとしている教育機関、出版社、および企業に対応しています。

コピーリーク David Gewirtz/Zdnetのスクリーンショット

GPT-2出力検出器(精度60%)

このツールは、ニューヨークに拠点を置くAI会社であるHugging Faceによって管理された機械学習ハブを使用して開発されました。同社は自然言語ライブラリを開発するために4,000万ドルの資金を確保しましたが、GPT-2検出器は、ハグするフェイストランスライブラリーを使用したユーザーが作成したツールのようです。

GPT2 David Gewirtz/Zdnetのスクリーンショット

Gptzero(精度80%)

Gptzeroは私の最初のテスト以来大幅に成長しました。当初、それはベアボーンのサイトであり、それが会社なのか情熱プロジェクトなのかさえ明らかではありませんでした。今、それは「人間を保護する」という使命を備えた本格的な操作です。 AI検証ツールと盗作チェッカーを提供しています。しかし、そのパフォーマンスは少し浸りました。それは私のテキストを私の最後の2回のランで人間で生成したと正しく識別しましたが、今回は、それを誤ってAIが生成されたとフラグを立てました。

Gptzero David Gewirtz/Zdnetのスクリーンショット

文法(精度40%)

Grammarlyは、作家が文法的に正しいコンテンツを生産するのを支援することで有名ですが、それは私がここでテストしているものではありません。また、盗作とAIに生成されたコンテンツをチェックします。文法チェッカーには、右下隅に盗作とAIのテキストチェックボタンがあります。

文法 David Gewirtz/Zdnetのスクリーンショット

GrammarlyのAI-Checkの精度は貧弱でしたが、以前に公開されたようにテストテキストを正しく識別しました。

モニカ(精度100%)

モニカはシーンの新人であり、さまざまなサービスを備えたオールインワンAIアシスタントを提供しています。ユーザーは、異なる大規模な言語モデルから選択できます。同社は、モニカは「オンラインで最高のAI検出器」であると主張していますが、Zerogpt、Gptzero、Copyleaksなどの他の検出器を介してコンテンツを実行しているようです。興味深いことに、GptzeroとCopyleaksは両方とも私のテストではうまくいきませんでしたが、モニカとZerogptは発生しました。完璧なスコアを獲得しましたが、将来のテストでは注目しています。

モニカ David Gewirtz/Zdnetのスクリーンショット

Originality.ai(精度100%)

Originality.aiは、AIおよび盗作チェッカーを兼ねる商業サービスです。同社は使用クレジットを販売しています。この記事には30単位を使用しました。彼らは月額12.95ドルで2,000単位を提供しています。私はシステムを介して1,400語を走り、毎月の割り当てのわずか1.5%を使用しました。

独創 David Gewirtz/Zdnetのスクリーンショット

quillbot(精度100%)

私の以前のテストでは、Quillbotの結果はあちこちにありました。同じテキストのMultiple Runは、スコアが大きく異なりました。しかし、今回は一貫して正確で、完璧な100%を獲得しました。このパフォーマンスを維持できるかどうかを確認するために、数か月以内に確認します。

quillbot David Gewirtz/Zdnetのスクリーンショット

検出不可能な.ai(精度100%)

検出不可能です。AIは、AIに生成されたテキストを「人間化」する能力を誇っているため、検出器はフラグを立てません。プロの著者であり教育者として、私はこの機能が少し厄介だと感じています。それは不正行為のように感じます。ただし、AI検出器もあり、非常にうまく機能しています。

検出できません David Gewirtz/Zdnetのスクリーンショット

AI検出器は、5つのテストすべてに合格しました。インジケーターが他の検出器のフラグを示すのを見るのは興味深いことです。同社は、「これらの主要な検出器をモデルにした複数の検出器アルゴリズムを開発して、フェデレーションとコンセンサスに基づくアプローチを提供しました。リストされたモデルに直接フィードしません。むしろ、モデルはそれぞれ生成された結果に基づいてトレーニングされています。これらのモデルにフラグが付けられた場合、それらのモデルのために作成および更新されたアルゴリズムに基づいています。」

Openaiのコンテンツ検出器は、精度が低いために2023年に中止されたため、Openaiフラグについて質問がありました。それにもかかわらず、検出不可能です。AIは5つのテストすべてを正しく検出し、完璧な100%を獲得しました。

writer.com AIコンテンツ検出器(精度40%)

Writer.comは、企業チームのAI執筆を生み出すサービスです。そのAIコンテンツ検出器ツールは、生成されたコンテンツをスキャンできますが、その精度は低かったです。 5つのテストのうち3つがCHATGPTによって生成されたにもかかわらず、すべてのテキストブロックを人間が作成したものとして識別しました。

作家 David Gewirtz/Zdnetのスクリーンショット

Zerogpt(精度100%)

Zerogptは、私の最後の評価以来長い道のりを歩んできました。当時、それは明確な会社のアイデンティティを欠いており、Google広告で散らかっていました。現在、透明な価格と連絡先情報を備えた洗練されたSaaSサービスです。その精度も改善され、前回の80%から今度は完璧な100%にジャンプしました。

Zerogpt David Gewirtz/Zdnetのスクリーンショット

それは人間ですか、それともaiですか?

あなたはどうですか? Copyleaks、Monica、ZerogptなどのAIコンテンツ検出器を試しましたか?彼らはあなたの経験にどれほど正確でしたか?これらのツールを使用して、学術的または編集上の完全性を保護しましたか?人間が書いた作品がAIと誤ってフラグを立てられた状況に遭遇しましたか?独創性を評価するために、他の人よりも信頼できる検出器はありますか?以下のコメントでお知らせください。

Tech Today Newsletterで毎日、朝のトップストーリーを受信トレイで入手してください。

ソーシャルメディアでの日々のプロジェクトの更新をフォローできます。毎週の更新ニュースレターを購読して、@davidgewirtzのTwitter/x、facebook.com/davidgewirtzの@davidgewirtz、instagram.com/davidgewirtz、 @davidgewirtz.com、youtubeのyoutube.com/davidgewirtztvのTwitter/Xでフォローしてください。

関連記事
ブラックピンクの英語ラップジャーニー:ブンバヤから生まれたピンクまで ブラックピンクの英語ラップジャーニー:ブンバヤから生まれたピンクまで グローバルなKポップ現象であるBlackPinkは、感染性の曲、完璧なダンスの動き、磁気の魅力で、本当に世界を嵐に巻き込んでいます。彼らの英語のラップは、彼らの国際的なファンベースへのうなずきとしてだけでなく、彼らの言語の才能と大学の証として傑出した機能になりました
LLM Medical Feature Development:Innovationに耐性ケアを変革します LLM Medical Feature Development:Innovationに耐性ケアを変革します Aithe World of Healthcareとの肥沃度クリニックに革命を起こすことは、人工知能(AI)の統合のおかげで、特に不妊クリニックでの変革を目の当たりにしています。この記事では、SQLおよびGraphQLテクノロジーと並んで、大規模な言語モデル(LLMS)がどのように強化されているかを探ります
YCの現在のコホートのスタートアップの4分の1には、ほぼ完全にAIが生成されたコードベースがあります YCの現在のコホートのスタートアップの4分の1には、ほぼ完全にAIが生成されたコードベースがあります コード生成におけるAIの役割の高まり:Yコンビネーターからの洞察ソフトウェア開発のランドスケープは急速に進化しており、AIはますます中心的な役割を果たしています。この傾向の注目すべき例は、有名なシリコンバレースタートアップアクセラートであるYコンビネーターの最新のコホートで明らかです
コメント (0)
0/200
Back to Top
OR