AIに生成されたテキストを一貫して識別する上位5つのAIコンテンツ検出器
2023年1月に、私はAI生成の盗作とそれに対抗するために設計されたツールの魅力的な世界に飛び込みました。その当時、生成AIに関する話題はようやく盛り上がり始めていました。そして現在、私はこの急速に進化する分野の最新の進展を反映した新しいアップデートを手にしています。
最初にGPT検出器をテストしたとき、利用可能な3つのチェッカーのうち最高で66%の精度しか得られませんでした。2025年2月には、テスト対象を最大10の異なるチェッカーに拡大しました。結果は?そのうち3つが完璧に的中しました。それからわずか数ヶ月後、その数は5つに増えました。これらのツールが日々進化していることは明らかです。
私がテストしているものとその方法
さらに深く掘り下げる前に、盗作とは何かを明確にしましょう。Merriam-Websterによると、「盗作」とは「他人のアイデアや言葉を盗み、自分のものとして偽る行為。出典を明記せずに他人の作品を使用すること」を意味します。この定義はAI生成コンテンツにも確かに当てはまります。Notion AIやChatGPTのようなAIツールを使用して、その出力をAIにクレジットを付けずに自分のものとして主張した場合、それは明白な盗作です。
これらのAI検出器を評価するために、私は5つのテキストブロックを使用します。2つは私が書き、3つはChatGPTが生成したものです。それぞれのブロックを各検出器に個別に通し、ツールがテキストを人間が書いたものかAI生成かを正しく識別するかを記録します。検出器がパーセンテージを示す場合、70%以上を人間またはAIの起源の強い指標と見なします。自分で試してみたい場合は、このドキュメントにテキストブロックがあります。
全体の結果
私は10の異なる検出器で5回のテストシリーズを実施し、合計50回の個別テストを行いました。はい、かなりのコーヒーが必要でした!テストした検出器には、BrandWell、Copyleaks、GPT-2 Output Detector、GPTZero、Grammarly、Monica、Originality.ai、QuillBot、Undetectable.ai、Writer.com、ZeroGPTが含まれます。
今回のアップデートでは、CopyleaksとMonicaを追加し、WritefullはGPT検出器を終了したため除外しました。Content Guardianも参加したかったのですが、テストのためにアカウントを設定する時間がありませんでした。
全体の結果のスナップショットは次のとおりです。ご覧の通り、5つの検出器が5つのテキストブロックをすべて人間またはAI生成として正しく識別しました。
David Gewirtz/ZDNET
また、6回の異なるテスト実行の結果を比較して、時間の経過に伴う改善の傾向を見つけようとしました。検出器の数を増やし、いくつかを入れ替えたものの、明確な改善のパターンはありません。唯一一貫した結果は、テスト5がすべての検出器と日付で確実に人間として識別されたことです。
David Gewirtz/ZDNET
これからもテストを続け、より一貫した信頼性が見られることを願っています。しかし、完璧なスコアがあっても、人間が書いたコンテンツを検証するためにこれらのツールを完全に信頼することはありません。実際、母語でない話者の文章は、AI生成コンテンツと間違われることがよくあります。
私の文章は今回ほとんど人間として識別されましたが、1つの検出器(GPTZero)は判断に迷い、もう1つ(Copyleaks)は誤ってAI生成とラベル付けしました。異なるシステム間で結果はかなり一貫性がありません。
各AIコンテンツ検出器のパフォーマンス
BrandWell AIコンテンツ検出(精度40%)
元々Content at Scaleによって開発されたこのツールは、現在、AIに焦点を当てたマーケティングサービス会社BrandWell.aiのもとで運営されています。残念ながら、その精度はかなり低かったです。テスト2で人間とAIコンテンツを区別できなかったことが、このスクリーンショットでわかります:
Screenshot by David Gewirtz/ZDNET
Copyleaks(精度80%)
Copyleaksが「99%以上の精度を持つ最も正確なAI検出器」と自慢するのは皮肉なことに、私がテストした検出器の半分以上がそれよりも優れていました。でも、マーケティング担当者はマーケティングをするものですよね?この会社は主に教育機関、出版社、企業向けにコンテンツの独創性と学術的誠実さを確保することを目的としています。
Screenshot by David Gewirtz/ZDNET
GPT-2 Output Detector(精度60%)
このツールは、ニューヨークに拠点を置くAI企業Hugging Faceが管理する機械学習ハブを使用して開発されました。同社は自然言語ライブラリの開発のために4000万ドルの資金を確保しましたが、GPT-2検出器はHugging Face Transformersライブラリを使用したユーザー作成のツールのようです。
Screenshot by David Gewirtz/ZDNET
GPTZero(精度80%)
GPTZeroは私の最初のテスト以来、大きく成長しました。当初は簡素なサイトで、会社なのか情熱プロジェクトなのかさえ不明でした。今では、「人間性を守る」ことを使命とする本格的な運営になり、AI検証ツールと盗作チェッカーを提供しています。しかし、パフォーマンスは少し低下しました。私の最後の2回の実行では私のテキストを人間生成と正しく識別しましたが、今回は誤ってAI生成とフラグを立てました。
Screenshot by David Gewirtz/ZDNET
Grammarly(精度40%)
Grammarlyはライターが文法的に正しいコンテンツを作成するのに役立つことで有名ですが、ここではそれがテスト対象ではありません。盗作やAI生成コンテンツもチェックします。文法チェッカーの右下に、盗作とAIテキストチェックボタンがあります:
Screenshot by David Gewirtz/ZDNET
GrammarlyのAIチェック精度は低かったものの、テストテキストが以前に公開されたものとして正しく識別されました。
Monica(精度100%)
Monicaはさまざまなサービスを提供するオールインワンのAIアシスタントとして新参者です。ユーザーは異なる大規模言語モデルを選択できます。会社はMonicaが「オンラインで最高のAI検出器」と主張していますが、ZeroGPT、GPTZero、Copyleaksなどの他の検出器を通じてコンテンツを実行しているようです。興味深いことに、GPTZeroとCopyleaksは私のテストで良い結果を出しませんでしたが、MonicaとZeroGPTはそうでした。完璧なスコアを獲得しましたが、今後のテストでも注目していきます。
Screenshot by David Gewirtz/ZDNET
Originality.ai(精度100%)
Originality.aiはAIおよび盗作チェッカーとして機能する商用サービスです。会社は使用クレジットを販売しており、この記事には30クレジットを使用しました。月額12.95ドルで2000クレジットを提供します。私は1400語をシステムに通し、月間割り当てのわずか1.5%を使用しました。
Screenshot by David Gewirtz/ZDNET
QuillBot(精度100%)
以前のテストでは、QuillBotの結果はバラバラで、同じテキストの複数回の実行で大きく異なるスコアが出ました。しかし今回は一貫して正確で、完璧な100%を記録しました。数ヶ月後に再確認して、このパフォーマンスを維持できるかチェックします。
Screenshot by David Gewirtz/ZDNET
Undetectable.ai(精度100%)
Undetectable.aiはAI生成テキストを「人間化」して検出器にフラグを立てられないようにする機能を誇っています。プロの著者兼教育者として、この機能は少し問題だと感じます—それは不正行為のように思えます。しかし、彼らのAI検出器は非常に優れたパフォーマンスを示しました。
Screenshot by David Gewirtz/ZDNET
AI検出器は5つのテストすべてに合格しました。他の検出器に対するフラグを示すインジケーターを見るのは興味深いです。会社は、「主要な検出器をモデルにした複数の検出アルゴリズムを開発し、連合的かつ合意に基づくアプローチを提供します。それらはリストされたモデルに直接入力されるのではなく、各モデルは生成した結果に基づいてトレーニングされています。それらのモデルがフラグを立てたと表示するのは、私たちが作成し更新したアルゴリズムに基づいています」と説明しました。
OpenAIのフラグについては、OpenAIのコンテンツ検出器が2023年に低精度のために終了したため、疑問がありました。それでも、Undetectable.aiは5つのテストすべてを正しく検出し、完璧な100%を獲得しました。
Writer.com AIコンテンツ検出器(精度40%)
Writer.comは企業チーム向けにAIライティングを生成するサービスです。そのAIコンテンツ検出ツールは生成コンテンツをスキャンできますが、精度は低かったです。5つのテストのうち3つがChatGPTによって生成されたにもかかわらず、すべてのテキストブロックを人間が書いたものと識別しました。
Screenshot by David Gewirtz/ZDNET
ZeroGPT(精度100%)
ZeroGPTは前回の評価以来、大きく進化しました。当時は明確な企業アイデンティティがなく、Google広告で雑然としていました。今では、透明な価格設定と連絡先情報を持つ洗練されたSaaSサービスです。精度も向上し、前回の80%から今回の完璧な100%に跳ね上がりました。
Screenshot by David Gewirtz/ZDNET
人間か、それともAIか?
あなたはどうですか?Copyleaks、Monica、ZeroGPTなどのAIコンテンツ検出器を試したことがありますか?その精度はどうでしたか?これらのツールを学術的または編集上の誠実さを守るために使用したことがありますか?人間が書いた作品が誤ってAIとしてフラグを立てられた状況に遭遇したことはありますか?独創性を評価するために他の検出器よりも信頼するものはありますか?以下のコメントで教えてください。
毎朝のトップストーリーをTech Todayニュースレターで受信トレイに受け取ってください。
私の日々のプロジェクトアップデートはソーシャルメディアでフォローできます。私の週間アップデートニュースレターを購読し、Twitter/Xで@DavidGewirtz、FacebookでFacebook.com/DavidGewirtz、InstagramでInstagram.com/DavidGewirtz、Blueskyで@DavidGewirtz.com、YouTubeでYouTube.com/DavidGewirtzTVでフォローしてください。
関連記事
AI駆動の塗り絵ブック作成:包括的ガイド
塗り絵ブックのデザインは、芸術的表現とユーザーのリラックス体験を組み合わせた報われる追求です。しかし、そのプロセスは労働集約的です。幸い、AIツールは高品質で均一な塗り絵ページを簡単に作成できます。このガイドは、AIを使用して一貫したスタイルと最適な効率に焦点を当てた塗り絵ブック作成のステップごとのアプローチを提供します。主なポイントAIプロンプトツールを使用して、詳細で構造化された塗り絵ページの
QodoがGoogle Cloudと提携し、開発者向け無料AIコードレビューを提供
Qodo、イスラエル拠点のAIコーディングスタートアップは、コード品質に焦点を当て、Google Cloudと提携し、AI生成ソフトウェアの完全性を強化。企業がコーディングにAIをますます活用する中、堅牢な監視と品質保証ツールの需要が増加。QodoのCEOイタマール・フリードマンは、AI生成コードが現代の開発の中心であると指摘。「AIがすべてのコードを書く未来を想像してください。人間がすべてをレビ
DeepMindのAIが2025年数学オリンピックで金メダルを獲得
DeepMindのAIは、数学的推論において驚くべき飛躍を遂げ、2024年に銀メダルを獲得したわずか1年後の2025年国際数学オリンピック(IMO)で金メダルを獲得しました。このブレークスルーは、AIが人間のような創造性を必要とする複雑で抽象的な問題を解く能力の向上を強調しています。この記事では、DeepMindの変革的な軌跡、主要な技術的進歩、そしてこのマイルストーンの広範な影響を探ります。IM
コメント (1)
0/200
ElijahCollins
2025年8月21日 0:01:16 JST
Wow, these AI detectors are getting scarily good! I tried one on a friend's 'original' essay, and it flagged half of it as AI-written. 🤯 Makes me wonder if we'll ever outsmart these tools or if they're the new sheriffs in town.
0
2023年1月に、私はAI生成の盗作とそれに対抗するために設計されたツールの魅力的な世界に飛び込みました。その当時、生成AIに関する話題はようやく盛り上がり始めていました。そして現在、私はこの急速に進化する分野の最新の進展を反映した新しいアップデートを手にしています。
最初にGPT検出器をテストしたとき、利用可能な3つのチェッカーのうち最高で66%の精度しか得られませんでした。2025年2月には、テスト対象を最大10の異なるチェッカーに拡大しました。結果は?そのうち3つが完璧に的中しました。それからわずか数ヶ月後、その数は5つに増えました。これらのツールが日々進化していることは明らかです。
私がテストしているものとその方法
さらに深く掘り下げる前に、盗作とは何かを明確にしましょう。Merriam-Websterによると、「盗作」とは「他人のアイデアや言葉を盗み、自分のものとして偽る行為。出典を明記せずに他人の作品を使用すること」を意味します。この定義はAI生成コンテンツにも確かに当てはまります。Notion AIやChatGPTのようなAIツールを使用して、その出力をAIにクレジットを付けずに自分のものとして主張した場合、それは明白な盗作です。
これらのAI検出器を評価するために、私は5つのテキストブロックを使用します。2つは私が書き、3つはChatGPTが生成したものです。それぞれのブロックを各検出器に個別に通し、ツールがテキストを人間が書いたものかAI生成かを正しく識別するかを記録します。検出器がパーセンテージを示す場合、70%以上を人間またはAIの起源の強い指標と見なします。自分で試してみたい場合は、このドキュメントにテキストブロックがあります。
全体の結果
私は10の異なる検出器で5回のテストシリーズを実施し、合計50回の個別テストを行いました。はい、かなりのコーヒーが必要でした!テストした検出器には、BrandWell、Copyleaks、GPT-2 Output Detector、GPTZero、Grammarly、Monica、Originality.ai、QuillBot、Undetectable.ai、Writer.com、ZeroGPTが含まれます。
今回のアップデートでは、CopyleaksとMonicaを追加し、WritefullはGPT検出器を終了したため除外しました。Content Guardianも参加したかったのですが、テストのためにアカウントを設定する時間がありませんでした。
全体の結果のスナップショットは次のとおりです。ご覧の通り、5つの検出器が5つのテキストブロックをすべて人間またはAI生成として正しく識別しました。
David Gewirtz/ZDNET
また、6回の異なるテスト実行の結果を比較して、時間の経過に伴う改善の傾向を見つけようとしました。検出器の数を増やし、いくつかを入れ替えたものの、明確な改善のパターンはありません。唯一一貫した結果は、テスト5がすべての検出器と日付で確実に人間として識別されたことです。
David Gewirtz/ZDNET
これからもテストを続け、より一貫した信頼性が見られることを願っています。しかし、完璧なスコアがあっても、人間が書いたコンテンツを検証するためにこれらのツールを完全に信頼することはありません。実際、母語でない話者の文章は、AI生成コンテンツと間違われることがよくあります。
私の文章は今回ほとんど人間として識別されましたが、1つの検出器(GPTZero)は判断に迷い、もう1つ(Copyleaks)は誤ってAI生成とラベル付けしました。異なるシステム間で結果はかなり一貫性がありません。
各AIコンテンツ検出器のパフォーマンス
BrandWell AIコンテンツ検出(精度40%)
元々Content at Scaleによって開発されたこのツールは、現在、AIに焦点を当てたマーケティングサービス会社BrandWell.aiのもとで運営されています。残念ながら、その精度はかなり低かったです。テスト2で人間とAIコンテンツを区別できなかったことが、このスクリーンショットでわかります:
Screenshot by David Gewirtz/ZDNET
Copyleaks(精度80%)
Copyleaksが「99%以上の精度を持つ最も正確なAI検出器」と自慢するのは皮肉なことに、私がテストした検出器の半分以上がそれよりも優れていました。でも、マーケティング担当者はマーケティングをするものですよね?この会社は主に教育機関、出版社、企業向けにコンテンツの独創性と学術的誠実さを確保することを目的としています。
Screenshot by David Gewirtz/ZDNET
GPT-2 Output Detector(精度60%)
このツールは、ニューヨークに拠点を置くAI企業Hugging Faceが管理する機械学習ハブを使用して開発されました。同社は自然言語ライブラリの開発のために4000万ドルの資金を確保しましたが、GPT-2検出器はHugging Face Transformersライブラリを使用したユーザー作成のツールのようです。
Screenshot by David Gewirtz/ZDNET
GPTZero(精度80%)
GPTZeroは私の最初のテスト以来、大きく成長しました。当初は簡素なサイトで、会社なのか情熱プロジェクトなのかさえ不明でした。今では、「人間性を守る」ことを使命とする本格的な運営になり、AI検証ツールと盗作チェッカーを提供しています。しかし、パフォーマンスは少し低下しました。私の最後の2回の実行では私のテキストを人間生成と正しく識別しましたが、今回は誤ってAI生成とフラグを立てました。
Screenshot by David Gewirtz/ZDNET
Grammarly(精度40%)
Grammarlyはライターが文法的に正しいコンテンツを作成するのに役立つことで有名ですが、ここではそれがテスト対象ではありません。盗作やAI生成コンテンツもチェックします。文法チェッカーの右下に、盗作とAIテキストチェックボタンがあります:
Screenshot by David Gewirtz/ZDNET
GrammarlyのAIチェック精度は低かったものの、テストテキストが以前に公開されたものとして正しく識別されました。
Monica(精度100%)
Monicaはさまざまなサービスを提供するオールインワンのAIアシスタントとして新参者です。ユーザーは異なる大規模言語モデルを選択できます。会社はMonicaが「オンラインで最高のAI検出器」と主張していますが、ZeroGPT、GPTZero、Copyleaksなどの他の検出器を通じてコンテンツを実行しているようです。興味深いことに、GPTZeroとCopyleaksは私のテストで良い結果を出しませんでしたが、MonicaとZeroGPTはそうでした。完璧なスコアを獲得しましたが、今後のテストでも注目していきます。
Screenshot by David Gewirtz/ZDNET
Originality.ai(精度100%)
Originality.aiはAIおよび盗作チェッカーとして機能する商用サービスです。会社は使用クレジットを販売しており、この記事には30クレジットを使用しました。月額12.95ドルで2000クレジットを提供します。私は1400語をシステムに通し、月間割り当てのわずか1.5%を使用しました。
Screenshot by David Gewirtz/ZDNET
QuillBot(精度100%)
以前のテストでは、QuillBotの結果はバラバラで、同じテキストの複数回の実行で大きく異なるスコアが出ました。しかし今回は一貫して正確で、完璧な100%を記録しました。数ヶ月後に再確認して、このパフォーマンスを維持できるかチェックします。
Screenshot by David Gewirtz/ZDNET
Undetectable.ai(精度100%)
Undetectable.aiはAI生成テキストを「人間化」して検出器にフラグを立てられないようにする機能を誇っています。プロの著者兼教育者として、この機能は少し問題だと感じます—それは不正行為のように思えます。しかし、彼らのAI検出器は非常に優れたパフォーマンスを示しました。
Screenshot by David Gewirtz/ZDNET
AI検出器は5つのテストすべてに合格しました。他の検出器に対するフラグを示すインジケーターを見るのは興味深いです。会社は、「主要な検出器をモデルにした複数の検出アルゴリズムを開発し、連合的かつ合意に基づくアプローチを提供します。それらはリストされたモデルに直接入力されるのではなく、各モデルは生成した結果に基づいてトレーニングされています。それらのモデルがフラグを立てたと表示するのは、私たちが作成し更新したアルゴリズムに基づいています」と説明しました。
OpenAIのフラグについては、OpenAIのコンテンツ検出器が2023年に低精度のために終了したため、疑問がありました。それでも、Undetectable.aiは5つのテストすべてを正しく検出し、完璧な100%を獲得しました。
Writer.com AIコンテンツ検出器(精度40%)
Writer.comは企業チーム向けにAIライティングを生成するサービスです。そのAIコンテンツ検出ツールは生成コンテンツをスキャンできますが、精度は低かったです。5つのテストのうち3つがChatGPTによって生成されたにもかかわらず、すべてのテキストブロックを人間が書いたものと識別しました。
Screenshot by David Gewirtz/ZDNET
ZeroGPT(精度100%)
ZeroGPTは前回の評価以来、大きく進化しました。当時は明確な企業アイデンティティがなく、Google広告で雑然としていました。今では、透明な価格設定と連絡先情報を持つ洗練されたSaaSサービスです。精度も向上し、前回の80%から今回の完璧な100%に跳ね上がりました。
Screenshot by David Gewirtz/ZDNET
人間か、それともAIか?
あなたはどうですか?Copyleaks、Monica、ZeroGPTなどのAIコンテンツ検出器を試したことがありますか?その精度はどうでしたか?これらのツールを学術的または編集上の誠実さを守るために使用したことがありますか?人間が書いた作品が誤ってAIとしてフラグを立てられた状況に遭遇したことはありますか?独創性を評価するために他の検出器よりも信頼するものはありますか?以下のコメントで教えてください。
毎朝のトップストーリーをTech Todayニュースレターで受信トレイに受け取ってください。
私の日々のプロジェクトアップデートはソーシャルメディアでフォローできます。私の週間アップデートニュースレターを購読し、Twitter/Xで@DavidGewirtz、FacebookでFacebook.com/DavidGewirtz、InstagramでInstagram.com/DavidGewirtz、Blueskyで@DavidGewirtz.com、YouTubeでYouTube.com/DavidGewirtzTVでフォローしてください。



Wow, these AI detectors are getting scarily good! I tried one on a friend's 'original' essay, and it flagged half of it as AI-written. 🤯 Makes me wonder if we'll ever outsmart these tools or if they're the new sheriffs in town.












