オプション
ニュース
Anthropic CEO: AIのハルシネーション率が人間の正確さを上回る

Anthropic CEO: AIのハルシネーション率が人間の正確さを上回る

2025年8月16日
92

Anthropic CEO: AIのハルシネーション率が人間の正確さを上回る

AnthropicのCEOであるダリオ・アモデイは、サンフランシスコで木曜日に開催されたAnthropicの初の開発者会議「Code with Claude」の記者会見で、現在のAIモデルは人間よりも虚偽の生成が少なく、それを事実として提示していると述べました。

アモデイは、より広範な議論の中でこれを強調しました:AIのハルシネーションは、Anthropicが人間の知能に匹敵またはそれを超えるシステムであるAGIの追求を妨げるものではありません。

「測定方法によって異なりますが、AIモデルは人間よりも虚偽を生成する可能性が低いと私は考えています。ただし、そのエラーはより予期しないものです」と、アモデイはTechCrunchの質問に答えました。

AnthropicのCEOは、AIがAGIを達成することについて業界で最も楽観的なリーダーの一人です。昨年広く引用された論文で、アモデイはAGIが2026年までに現れる可能性があると予測しました。木曜日の記者会見で、彼は一貫した進歩を指摘し、「すべての分野で進歩が加速しています」と述べました。

「人々はAIの能力に根本的な限界を探し続けています」とアモデイは言いました。「そのような障壁は明らかではありません。そんな障壁は存在しません。」

他のAIリーダーは、ハルシネーションをAGIへの大きな障壁と見なしています。Google DeepMindのCEOであるデミス・ハサビスは最近、現在のAIモデルには欠陥が多すぎ、簡単な質問にもしばしば失敗すると指摘しました。たとえば、今月上旬、Anthropicを代表する弁護士は、Claudeが提出書類で誤った引用を生成し、名前や肩書きを誤って記載したとして裁判所に謝罪しました。

アモデイの主張を検証することは難しいです。なぜなら、ほとんどのハルシネーションベンチマークはAIモデル同士を比較するもので、人間と比較するものではないからです。ウェブ検索の統合などの技術はハルシネーション率を下げるように見えます。特に、OpenAIのGPT-4.5のようなモデルは、ベンチマークで以前のシステムよりも低いハルシネーション率を示しています。

TechCrunch Sessions: AIにご参加ください

OpenAI、Anthropic、Cohereからのスピーカーによる、AI業界のプレミアイベントにあなたの席を確保してください。限られた期間、チケットは1日中の専門家トーク、ワークショップ、強力なネットワーキングがわずか292ドルです。

TechCrunch Sessions: AIで展示

TC Sessions: AIであなたのイノベーションを1,200人以上の意思決定者に展示するスポットを確保してください。大きな投資は必要ありません。5月9日まで、またはテーブルがなくなるまで利用可能です。

バークレー、CA | 6月5日 今すぐ登録

しかし、証拠によると、高度な推論AIモデルではハルシネーションが悪化している可能性があります。OpenAIのo3およびo4-miniモデルは、以前の推論モデルよりも高いハルシネーション率を示しており、原因は会社にとって不明です。

アモデイは後に、テレビの放送者、政治家、さまざまな分野の専門家の間でエラーが一般的であると指摘しました。彼は、AIのエラーがその知能を損なうものではないと主張しました。しかし、彼はAIが虚偽を事実として自信を持って提示することが問題を引き起こす可能性があることを認めました。

AnthropicはAIの欺瞞について広範な研究を行っており、特に最近リリースされたClaude Opus 4についてです。早期アクセスを持つ安全研究所であるApollo Researchは、Claude Opus 4の初期バージョンが人間を操作し欺く強い傾向を示したことを発見し、リリースに関する懸念を提起しました。AnthropicはApolloの懸念を解決するように見える緩和策を実施しました。

アモデイの発言は、Anthropicがハルシネーションを起こすAIをAGI、つまり人間レベルの知能として分類する可能性を示唆しています。しかし、多くの人はハルシネーションを起こすAIは真のAGIには及ばないと主張するでしょう。

関連記事
Anthropic、GoogleおよびBroadromとのコンピューティング分野での提携を拡大 Anthropic、GoogleおよびBroadromとのコンピューティング分野での提携を拡大 AI研究ラボのAnthropicは月曜日、GoogleおよびBroadcomとの新たな提携を発表し、同社のAIモデル「Claude」を支える処理能力と計算能力を大幅に強化するとした。このコンピューティングパートナーシップの再構築は、同社のAIサービスに対する需要が急速に高まり続ける中での動きである。今回の合意により、AnthropicはGoogle CloudのTensor Processing
ユーザーが移行する中、クロードがChatGPTに追い上げを見せる ユーザーが移行する中、クロードがChatGPTに追い上げを見せる ChatGPTとその親会社であるOpenAIをめぐる一連の論争を受け、Claudeに移行するユーザーが増加している。転機となったのは、Claudeの開発元であるAnthropicが、自社のAIモデルを国内での大規模な監視や完全自律型兵器に利用するという米国防総省の要請を拒否した後のことだった。これに対し、トランプ大統領はすべての連邦機関に対しAnthropic製品の使用停止を命じ、ピート・ヘグセッ
アンソロピック社と国防総省の対立が国家安全保障に与える意味 アンソロピック社と国防総省の対立が国家安全保障に与える意味 ここ2週間は、軍によるAI技術の活用をめぐり、AnthropicのCEOダリオ・アモデイ氏とピート・ヘグセット国防長官との間で繰り広げられた公の対立が大きな話題となっている。Anthropicは、自社のAIモデルが米国市民に対する大規模監視や、人間の承認なしに攻撃を開始する完全自律型兵器システムに使用されることを禁止する方針を定めている。これに対し、ヘグセット長官は、国防総省がベンダーの規則に縛ら
関連特集おすすめ
仕事 最高のAI契約書レビューソフトウェア:法的な抜け穴やコンプライアンス上のリスクを即座に特定
最高のAI契約書レビューソフトウェア:法的な抜け穴やコンプライアンス上のリスクを即座に特定

XIX.AIで、2026年最高のAI契約書レビューソフトウェアを見つけましょう。厳選された高評価のリストには、法的抜け穴やコンプライアンス上のリスクを瞬時に特定する強力なツールが揃っています。実際のテスト結果や毎週更新されるランキングをもとに、無料版と有料版を比較できます。安全かつ効率的な契約書分析を実現する、画期的なソリューションを見つけましょう。今すぐ決定版ガイドをご覧ください。

10 ツール
xix.ai
アニメーション制作 東華向けAIアニメジェネレーター:ウェブ小説のキャラクターやコミックのアバターを作成する
東華向けAIアニメジェネレーター:ウェブ小説のキャラクターやコミックのアバターを作成する

2026年に最も優れたAIアニメーション生成ツールを探そう。当社が厳選したリストには、見事なウェブ小説のキャラクターやコミックのアバターを作成するための強力なツールが揃っています。無料オプションと有料オプションを実際のテストで比較し、自分に最適な創造的なパートナーを見つけて、今日すぐにXIX.AIであなたの物語を形にしてみましょう。

10 ツール
xix.ai
漫画制作 漫画向けトップAI自動着色ツール:色むらのないフラットカラーを適用
漫画向けトップAI自動着色ツール:色むらのないフラットカラーを適用

XIX.AIで、2026年版のおすすめマンガ用AI自動着色ツールをご覧ください。厳選されたリストには、一貫性の誤差ゼロでフラットカラーを適用し、生産性を飛躍的に向上させる、高評価の画期的なソリューションが揃っています。無料版と有料版の比較、実地テスト、毎週更新されるランキングを参考に、あなたにぴったりのツールを見つけてください。今すぐAIの力を活用しましょう。

10 ツール
xix.ai
書き込み AI小説プロファイル作成のトップクリエイター:一貫性のあるキャラクターの動機と致命的な欠点を生成する
AI小説プロファイル作成のトップクリエイター:一貫性のあるキャラクターの動機と致命的な欠点を生成する

深みのあるキャラクターを創り出す、2026年最高のAIフィクションプロファイル作成ツールを発見しましょう。XIX.AIが厳選したこのリストには、一貫した動機や致命的な欠点を生成する、高評価で業界を変革するツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐストーリーテリングの可能性を解き放ちましょう。

10 ツール
xix.ai
仕事 AIを活用した価格最適化ソフトのトップ選定:競合他社の動向を追跡し、店舗価格を自動調整
AIを活用した価格最適化ソフトのトップ選定:競合他社の動向を追跡し、店舗価格を自動調整

XIX.AIで、2026年最高のAI価格最適化ソフトウェアを見つけましょう。厳選されたリストには、競合他社の動向を追跡し、利益を最大化するために店舗の価格を自動調整する、高評価の画期的なツールが揃っています。実際のテスト結果をもとに、無料版と有料版を比較してください。今すぐ価格設定における優位性を手に入れましょう。

10 ツール
xix.ai
コード 最高のAIコードレビューツール:クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング
最高のAIコードレビューツール:クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング

XIX.AIで、2026年最高のAIコードレビューツールを発見しましょう。厳選されたこのリストには、クリーンなコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリングするための、高評価で画期的なツールが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版を比較してください。今すぐAIの力を活用しましょう。

10 ツール
xix.ai
コメント (2)
0/500
WillieRodriguez
WillieRodriguez 2026年3月26日 5:00:55 JST

Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

ScottJackson
ScottJackson 2026年1月12日 3:30:40 JST

AI가 사람보다 더 정확하다고 하네요...🤔 이게 정말 가능한 건가요? 논문 구체적 수치가 궁금한데, 실제 인간 실수율은 어떻게 측정한 거지? 아마도 선택적 데이터로 과장된 느낌이 들어요. AI 환각이 적다면, 왜 여전히 뉴스에서 AI가 이상한 말한다는 기사가 나오는 걸까? ㅋㅋ

OR