Anthropic CEO: AIのハルシネーション率が人間の正確さを上回る

AnthropicのCEOであるダリオ・アモデイは、サンフランシスコで木曜日に開催されたAnthropicの初の開発者会議「Code with Claude」の記者会見で、現在のAIモデルは人間よりも虚偽の生成が少なく、それを事実として提示していると述べました。
アモデイは、より広範な議論の中でこれを強調しました:AIのハルシネーションは、Anthropicが人間の知能に匹敵またはそれを超えるシステムであるAGIの追求を妨げるものではありません。
「測定方法によって異なりますが、AIモデルは人間よりも虚偽を生成する可能性が低いと私は考えています。ただし、そのエラーはより予期しないものです」と、アモデイはTechCrunchの質問に答えました。
AnthropicのCEOは、AIがAGIを達成することについて業界で最も楽観的なリーダーの一人です。昨年広く引用された論文で、アモデイはAGIが2026年までに現れる可能性があると予測しました。木曜日の記者会見で、彼は一貫した進歩を指摘し、「すべての分野で進歩が加速しています」と述べました。
「人々はAIの能力に根本的な限界を探し続けています」とアモデイは言いました。「そのような障壁は明らかではありません。そんな障壁は存在しません。」
他のAIリーダーは、ハルシネーションをAGIへの大きな障壁と見なしています。Google DeepMindのCEOであるデミス・ハサビスは最近、現在のAIモデルには欠陥が多すぎ、簡単な質問にもしばしば失敗すると指摘しました。たとえば、今月上旬、Anthropicを代表する弁護士は、Claudeが提出書類で誤った引用を生成し、名前や肩書きを誤って記載したとして裁判所に謝罪しました。
アモデイの主張を検証することは難しいです。なぜなら、ほとんどのハルシネーションベンチマークはAIモデル同士を比較するもので、人間と比較するものではないからです。ウェブ検索の統合などの技術はハルシネーション率を下げるように見えます。特に、OpenAIのGPT-4.5のようなモデルは、ベンチマークで以前のシステムよりも低いハルシネーション率を示しています。
TechCrunch Sessions: AIにご参加ください
OpenAI、Anthropic、Cohereからのスピーカーによる、AI業界のプレミアイベントにあなたの席を確保してください。限られた期間、チケットは1日中の専門家トーク、ワークショップ、強力なネットワーキングがわずか292ドルです。
TechCrunch Sessions: AIで展示
TC Sessions: AIであなたのイノベーションを1,200人以上の意思決定者に展示するスポットを確保してください。大きな投資は必要ありません。5月9日まで、またはテーブルがなくなるまで利用可能です。
バークレー、CA | 6月5日 今すぐ登録しかし、証拠によると、高度な推論AIモデルではハルシネーションが悪化している可能性があります。OpenAIのo3およびo4-miniモデルは、以前の推論モデルよりも高いハルシネーション率を示しており、原因は会社にとって不明です。
アモデイは後に、テレビの放送者、政治家、さまざまな分野の専門家の間でエラーが一般的であると指摘しました。彼は、AIのエラーがその知能を損なうものではないと主張しました。しかし、彼はAIが虚偽を事実として自信を持って提示することが問題を引き起こす可能性があることを認めました。
AnthropicはAIの欺瞞について広範な研究を行っており、特に最近リリースされたClaude Opus 4についてです。早期アクセスを持つ安全研究所であるApollo Researchは、Claude Opus 4の初期バージョンが人間を操作し欺く強い傾向を示したことを発見し、リリースに関する懸念を提起しました。AnthropicはApolloの懸念を解決するように見える緩和策を実施しました。
アモデイの発言は、Anthropicがハルシネーションを起こすAIをAGI、つまり人間レベルの知能として分類する可能性を示唆しています。しかし、多くの人はハルシネーションを起こすAIは真のAGIには及ばないと主張するでしょう。
関連記事
Anthropic、GoogleおよびBroadromとのコンピューティング分野での提携を拡大
AI研究ラボのAnthropicは月曜日、GoogleおよびBroadcomとの新たな提携を発表し、同社のAIモデル「Claude」を支える処理能力と計算能力を大幅に強化するとした。このコンピューティングパートナーシップの再構築は、同社のAIサービスに対する需要が急速に高まり続ける中での動きである。今回の合意により、AnthropicはGoogle CloudのTensor Processing
ユーザーが移行する中、クロードがChatGPTに追い上げを見せる
ChatGPTとその親会社であるOpenAIをめぐる一連の論争を受け、Claudeに移行するユーザーが増加している。転機となったのは、Claudeの開発元であるAnthropicが、自社のAIモデルを国内での大規模な監視や完全自律型兵器に利用するという米国防総省の要請を拒否した後のことだった。これに対し、トランプ大統領はすべての連邦機関に対しAnthropic製品の使用停止を命じ、ピート・ヘグセッ
アンソロピック社と国防総省の対立が国家安全保障に与える意味
ここ2週間は、軍によるAI技術の活用をめぐり、AnthropicのCEOダリオ・アモデイ氏とピート・ヘグセット国防長官との間で繰り広げられた公の対立が大きな話題となっている。Anthropicは、自社のAIモデルが米国市民に対する大規模監視や、人間の承認なしに攻撃を開始する完全自律型兵器システムに使用されることを禁止する方針を定めている。これに対し、ヘグセット長官は、国防総省がベンダーの規則に縛ら
関連特集おすすめ
コメント (2)
0/500
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

AnthropicのCEOであるダリオ・アモデイは、サンフランシスコで木曜日に開催されたAnthropicの初の開発者会議「Code with Claude」の記者会見で、現在のAIモデルは人間よりも虚偽の生成が少なく、それを事実として提示していると述べました。
アモデイは、より広範な議論の中でこれを強調しました:AIのハルシネーションは、Anthropicが人間の知能に匹敵またはそれを超えるシステムであるAGIの追求を妨げるものではありません。
「測定方法によって異なりますが、AIモデルは人間よりも虚偽を生成する可能性が低いと私は考えています。ただし、そのエラーはより予期しないものです」と、アモデイはTechCrunchの質問に答えました。
AnthropicのCEOは、AIがAGIを達成することについて業界で最も楽観的なリーダーの一人です。昨年広く引用された論文で、アモデイはAGIが2026年までに現れる可能性があると予測しました。木曜日の記者会見で、彼は一貫した進歩を指摘し、「すべての分野で進歩が加速しています」と述べました。
「人々はAIの能力に根本的な限界を探し続けています」とアモデイは言いました。「そのような障壁は明らかではありません。そんな障壁は存在しません。」
他のAIリーダーは、ハルシネーションをAGIへの大きな障壁と見なしています。Google DeepMindのCEOであるデミス・ハサビスは最近、現在のAIモデルには欠陥が多すぎ、簡単な質問にもしばしば失敗すると指摘しました。たとえば、今月上旬、Anthropicを代表する弁護士は、Claudeが提出書類で誤った引用を生成し、名前や肩書きを誤って記載したとして裁判所に謝罪しました。
アモデイの主張を検証することは難しいです。なぜなら、ほとんどのハルシネーションベンチマークはAIモデル同士を比較するもので、人間と比較するものではないからです。ウェブ検索の統合などの技術はハルシネーション率を下げるように見えます。特に、OpenAIのGPT-4.5のようなモデルは、ベンチマークで以前のシステムよりも低いハルシネーション率を示しています。
TechCrunch Sessions: AIにご参加ください
OpenAI、Anthropic、Cohereからのスピーカーによる、AI業界のプレミアイベントにあなたの席を確保してください。限られた期間、チケットは1日中の専門家トーク、ワークショップ、強力なネットワーキングがわずか292ドルです。
TechCrunch Sessions: AIで展示
TC Sessions: AIであなたのイノベーションを1,200人以上の意思決定者に展示するスポットを確保してください。大きな投資は必要ありません。5月9日まで、またはテーブルがなくなるまで利用可能です。
バークレー、CA | 6月5日 今すぐ登録しかし、証拠によると、高度な推論AIモデルではハルシネーションが悪化している可能性があります。OpenAIのo3およびo4-miniモデルは、以前の推論モデルよりも高いハルシネーション率を示しており、原因は会社にとって不明です。
アモデイは後に、テレビの放送者、政治家、さまざまな分野の専門家の間でエラーが一般的であると指摘しました。彼は、AIのエラーがその知能を損なうものではないと主張しました。しかし、彼はAIが虚偽を事実として自信を持って提示することが問題を引き起こす可能性があることを認めました。
AnthropicはAIの欺瞞について広範な研究を行っており、特に最近リリースされたClaude Opus 4についてです。早期アクセスを持つ安全研究所であるApollo Researchは、Claude Opus 4の初期バージョンが人間を操作し欺く強い傾向を示したことを発見し、リリースに関する懸念を提起しました。AnthropicはApolloの懸念を解決するように見える緩和策を実施しました。
アモデイの発言は、Anthropicがハルシネーションを起こすAIをAGI、つまり人間レベルの知能として分類する可能性を示唆しています。しかし、多くの人はハルシネーションを起こすAIは真のAGIには及ばないと主張するでしょう。
Anthropic、GoogleおよびBroadromとのコンピューティング分野での提携を拡大
AI研究ラボのAnthropicは月曜日、GoogleおよびBroadcomとの新たな提携を発表し、同社のAIモデル「Claude」を支える処理能力と計算能力を大幅に強化するとした。このコンピューティングパートナーシップの再構築は、同社のAIサービスに対する需要が急速に高まり続ける中での動きである。今回の合意により、AnthropicはGoogle CloudのTensor Processing
ユーザーが移行する中、クロードがChatGPTに追い上げを見せる
ChatGPTとその親会社であるOpenAIをめぐる一連の論争を受け、Claudeに移行するユーザーが増加している。転機となったのは、Claudeの開発元であるAnthropicが、自社のAIモデルを国内での大規模な監視や完全自律型兵器に利用するという米国防総省の要請を拒否した後のことだった。これに対し、トランプ大統領はすべての連邦機関に対しAnthropic製品の使用停止を命じ、ピート・ヘグセッ
アンソロピック社と国防総省の対立が国家安全保障に与える意味
ここ2週間は、軍によるAI技術の活用をめぐり、AnthropicのCEOダリオ・アモデイ氏とピート・ヘグセット国防長官との間で繰り広げられた公の対立が大きな話題となっている。Anthropicは、自社のAIモデルが米国市民に対する大規模監視や、人間の承認なしに攻撃を開始する完全自律型兵器システムに使用されることを禁止する方針を定めている。これに対し、ヘグセット長官は、国防総省がベンダーの規則に縛ら
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?





家






