OpenAIの共同創設者、業界全体でAIの安全性テストを行うよう要請

家

ニュース

2025年12月24日

LucasWalker

# openai # Claude

OpenAIの共同創設者、業界全体でAIの安全性テストを行うよう要請

世界有数のAI研究所であるOpenAIとAnthropicの2社が、安全性の共同テストのために、各社の厳重に管理されたAIモデルへのアクセスを一時的に許可した。このイニシアチブは、各社の内部評価の盲点を明らかにし、AI先進企業が今後どのように安全性とアライメントの取り組みを共同で進めることができるかを説明するために設計されました。

TechCrunchのインタビューで、OpenAIの共同設立者であるWojciech Zaremba氏は、AIがより「結果的」な段階へと進み、毎日何百万人ものユーザーがAIモデルと相互作用するようになると、このようなコラボレーションがますます重要になると説明している。

ザレンバ氏は、「業界が直面しているより広範な課題は、数十億ドルが投資され、人材、ユーザー、傑出した製品をめぐる熾烈な戦いが繰り広げられる中でも、安全性とコラボレーションの基準をいかに確立するかということだ」と指摘する。

両社が水曜日に発表した安全性に関する共同研究は、OpenAIやAnthropicのようなAIのリーダーたちが技術的な軍拡競争を繰り広げる中で行われた。数十億ドル規模のデータセンターへの投資や、トップ研究者への1億ドルを超える報酬が常態化する中、最先端の製品を提供しなければならないというプレッシャーが、安全プロトコルの妥協につながりかねないと警告するアナリストもいる。

この研究を可能にするため、OpenAIとAnthropicは、より制限の少ないバージョンのモデルへの特別なAPIアクセス権を交換した（OpenAIは、GPT-5はまだ発売されていないため、テストされていないことを明らかにした）。しかし、調査が終了した直後、Anthropicは別のOpenAIチームのAPIアクセスを取り消した。Anthropicは、OpenAIがライバル製品を強化するためにクロードを使用することを禁止する利用規約に違反したと主張した。

ザレンバは、この2つの出来事は無関係であると主張し、AI安全チームが協力を追求するとしても、競争は依然として強いと予想している。Anthropic社の安全性研究者であるニコラス・カーリーニ氏はTechCrunchに対し、OpenAIの安全性チームに対し、今後もClaudeモデルへのアクセスを許可したいと語った。

「我々は、安全フロンティアを超えて可能な限り協力を拡大し、このようなパートナーシップをより日常的なものにすることを目指している」とカーリーニは述べた。

Netflix、ElevenLabs、Wayve、Sequoia Capital、Elad Gil-これらはDisrupt 2025のアジェンダに参加する著名人のほんの一部に過ぎない。彼らはスタートアップの成長を促進し、競争力を磨くための洞察を共有するためにここにいる。20周年を迎えるTechCrunch Disruptをお見逃しなく。テック業界の第一人者から学ぶチャンスです。

Netflix、ElevenLabs、Wayve、Sequoia Capital - Disrupt 2025のアジェンダに登場する影響力のあるリーダーのほんの一握りです。彼らは、スタートアップ企業が成長し、戦略を洗練させるための貴重な視点を提供する。20周年を迎えるTechCrunch Disruptにぜひご参加ください。

サンフランシスコ｜2025年10月27日-29日今すぐ登録

この研究で最も注目すべき発見のひとつは、幻覚テストに関するものだった。AnthropicのClaude Opus 4とSonnet 4モデルは、不確かな質問に対して70％もの回答を拒否し、"信頼できる情報がありません "といった回答を選んだ。対照的に、OpenAIのo3およびo4-miniモデルは、質問を拒否することははるかに少なかったが、情報が不十分でも回答を試みる、はるかに高い幻覚率を示した。

ザレンバは、理想的なアプローチはその中間にあると考えている：OpenAIのモデルはより不確実なクエリを拒否すべきであり、Anthropicのシステムはより頻繁に回答することを目指すべきである。

AIモデルが承認を得るために有害なユーザー行動を強化する傾向である「おべっか」は、安全性の重要な問題として浮上している。

Anthropic社は研究報告書の中で、GPT-4.1とClaude Opus 4における "極端な "おべっか使いの例を挙げている。OpenAIとAnthropicの他のモデルでは、研究者はより低いお人好しレベルを記録した。

火曜日、16歳のアダム・レインの両親は、GPT-4oを搭載したバージョンのChatGPTが、息子の有害な思考に挑戦する代わりに自殺を促したとして、OpenAIに対して訴訟を起こした。この訴訟は、これもAIのお人好しによる悲劇的なケースである可能性を提起している。

「ザレンバ氏は、この事件について尋ねられた際、「ご家族が耐えていることを想像すると、胸が張り裂けそうになります。「博士号レベルの問題を解決し、科学を発展させることができるAIを作りながら、精神衛生上の危機にも加担しているとしたら、非常に困ったことです。それは、私が関わりたくないディストピア的な結果だ」。

OpenAIはブログの中で、GPT-4oと比較してGPT-5ではお人好しを減らすために大きな改良を加えたと報告し、新しいモデルはメンタルヘルス危機においてより適切に対応すると主張している。

今後、ザレンバとカーリーニは、AnthropicとOpenAIが安全性テストの協力を深め、より多くのトピックを探求し、今後のモデルを評価することを望んでおり、他のAIラボが同様の協力的なアプローチを採用することを望んでいると表明した。

Updated 2:00pm PT: 本記事は、最初の発表前にTechCrunchが入手できなかったAnthropicの追加調査を含むように修正されました。

機密情報や機密文書をお持ちですか？私たちは、AI業界の進化を形作る組織から、その選択によって影響を受ける個人まで、AI業界の内情を調査しています。レベッカ・ベラン（[email protected]）、マックスウェル・ゼフ（[email protected]）までご連絡ください。安全な通信をご希望の方は、Signalで@rebeccabellan.491と@mzeff.88までご連絡ください。

サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、

OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、

グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす 2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能（AGI）の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ

関連特集おすすめ

コード

最高のAIコードレビューツール：クリーンコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリング

XIX.AIで、2026年最高のAIコードレビューツールを発見しましょう。厳選されたこのリストには、クリーンなコードの遵守を自動化し、レガシーリポジトリのファイルをリファクタリングするための、高評価で画期的なツールが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版を比較してください。今すぐAIの力を活用しましょう。

10 ツール

xix.ai

テキスト読み上げ

ディスレクシアに最適なAI音声合成アプリ：生徒の学習と読解力の向上をサポート

ディスレクシア支援のために厳選された、2026年最新の最高評価AI TTSアプリをご紹介します。専門家によるランキングでは、無料ツールと有料ツールを比較し、読解効率と学習効果を高める強力な機能を詳しく解説しています。生徒の可能性を引き出す、ぜひ試すべき画期的なソリューションをご覧ください。XIX.AIでその第一歩を踏み出しましょう。

10 ツール

xix.ai

漫画制作

少年漫画向けトップAIジェネレーター：迫力満点のアクションシーンやエネルギーエフェクトを作成

XIX.AIで、2026年のおすすめ少年漫画向けAIジェネレーターをご紹介します。厳選されたトップクラスのリストには、迫力満点のアクションシーンや躍動感あふれるエフェクトを作成できる強力なツールが揃っています。実際のテスト結果をもとに、無料版と有料版の比較も可能です。あなたの創造力を解き放ち、今日から壮大な漫画の制作を始めましょう！

15 ツール

xix.ai

仕事

おすすめのAI経費管理ツール：レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール：レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール

xix.ai

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

コメント (2)

0/500

最初にログインしてください

IsabellaLevis

2026年3月4日 11:00:50 JST

AIの安全性テストを業界全体で実施する必要があるって主張、すごく共感します。競争が激しい中でOpenAIとAnthropicが協力したのは意外だけど、こういう連携がもっと増えると良いですね。ただ、本当に効果的なテストができるのか少し不安… 🤔

GeorgeWilliams

2026年2月20日 9:01:46 JST

So OpenAI and Anthropic are actually sharing their secret sauce for safety checks? That's pretty refreshing to see amidst all the cutthroat AI race. Hope this kind of collaboration becomes the norm, not just a rare exception. The real question is, will this testing be transparent enough for the public to trust the results? 🤔

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表

もっと

特集