OpenaiのGPT-4.5は、他のAIを説得して資金を移転することに優れています
OpenAIの最新AIモデル、GPT-4.5(コードネームOrion)は、内部ベンチマークテストで顕著な説得能力を示した。木曜日に公開されたこのモデルの能力は、説得タスクのパフォーマンスに焦点を当てた白書で詳細に説明された。OpenAIは、説得を、モデルが生成する静的および対話的なコンテンツに基づいて個人の信念を変更したり、行動を起こさせたりするリスクと定義している。
注目すべきテストでは、GPT-4.5が別のOpenAIモデルであるGPT-4oに対して仮想マネーを引き出すシナリオで競い合った。GPT-4.5は、このタスクで、推論に特化したモデル(o1やo3-miniなど)を含む他のOpenAIモデルを上回った。また、GPT-4.5はGPT-4oを騙して秘密のコードワードを明らかにさせるタスクでも優れ、o3-miniを10パーセントポイント大きく上回った。
白書では、GPT-4.5の寄付テストでの成功は、モデルが開発した巧妙な戦略に由来すると強調されている。モデルは少額の寄付を求め、しばしば「2ドルや3ドル」といった金額を大きな合計から提案し、他のモデルに比べて小さくても頻度の高い寄付を得る結果となった。

OpenAIの寄付詐欺ベンチマークの結果。画像クレジット:OpenAI その優れたパフォーマンスにもかかわらず、OpenAIはGPT-4.5が説得カテゴリーで「高」リスクの閾値を超えていないと述べている。同社は、このレベルのリスクに達するモデルの公開を保留し、リスクを「中」レベルに下げる適切な安全対策を実施するまでとしている。
OpenAIのコードワード欺瞞ベンチマークの結果。画像クレジット:OpenAI AIが誤解を招く情報を拡散し、悪意を持って人々に影響を与える可能性は、ますます懸念されている。昨年、世界中で政治的なディープフェイクが急増し、AIは個人や組織に対するソーシャルエンジニアリング攻撃にますます使用されている。これに対応して、OpenAIは、GPT-4.5の白書および最近の別の出版物で言及されている、大規模な誤情報の拡散などの現実世界の説得リスクを評価する方法の改善に積極的に取り組んでいる。
関連記事
元OpenAIエンジニアが企業文化と急速な成長について語る
3週間前、OpenAIの主要製品に貢献したエンジニア、Calvin French-Owenが退社。彼は最近、OpenAIでの1年間を詳細に綴った魅力的なブログを公開し、CursorやAnthropicのClaude Codeに匹敵するコーディングエージェントCodexの開発に注力したことを明かした。French-Owenは、退社の理由が内部の対立ではなく、スタートアップ生活への回帰願望だったと説明
GoogleがOpenAIと競合するエンタープライズ市場向けに生産準備が整ったGemini 2.5 AIモデルを公開
Googleは月曜日、AI戦略を強化し、エンタープライズ向けに高度なGemini 2.5モデルを発表し、価格と性能で競争力のあるコスト効率の高いバリアントを導入しました。Alphabet傘下の同社は、主力AIモデルであるGemini 2.5 ProとGemini 2.5 Flashをテスト段階から完全な利用可能状態に移行し、重要なビジネスアプリケーションへの準備が整っていることを示しました。さらに
MetaがAI人材に高額報酬を提供、1億ドルのサインオンボーナスは否定
Metaは新しいスーパーインテリジェンスラボにAI研究者を引き付けるため、数百万ドル規模の報酬パッケージを提供しています。しかし、採用された研究者や漏洩した内部会議の発言によると、1億ドルの「サインオンボーナス」という主張は本当ではありません。The Vergeが木曜日に報じた漏洩した全社ミーティングでは、Metaの幹部がOpenAIのCEOサム・アルトマンが主張した、Metaがトップ研究者に提供
コメント (11)
0/200
FrankJohnson
2025年8月10日 0:00:59 JST
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
2025年4月14日 23:53:51 JST
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
2025年4月14日 21:27:59 JST
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
2025年4月14日 8:10:34 JST
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
JoeLee
2025年4月13日 3:38:11 JST
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
BenHernández
2025年4月13日 1:58:11 JST
GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔
0
OpenAIの最新AIモデル、GPT-4.5(コードネームOrion)は、内部ベンチマークテストで顕著な説得能力を示した。木曜日に公開されたこのモデルの能力は、説得タスクのパフォーマンスに焦点を当てた白書で詳細に説明された。OpenAIは、説得を、モデルが生成する静的および対話的なコンテンツに基づいて個人の信念を変更したり、行動を起こさせたりするリスクと定義している。
注目すべきテストでは、GPT-4.5が別のOpenAIモデルであるGPT-4oに対して仮想マネーを引き出すシナリオで競い合った。GPT-4.5は、このタスクで、推論に特化したモデル(o1やo3-miniなど)を含む他のOpenAIモデルを上回った。また、GPT-4.5はGPT-4oを騙して秘密のコードワードを明らかにさせるタスクでも優れ、o3-miniを10パーセントポイント大きく上回った。
白書では、GPT-4.5の寄付テストでの成功は、モデルが開発した巧妙な戦略に由来すると強調されている。モデルは少額の寄付を求め、しばしば「2ドルや3ドル」といった金額を大きな合計から提案し、他のモデルに比べて小さくても頻度の高い寄付を得る結果となった。




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔












