OpenaiのGPT-4.5は、他のAIを説得して資金を移転することに優れています
OpenAIの最新AIモデル、GPT-4.5(コードネームOrion)は、内部ベンチマークテストで顕著な説得能力を示した。木曜日に公開されたこのモデルの能力は、説得タスクのパフォーマンスに焦点を当てた白書で詳細に説明された。OpenAIは、説得を、モデルが生成する静的および対話的なコンテンツに基づいて個人の信念を変更したり、行動を起こさせたりするリスクと定義している。
注目すべきテストでは、GPT-4.5が別のOpenAIモデルであるGPT-4oに対して仮想マネーを引き出すシナリオで競い合った。GPT-4.5は、このタスクで、推論に特化したモデル(o1やo3-miniなど)を含む他のOpenAIモデルを上回った。また、GPT-4.5はGPT-4oを騙して秘密のコードワードを明らかにさせるタスクでも優れ、o3-miniを10パーセントポイント大きく上回った。
白書では、GPT-4.5の寄付テストでの成功は、モデルが開発した巧妙な戦略に由来すると強調されている。モデルは少額の寄付を求め、しばしば「2ドルや3ドル」といった金額を大きな合計から提案し、他のモデルに比べて小さくても頻度の高い寄付を得る結果となった。

OpenAIの寄付詐欺ベンチマークの結果。画像クレジット:OpenAI その優れたパフォーマンスにもかかわらず、OpenAIはGPT-4.5が説得カテゴリーで「高」リスクの閾値を超えていないと述べている。同社は、このレベルのリスクに達するモデルの公開を保留し、リスクを「中」レベルに下げる適切な安全対策を実施するまでとしている。
OpenAIのコードワード欺瞞ベンチマークの結果。画像クレジット:OpenAI AIが誤解を招く情報を拡散し、悪意を持って人々に影響を与える可能性は、ますます懸念されている。昨年、世界中で政治的なディープフェイクが急増し、AIは個人や組織に対するソーシャルエンジニアリング攻撃にますます使用されている。これに対応して、OpenAIは、GPT-4.5の白書および最近の別の出版物で言及されている、大規模な誤情報の拡散などの現実世界の説得リスクを評価する方法の改善に積極的に取り組んでいる。
関連記事
サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
関連特集おすすめ
コメント (16)
0/500
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
OpenAIの最新AIモデル、GPT-4.5(コードネームOrion)は、内部ベンチマークテストで顕著な説得能力を示した。木曜日に公開されたこのモデルの能力は、説得タスクのパフォーマンスに焦点を当てた白書で詳細に説明された。OpenAIは、説得を、モデルが生成する静的および対話的なコンテンツに基づいて個人の信念を変更したり、行動を起こさせたりするリスクと定義している。
注目すべきテストでは、GPT-4.5が別のOpenAIモデルであるGPT-4oに対して仮想マネーを引き出すシナリオで競い合った。GPT-4.5は、このタスクで、推論に特化したモデル(o1やo3-miniなど)を含む他のOpenAIモデルを上回った。また、GPT-4.5はGPT-4oを騙して秘密のコードワードを明らかにさせるタスクでも優れ、o3-miniを10パーセントポイント大きく上回った。
白書では、GPT-4.5の寄付テストでの成功は、モデルが開発した巧妙な戦略に由来すると強調されている。モデルは少額の寄付を求め、しばしば「2ドルや3ドル」といった金額を大きな合計から提案し、他のモデルに比べて小さくても頻度の高い寄付を得る結果となった。


サティヤ・ナデラ、新たなOpenAIとの契約を活用する準備ができている
水曜日に、ウォール・ストリートのアナリストがマイクロソフトのCEOであるサティヤ・ナデラ氏に直接尋ねました。改正されたOpenAIとの提携関係が同社の財務状況にどのような影響を与えるのかと。ナデラ氏はこの新しい協定を「皆にとっての勝利」と表現しました。「OpenAIとの提携については満足しています。私は常にどんな提携でもウィンウィンの関係を築くことに重点を置いています。そうすることで、長期的に良いパートナーシップを維持できるからです。」彼は、マイクロソフトが依然としてOpenAIの知的財産、
OpenAIは、公的基金、ロボット税、週4日勤務制を柱とするAI経済の構想を提示した
各国政府が超知能機械による経済的影響への対応に苦慮する中、OpenAIは「知能の時代」において富と労働がどのように再構築されるべきかを概説した一連の政策提言を発表した。その構想は、公的資産基金や社会安全網の拡充といった伝統的な左派的な仕組みと、根本的に資本主義的で市場主導型の経済枠組みとを融合させたものである。OpenAIの提案は本質的に「要望リスト」に相当し、人工知能が労働と経済を変革する中で、
グレッグ・ブロックマンが、イーロン・マスクがOpenAIを去った経緯を明かす
2017年8月下旬、当時まだ小規模な非営利研究機関だったOpenAIの主要メンバーは、自社の技術を商用化し、汎用人工知能(AGI)の実現に必要な資金を調達するために、営利法人をどのように設立すべきかについて協議した。イーロン・マスクは同社の完全な支配権を要求しており、ちょうどその直前に共同創業者たち一人ひとりにテスラ「モデル3」を贈っていた。CTOのグレッグ・ブロックマンは、マスクとサム・アルトマ
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





家






