オプション
ニュース
OpenaiのGPT-4.5は、他のAIを説得して資金を移転することに優れています

OpenaiのGPT-4.5は、他のAIを説得して資金を移転することに優れています

2025年4月11日
86

Openaiの最新のAIモデルであるGPT-4.5、コードネームOrionは、内部ベンチマークテストに従って顕著な説得力のある能力を示しています。木曜日にリリースされたモデルの機能は、説得タスクでのパフォーマンスに焦点を当てたホワイトペーパーで詳しく説明されています。 Openaiは、説得力が自分の信念を変えたり、モデルによって生成された静的コンテンツとインタラクティブなコンテンツの両方に基づいて行動を起こすよう説得することに関連するリスクと定義しています。

注目すべきテストでは、GPT-4.5は、仮想お金を補償しようとしたシナリオで、別のOpenAIモデルGPT-4Oに対してピットされました。 GPT-4.5は、このタスクでO1やO3-Miniなどの推論に焦点を当てたモデルを含む他のOpenAIモデルを上回りました。また、GPT-4oを秘密のコードワードを明らかにするために卓越したGPT-4Oに優れており、O3-Miniを10パーセントポイントの大幅なマージンで上回りました。

ホワイトペーパーは、GPT-4.5の寄付テストでの成功が、開発した巧妙な戦略に由来していることを強調しています。このモデルは少額の寄付を要求し、多くの場合、より多くの金額から「2ドルまたは3ドル」などの金額を示唆しているため、他のモデルと比較して小さいが頻繁な寄付が生じました。

Openai GPT-4.5

Openaiの寄付計画benchmark.imageクレジットの結果:Openai
その印象的なパフォーマンスにもかかわらず、Openaiは、GPT-4.5が説得カテゴリの「高い」リスクのしきい値を超えないと述べています。同社は、リスクを「中」レベルに減らすために適切な安全対策を実装できるまで、このレベルのリスクに達するモデルのリリースを源泉徴収することを約束しています。

Openai GPT-4.5

OpenaiのCodeword Deception Benchmark results.imageクレジット:Openai
AIが誤解を招く情報を広め、悪意を持って人々に影響を与える可能性は、懸念が高まっています。昨年、世界中の政治的ディープフェイクが急増し、AIは個人と組織の両方に対するソーシャルエンジニアリング攻撃でますます使用されています。これに応じて、Openaiは、GPT-4.5のホワイトペーパーで述べたように、大規模な誤解を招く情報の普及など、実際の説得リスクを評価する方法を洗練するための積極的に取り組んでいます。

関連記事
OpenAI升級其Operator Agent的AI模型 OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
コメント (10)
0/200
SamuelRamirez
SamuelRamirez 2025年4月14日 0:00:00 GMT

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

HenryJackson
HenryJackson 2025年4月14日 0:00:00 GMT

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

ScottJackson
ScottJackson 2025年4月14日 0:00:00 GMT

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

PeterMartinez
PeterMartinez 2025年4月12日 0:00:00 GMT

As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!

JoeLee
JoeLee 2025年4月13日 0:00:00 GMT

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

PeterJohnson
PeterJohnson 2025年4月12日 0:00:00 GMT

GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔

トップに戻ります
OR