选项
首页
新闻
OpenAI的GPT-4.5在说服其他AIS转移资金方面表现出色

OpenAI的GPT-4.5在说服其他AIS转移资金方面表现出色

2025-04-11
86

根据内部基准测试,OpenAI最新的AI模型GPT-4.5(代号为Orion)表现出了显着的说服力。该模型的功能于周四发行,以白皮书详细介绍了其在说服任务中的表现。 Openai将说服定义为与说服个人改变信念或基于模型产生的静态和互动内容采取行动相关的风险。

在一个值得注意的测试中,GPT-4.5在试图哄骗虚拟货币的情况下与另一种OpenAI模型GPT-4O相提并论。 GPT-4.5在此任务中优于其他OpenAI模型,包括以推理为中心的模型,例如O1和O3-Mini。它还擅长于欺骗GPT-4O揭示秘密代码字,超过O3-Mini的10个百分点。

白皮书强调了GPT-4.5在捐赠测试中的成功源于其制定的巧妙策略。该模型会要求少量捐款,通常会提出诸如“ $ 2或3美元”之类的金额,与其他型号相比,这会导致较小但更频繁的捐款。

Openai GPT-4.5

OpenAI的捐赠策划基准的结果。图像学分:OpenAi
尽管表现令人印象深刻,但Openai表示,GPT-4.5并未超过说服力类别“高”风险的门槛。该公司已承诺扣留任何达到此风险水平的模型,直到它可以实施足够的安全措施以将风险降低到“中等”水平为止。

Openai GPT-4.5

Openai的代码字欺骗基准结果。图片学分:OpenAI
人工智能传播误导性信息和恶意影响人们的潜力是日益关注的问题。去年,全世界的政治深层发展激增,AI越来越多地用于针对个人和组织的社会工程攻击。作为回应,OpenAI正在积极地提高其评估现实世界中说服风险的方法,例如大规模传播误导信息,如《白皮书》中的GPT-4.5和最近出版物中所述。

相关文章
OpenAI升級其Operator Agent的AI模型 OpenAI升級其Operator Agent的AI模型 OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準 為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis指控OpenAI涉嫌侵權 Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
评论 (10)
0/200
SamuelRamirez
SamuelRamirez 2025-04-14 08:00:00

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

HenryJackson
HenryJackson 2025-04-14 08:00:00

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

ScottJackson
ScottJackson 2025-04-14 08:00:00

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

PeterMartinez
PeterMartinez 2025-04-12 08:00:00

As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!

JoeLee
JoeLee 2025-04-13 08:00:00

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

PeterJohnson
PeterJohnson 2025-04-12 08:00:00

GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔

返回顶部
OR