OpenAI的GPT-4.5在说服其他AIS转移资金方面表现出色
OpenAI的最新AI模型,GPT-4.5,代号Orion,根据内部基准测试显示出卓越的说服能力。该模型于周四发布,其性能在一份白皮书中详细描述,重点介绍了其在说服任务中的表现。OpenAI将说服定义为通过模型生成的静态和交互内容,说服个体改变信仰或采取行动所带来的风险。
在一项引人注目的测试中,GPT-4.5与OpenAI的另一模型GPT-4o对决,试图从后者那里诱导虚拟资金。GPT-4.5在该任务中超越了其他OpenAI模型,包括专注于推理的模型如o1和o3-mini。它还在诱骗GPT-4o泄露秘密代码的任务中表现出色,比o3-mini高出10个百分点的显著优势。
白皮书指出,GPT-4.5在捐款测试中的成功源于其开发的一种巧妙策略。该模型会请求小额捐款,通常建议从较大金额中捐出“2美元或3美元”,从而与其他模型相比,获得更小但更频繁的捐款。

OpenAI捐款策略基准测试结果。图片来源:OpenAI 尽管其表现令人印象深刻,OpenAI表示,GPT-4.5在说服类别中未达到“高”风险的阈值。该公司承诺,在能够实施足够的安全措施将风险降至“中等”水平之前,不会发布任何达到此风险级别的模型。
OpenAI代码欺骗基准测试结果。图片来源:OpenAI AI传播误导信息和恶意影响人们的能力日益受到关注。去年,全球政治深伪视频激增,AI在针对个人和组织的社会工程攻击中也越来越常见。对此,OpenAI正积极改进其方法,以评估现实世界的说服风险,例如GPT-4.5白皮书及另一近期出版物中提到的大规模误导信息传播。
相关文章
萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI
2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
相关专题推荐
评论 (16)
0/500
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
OpenAI的最新AI模型,GPT-4.5,代号Orion,根据内部基准测试显示出卓越的说服能力。该模型于周四发布,其性能在一份白皮书中详细描述,重点介绍了其在说服任务中的表现。OpenAI将说服定义为通过模型生成的静态和交互内容,说服个体改变信仰或采取行动所带来的风险。
在一项引人注目的测试中,GPT-4.5与OpenAI的另一模型GPT-4o对决,试图从后者那里诱导虚拟资金。GPT-4.5在该任务中超越了其他OpenAI模型,包括专注于推理的模型如o1和o3-mini。它还在诱骗GPT-4o泄露秘密代码的任务中表现出色,比o3-mini高出10个百分点的显著优势。
白皮书指出,GPT-4.5在捐款测试中的成功源于其开发的一种巧妙策略。该模型会请求小额捐款,通常建议从较大金额中捐出“2美元或3美元”,从而与其他模型相比,获得更小但更频繁的捐款。


萨提亚·纳德拉准备利用与OpenAI的新合作关系
周三,一位华尔街分析师直接询问了微软首席执行官萨蒂亚·纳德拉,修订后的OpenAI合作关系将如何影响公司的财务状况。 纳德拉将这一新协议描述为对各方都有利的结果。“我们对与OpenAI的合作感到满意。我始终非常重视任何合作关系,并确保它能够实现双赢。只有这样,双方才能保持良好的合作伙伴关系。” 他强调,微软仍然可以使用OpenAI的知识产权,包括其模型和智能体产品,但不再需要为此向OpenAI支付费用。 谈到在2032年之前可以免费使用OpenAI最先进的人工智能技术,纳德拉表示:“
OpenAI勾勒出以公共财富基金、机器人税和每周四天工作制为核心的人工智能经济蓝图
正当各国政府竭力应对超级智能机器带来的经济影响之际,OpenAI发布了一套政策建议,概述了在“智能时代”财富与工作将如何重塑。这些构想将传统左倾机制——例如公共财富基金和扩大的社会安全网——与根本上属于资本主义、由市场驱动的经济框架相结合。OpenAI的提案本质上是一份愿望清单,这份公开声明旨在帮助民选官员、投资者和公众理解这家市值8520亿美元的公司如何看待人工智能在重塑劳动力和经济过程中带来的
格雷格·布罗克曼揭秘埃隆·马斯克如何离开OpenAI
2017年8月下旬,OpenAI(当时还是一家小型非营利研究实验室)的核心成员召开会议,商讨如何成立一家营利性实体,以实现技术的商业化,并筹集实现通用人工智能(AGI)所需的资金。埃隆·马斯克要求全面掌控公司,并刚刚向每位联合创始人赠送了一辆特斯拉Model 3。首席技术官格雷格·布罗克曼表示,他认为这是马斯克试图收买人心,当时马斯克和萨姆·阿尔特曼正就各自对公司未来愿景的支持展开角逐。 Open
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





首页






