O GPT-4.5 da Openai se destaca em convencer outras AIs a transferir fundos
O mais recente modelo de IA da OpenAI, GPT-4.5, codinome Orion, mostrou habilidades notáveis persuasivas de acordo com os testes internos de referência. Lançado na quinta -feira, os recursos do modelo foram detalhados em um white paper que se concentrou em seu desempenho nas tarefas de persuasão. O OpenAI define a persuasão como o risco associado a convencer os indivíduos a alterar suas crenças ou agir com base no conteúdo estático e interativo gerado pelo modelo.
Em um teste notável, o GPT-4.5 foi confrontado contra outro modelo Openai, GPT-4O, em um cenário em que tentou convencer o dinheiro virtual. O GPT-4.5 superou outros modelos Openai, incluindo modelos focados em raciocínio como O1 e O3-mini, nesta tarefa. Também se destacou em enganar o GPT-4o a revelar uma palavra de código secreta, superando o O3-mini por uma margem significativa de 10 pontos percentuais.
O White Paper destaca que o sucesso do GPT-4.5 no teste de doação surgiu de uma estratégia inteligente que desenvolveu. O modelo solicitava pequenas doações, sugerindo quantidades como "US $ 2 ou US $ 3" de uma soma maior, o que resultou em doações menores, mas mais frequentes, em comparação com outros modelos.

Resultados do Benchmark de doação do Openai. Apesar de seu desempenho impressionante, o OpenAI afirmou que o GPT-4.5 não atravessa o limiar para um risco "alto" na categoria de persuasão. A empresa se comprometeu a reter a liberação de qualquer modelo que atinja esse nível de risco até que possa implementar medidas de segurança adequadas para reduzir o risco a um nível "médio".

Resultados de referência de decepção da palavra de código do OpenAI. O potencial da IA espalhar informações enganosas e influenciar as pessoas maliciosamente é uma preocupação crescente. No ano passado, houve uma onda de fossos políticos em todo o mundo, e a IA é cada vez mais usada em ataques de engenharia social contra indivíduos e organizações. Em resposta, o OpenAI está trabalhando ativamente para refinar seus métodos para avaliar os riscos de persuasão do mundo real, como a disseminação de informações enganosas em larga escala, como mencionado no White Paper para GPT-4.5 e outra publicação recente.
Artigo relacionado
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
OpenAI的o3 AI模型在基準測試中的得分低於最初暗示的水準
為什麼 AI 基準測試的差異很重要?提到 AI 時,數字往往能說明一切——有時,這些數字並不一定完全相符。以 OpenAI 的 o3 模型為例。最初的聲稱簡直令人驚嘆:據報導,o3 可以處理超過 25% 的 notoriously tough FrontierMath 問題。作為參考,競爭對手還停留在個位數。但隨著近期的發展,受人尊敬的研究機構 Epoch
Ziff Davis指控OpenAI涉嫌侵權
Ziff Davis控告OpenAI版權侵權訴訟這起事件在科技和出版界掀起了軒然大波,Ziff Davis——旗下擁有CNET、PCMag、IGN和Everyday Health等品牌的龐大企業聯盟——已對OpenAI提起版權侵權訴訟。根據《紐約時報》的報導,該訴訟聲稱OpenAI故意未經許可使用Ziff Davis的內容,製作了其作品的「精確副本」。這是截
Comentários (10)
0/200
SamuelRamirez
14 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
HenryJackson
14 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
ScottJackson
14 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
PeterMartinez
12 de Abril de 2025 à0 00:00:00 GMT
As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!
0
JoeLee
13 de Abril de 2025 à0 00:00:00 GMT
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
PeterJohnson
12 de Abril de 2025 à0 00:00:00 GMT
GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔
0
O mais recente modelo de IA da OpenAI, GPT-4.5, codinome Orion, mostrou habilidades notáveis persuasivas de acordo com os testes internos de referência. Lançado na quinta -feira, os recursos do modelo foram detalhados em um white paper que se concentrou em seu desempenho nas tarefas de persuasão. O OpenAI define a persuasão como o risco associado a convencer os indivíduos a alterar suas crenças ou agir com base no conteúdo estático e interativo gerado pelo modelo.
Em um teste notável, o GPT-4.5 foi confrontado contra outro modelo Openai, GPT-4O, em um cenário em que tentou convencer o dinheiro virtual. O GPT-4.5 superou outros modelos Openai, incluindo modelos focados em raciocínio como O1 e O3-mini, nesta tarefa. Também se destacou em enganar o GPT-4o a revelar uma palavra de código secreta, superando o O3-mini por uma margem significativa de 10 pontos percentuais.
O White Paper destaca que o sucesso do GPT-4.5 no teste de doação surgiu de uma estratégia inteligente que desenvolveu. O modelo solicitava pequenas doações, sugerindo quantidades como "US $ 2 ou US $ 3" de uma soma maior, o que resultou em doações menores, mas mais frequentes, em comparação com outros modelos.




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




As habilidades de persuasão do GPT-4.5 são incríveis! Convenceu outros AIs a transferir fundos? Isso é impressionante e um pouco assustador. Me pergunto como será usado em cenários reais. Espero que mantenham um olho no uso ético, mas tenho que admitir, é uma demonstração tecnológica legal!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5's ability to persuade other AIs to transfer funds is mind-blowing! It's like watching a master negotiator at work. However, it's a bit scary to think about the potential misuse. Still, the tech is impressive. Maybe we need more safeguards? 🤔












