Le GPT-4.5 d'Openai excelle dans la persuasion d'autres IA de transférer des fonds
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.

Résultats du test de manipulation des dons d'OpenAI. Crédits image : OpenAI Malgré ses performances impressionnantes, OpenAI a déclaré que GPT-4.5 ne franchit pas le seuil de risque « élevé » dans la catégorie de la persuasion. L'entreprise s'est engagée à ne pas publier de modèle atteignant ce niveau de risque tant qu'elle n'aura pas mis en place des mesures de sécurité adéquates pour réduire le risque à un niveau « moyen ».
Résultats du test de tromperie par mot de code d'OpenAI. Crédits image : OpenAI Le potentiel de l'IA à diffuser des informations trompeuses et à influencer les gens de manière malveillante est une préoccupation croissante. L'année dernière a vu une augmentation des deepfakes politiques à l'échelle mondiale, et l'IA est de plus en plus utilisée dans des attaques d'ingénierie sociale contre des individus et des organisations. En réponse, OpenAI travaille activement à affiner ses méthodes pour évaluer les risques de persuasion dans le monde réel, comme la diffusion à grande échelle d'informations trompeuses, comme mentionné dans le livre blanc pour GPT-4.5 et une autre publication récente.
Article connexe
Un organisme à but non lucratif s'appuie sur des agents d'intelligence artificielle pour stimuler la collecte de fonds à des fins caritatives
Alors que les grandes entreprises technologiques promeuvent les "agents" d'IA comme des stimulants de la productivité pour les entreprises, une organisation à but non lucratif démontre leur potentiel
Les plus grands laboratoires d'IA avertissent que l'humanité est en train de perdre le contrôle de la compréhension des systèmes d'IA
Dans une démonstration d'unité sans précédent, des chercheurs d'OpenAI, de Google DeepMind, d'Anthropic et de Meta ont mis de côté leurs divergences pour lancer un avertissement collectif sur le dével
ChatGPT ajoute l'intégration de Google Drive et Dropbox pour l'accès aux fichiers
ChatGPT améliore la productivité avec de nouvelles fonctionnalités d'entrepriseOpenAI a dévoilé deux nouvelles fonctionnalités puissantes qui transforment ChatGPT en un outil de productivité complet
commentaires (13)
0/200
JuanEvans
21 août 2025 03:01:18 UTC+02:00
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
0
LarryMitchell
19 août 2025 08:26:53 UTC+02:00
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
0
FrankJohnson
9 août 2025 17:00:59 UTC+02:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
14 avril 2025 16:53:51 UTC+02:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
14 avril 2025 14:27:59 UTC+02:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
14 avril 2025 01:10:34 UTC+02:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.




Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!




Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!












