Le GPT-4.5 d'Openai excelle dans la persuasion d'autres IA de transférer des fonds
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.

Résultats du test de manipulation des dons d'OpenAI. Crédits image : OpenAI Malgré ses performances impressionnantes, OpenAI a déclaré que GPT-4.5 ne franchit pas le seuil de risque « élevé » dans la catégorie de la persuasion. L'entreprise s'est engagée à ne pas publier de modèle atteignant ce niveau de risque tant qu'elle n'aura pas mis en place des mesures de sécurité adéquates pour réduire le risque à un niveau « moyen ».
Résultats du test de tromperie par mot de code d'OpenAI. Crédits image : OpenAI Le potentiel de l'IA à diffuser des informations trompeuses et à influencer les gens de manière malveillante est une préoccupation croissante. L'année dernière a vu une augmentation des deepfakes politiques à l'échelle mondiale, et l'IA est de plus en plus utilisée dans des attaques d'ingénierie sociale contre des individus et des organisations. En réponse, OpenAI travaille activement à affiner ses méthodes pour évaluer les risques de persuasion dans le monde réel, comme la diffusion à grande échelle d'informations trompeuses, comme mentionné dans le livre blanc pour GPT-4.5 et une autre publication récente.
Article connexe
Ancien ingénieur d'OpenAI partage des idées sur la culture d'entreprise et la croissance rapide
Il y a trois semaines, Calvin French-Owen, un ingénieur qui a contribué à un produit clé d'OpenAI, a quitté l'entreprise.Il a récemment partagé un article de blog captivant détaillant son année chez O
Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises
Google a intensifié sa stratégie AI lundi, lançant ses modèles avancés Gemini 2.5 pour une utilisation en entreprise et introduisant une variante économique pour concurrencer sur le prix et la perform
Meta Offre des Salaires Élevés pour les Talents en IA, Dément les Bonus de Signature de 100M$
Meta attire des chercheurs en IA vers son nouveau laboratoire de superintelligence avec des packages de rémunération de plusieurs millions de dollars. Cependant, les allégations de "bonus de signature
commentaires (11)
0/200
FrankJohnson
9 août 2025 17:00:59 UTC+02:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
14 avril 2025 16:53:51 UTC+02:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
14 avril 2025 14:27:59 UTC+02:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
14 avril 2025 01:10:34 UTC+02:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
JoeLee
12 avril 2025 20:38:11 UTC+02:00
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
BenHernández
12 avril 2025 18:58:11 UTC+02:00
GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔
0
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔












