option
Maison
Nouvelles
Le GPT-4.5 d'Openai excelle dans la persuasion d'autres IA de transférer des fonds

Le GPT-4.5 d'Openai excelle dans la persuasion d'autres IA de transférer des fonds

11 avril 2025
109

Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.

Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.

Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.

OpenAI GPT-4.5

Résultats du test de manipulation des dons d'OpenAI. Crédits image : OpenAI
Malgré ses performances impressionnantes, OpenAI a déclaré que GPT-4.5 ne franchit pas le seuil de risque « élevé » dans la catégorie de la persuasion. L'entreprise s'est engagée à ne pas publier de modèle atteignant ce niveau de risque tant qu'elle n'aura pas mis en place des mesures de sécurité adéquates pour réduire le risque à un niveau « moyen ».

OpenAI GPT-4.5

Résultats du test de tromperie par mot de code d'OpenAI. Crédits image : OpenAI
Le potentiel de l'IA à diffuser des informations trompeuses et à influencer les gens de manière malveillante est une préoccupation croissante. L'année dernière a vu une augmentation des deepfakes politiques à l'échelle mondiale, et l'IA est de plus en plus utilisée dans des attaques d'ingénierie sociale contre des individus et des organisations. En réponse, OpenAI travaille activement à affiner ses méthodes pour évaluer les risques de persuasion dans le monde réel, comme la diffusion à grande échelle d'informations trompeuses, comme mentionné dans le livre blanc pour GPT-4.5 et une autre publication récente.
Article connexe
Ancien ingénieur d'OpenAI partage des idées sur la culture d'entreprise et la croissance rapide Ancien ingénieur d'OpenAI partage des idées sur la culture d'entreprise et la croissance rapide Il y a trois semaines, Calvin French-Owen, un ingénieur qui a contribué à un produit clé d'OpenAI, a quitté l'entreprise.Il a récemment partagé un article de blog captivant détaillant son année chez O
Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises Google dévoile les modèles AI Gemini 2.5 prêts pour la production pour rivaliser avec OpenAI sur le marché des entreprises Google a intensifié sa stratégie AI lundi, lançant ses modèles avancés Gemini 2.5 pour une utilisation en entreprise et introduisant une variante économique pour concurrencer sur le prix et la perform
Meta Offre des Salaires Élevés pour les Talents en IA, Dément les Bonus de Signature de 100M$ Meta Offre des Salaires Élevés pour les Talents en IA, Dément les Bonus de Signature de 100M$ Meta attire des chercheurs en IA vers son nouveau laboratoire de superintelligence avec des packages de rémunération de plusieurs millions de dollars. Cependant, les allégations de "bonus de signature
commentaires (11)
0/200
FrankJohnson
FrankJohnson 9 août 2025 17:00:59 UTC+02:00

GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?

SamuelRamirez
SamuelRamirez 14 avril 2025 16:53:51 UTC+02:00

GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!

ScottJackson
ScottJackson 14 avril 2025 14:27:59 UTC+02:00

GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!

HenryJackson
HenryJackson 14 avril 2025 01:10:34 UTC+02:00

GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!

JoeLee
JoeLee 12 avril 2025 20:38:11 UTC+02:00

Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!

BenHernández
BenHernández 12 avril 2025 18:58:11 UTC+02:00

GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔

Retour en haut
OR