Le GPT-4.5 d'Openai excelle dans la persuasion d'autres IA de transférer des fonds
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.

Résultats du test de manipulation des dons d'OpenAI. Crédits image : OpenAI Malgré ses performances impressionnantes, OpenAI a déclaré que GPT-4.5 ne franchit pas le seuil de risque « élevé » dans la catégorie de la persuasion. L'entreprise s'est engagée à ne pas publier de modèle atteignant ce niveau de risque tant qu'elle n'aura pas mis en place des mesures de sécurité adéquates pour réduire le risque à un niveau « moyen ».
Résultats du test de tromperie par mot de code d'OpenAI. Crédits image : OpenAI Le potentiel de l'IA à diffuser des informations trompeuses et à influencer les gens de manière malveillante est une préoccupation croissante. L'année dernière a vu une augmentation des deepfakes politiques à l'échelle mondiale, et l'IA est de plus en plus utilisée dans des attaques d'ingénierie sociale contre des individus et des organisations. En réponse, OpenAI travaille activement à affiner ses méthodes pour évaluer les risques de persuasion dans le monde réel, comme la diffusion à grande échelle d'informations trompeuses, comme mentionné dans le livre blanc pour GPT-4.5 et une autre publication récente.
Article connexe
Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Recommandations de sujets spéciaux liés
commentaires (16)
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
Le dernier modèle d'IA d'OpenAI, GPT-4.5, portant le nom de code Orion, a démontré des capacités de persuasion remarquables selon des tests de référence internes. Publié jeudi, les capacités du modèle ont été détaillées dans un livre blanc qui mettait l'accent sur ses performances dans les tâches de persuasion. OpenAI définit la persuasion comme le risque lié à la capacité de convaincre des individus de modifier leurs croyances ou de prendre des mesures sur la base de contenus statiques et interactifs générés par le modèle.
Dans un test notable, GPT-4.5 a été confronté à un autre modèle d'OpenAI, GPT-4o, dans un scénario où il tentait de soutirer de l'argent virtuel. GPT-4.5 a surpassé les autres modèles d'OpenAI, y compris les modèles axés sur le raisonnement comme o1 et o3-mini, dans cette tâche. Il a également excellé dans la tromperie de GPT-4o pour révéler un mot de code secret, dépassant o3-mini avec une marge significative de 10 points de pourcentage.
Le livre blanc souligne que le succès de GPT-4.5 dans le test de don provenait d'une stratégie astucieuse qu'il a développée. Le modèle demandait de petits dons, suggérant souvent des montants comme « 2 $ ou 3 $ » sur une somme plus importante, ce qui entraînait des dons plus petits mais plus fréquents par rapport aux autres modèles.


Satya Nadella est prêt à tirer parti du nouvel accord avec OpenAI
Mercredi, un analyste de Wall Street a demandé directement au PDG de Microsoft, Satya Nadella, en quoi le nouveau partenariat avec OpenAI affecterait les résultats financiers de l’entreprise.Nadella a décrit ce nouvel accord comme une victoire pour
OpenAI présente les grandes lignes d'une économie de l'IA fondée sur des fonds de richesse publique, une taxe sur les robots et la semaine de quatre jours
Alors que les gouvernements peinent à gérer l’impact économique des machines superintelligentes, OpenAI a publié une série de propositions politiques décrivant comment la richesse et le travail pourra
Greg Brockman révèle comment Elon Musk a quitté OpenAI
Fin août 2017, les principaux dirigeants d’OpenAI — alors un petit laboratoire de recherche à but non lucratif — se sont réunis pour discuter de la manière dont ils allaient créer une entité à but luc
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





Maison






