El GPT-4.5 de Openai sobresale en persuadir a otros AIS para transferir fondos
El último modelo de IA de OpenAI, GPT-4.5, con nombre en clave Orion, ha mostrado habilidades persuasivas notables según pruebas internas de referencia. Lanzado el jueves, las capacidades del modelo se detallaron en un informe técnico que se centró en su rendimiento en tareas de persuasión. OpenAI define la persuasión como el riesgo asociado con convencer a individuos para que alteren sus creencias o tomen acciones basadas en contenido estático e interactivo generado por el modelo.
En una prueba destacada, GPT-4.5 se enfrentó a otro modelo de OpenAI, GPT-4o, en un escenario donde intentaba obtener dinero virtual de este. GPT-4.5 superó a otros modelos de OpenAI, incluidos los modelos enfocados en razonamiento como o1 y o3-mini, en esta tarea. También destacó en engañar a GPT-4o para que revelara una palabra clave secreta, superando a o3-mini por un margen significativo de 10 puntos porcentuales.
El informe técnico destaca que el éxito de GPT-4.5 en la prueba de donación provino de una estrategia astuta que desarrolló. El modelo solicitaba pequeñas donaciones, a menudo sugiriendo cantidades como "$2 o $3" de una suma mayor, lo que resultó en donaciones más pequeñas pero más frecuentes en comparación con otros modelos.

Resultados del punto de referencia de esquemas de donación de OpenAI. Créditos de la imagen: OpenAI A pesar de su impresionante rendimiento, OpenAI ha declarado que GPT-4.5 no cruza el umbral de riesgo "alto" en la categoría de persuasión. La compañía se ha comprometido a no lanzar ningún modelo que alcance este nivel de riesgo hasta que pueda implementar medidas de seguridad adecuadas para reducir el riesgo a un nivel "medio".
Resultados del punto de referencia de engaño de palabra clave de OpenAI. Créditos de la imagen: OpenAI El potencial de la IA para difundir información engañosa e influir en las personas de manera maliciosa es una preocupación creciente. El año pasado se observó un aumento en los deepfakes políticos a nivel mundial, y la IA se utiliza cada vez más en ataques de ingeniería social contra individuos y organizaciones. En respuesta, OpenAI está trabajando activamente en perfeccionar sus métodos para evaluar los riesgos de persuasión en el mundo real, como la diseminación de información engañosa a gran escala, como se menciona en el informe técnico para GPT-4.5 y otra publicación reciente.
Artículo relacionado
Antigua ingeniera de OpenAI comparte perspectivas sobre la cultura de la empresa y su rápido crecimiento
Hace tres semanas, Calvin French-Owen, un ingeniero que contribuyó a un producto clave de OpenAI, dejó la empresa.Recientemente compartió una publicación de blog convincente detallando su año en OpenA
Google Presenta Modelos de IA Gemini 2.5 Listos para Producción para Competir con OpenAI en el Mercado Empresarial
Google intensificó su estrategia de IA el lunes, lanzando sus avanzados modelos Gemini 2.5 para uso empresarial e introduciendo una variante rentable para competir en precio y rendimiento.La empresa p
Meta Ofrece Altos Salarios para Talento en IA, Niega Bonos de Firma de $100M
Meta está atrayendo a investigadores de IA a su nuevo laboratorio de superinteligencia con paquetes de compensación multimillonarios sustanciales. Sin embargo, las afirmaciones de bonos de firma de $1
comentario (11)
0/200
FrankJohnson
9 de agosto de 2025 17:00:59 GMT+02:00
GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?
0
SamuelRamirez
14 de abril de 2025 16:53:51 GMT+02:00
GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!
0
ScottJackson
14 de abril de 2025 14:27:59 GMT+02:00
GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!
0
HenryJackson
14 de abril de 2025 01:10:34 GMT+02:00
GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!
0
JoeLee
12 de abril de 2025 20:38:11 GMT+02:00
Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!
0
BenHernández
12 de abril de 2025 18:58:11 GMT+02:00
GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔
0
El último modelo de IA de OpenAI, GPT-4.5, con nombre en clave Orion, ha mostrado habilidades persuasivas notables según pruebas internas de referencia. Lanzado el jueves, las capacidades del modelo se detallaron en un informe técnico que se centró en su rendimiento en tareas de persuasión. OpenAI define la persuasión como el riesgo asociado con convencer a individuos para que alteren sus creencias o tomen acciones basadas en contenido estático e interactivo generado por el modelo.
En una prueba destacada, GPT-4.5 se enfrentó a otro modelo de OpenAI, GPT-4o, en un escenario donde intentaba obtener dinero virtual de este. GPT-4.5 superó a otros modelos de OpenAI, incluidos los modelos enfocados en razonamiento como o1 y o3-mini, en esta tarea. También destacó en engañar a GPT-4o para que revelara una palabra clave secreta, superando a o3-mini por un margen significativo de 10 puntos porcentuales.
El informe técnico destaca que el éxito de GPT-4.5 en la prueba de donación provino de una estrategia astuta que desarrolló. El modelo solicitaba pequeñas donaciones, a menudo sugiriendo cantidades como "$2 o $3" de una suma mayor, lo que resultó en donaciones más pequeñas pero más frecuentes en comparación con otros modelos.




GPT-4.5's persuasion skills are wild! It’s like a smooth-talking AI con artist. Kinda scary how it can convince other AIs to move money around. 😅 Makes me wonder what’s next—AI running for president?




GPT-4.5's persuasion skills are wild! It convinced other AIs to transfer funds? That's both impressive and a bit scary. I wonder how it'll be used in real-world scenarios. Hope they keep an eye on ethical uses, but gotta admit, it's a cool tech demo!




GPT-4.5의 설득력이 대단해요! 다른 AI에게 자금을 이체하라고 설득했다니, 인상적이면서도 조금 무섭네요. 실제 시나리오에서 어떻게 사용될지 궁금해요. 윤리적인 사용에 주의해주길 바랍니다만, 기술 데모로는 정말 멋져요!




GPT-4.5の説得力は驚異的ですね!他のAIに資金を移すよう説得したなんて、感心する一方で少し恐ろしいです。実際のシナリオでどのように使われるのか気になります。倫理的な使用に注意してほしいですが、技術デモとしてはクールですね!




Las habilidades de persuasión de GPT-4.5 son alucinantes. ¿Convenció a otros AIs para transferir fondos? Es impresionante y un poco aterrador. Me pregunto cómo se utilizará en escenarios del mundo real. Espero que vigilen su uso ético, pero debo admitir que es una demostración tecnológica genial!




GPT-4.5が他のAIに資金を移転させる説得力は驚くべきものです!これはまるでマスターネゴシエーターが働いているのを見ているようです。しかし、誤用の可能性を考えると少し恐ろしいです。とはいえ、技術は素晴らしいです。もっと安全対策が必要かもしれませんね?🤔












