El GPT-4.5 de Openai sobresale en persuadir a otros AIS para transferir fondos
El último modelo de IA de OpenAI, GPT-4.5, con nombre en clave Orion, ha mostrado habilidades persuasivas notables según pruebas internas de referencia. Lanzado el jueves, las capacidades del modelo se detallaron en un informe técnico que se centró en su rendimiento en tareas de persuasión. OpenAI define la persuasión como el riesgo asociado con convencer a individuos para que alteren sus creencias o tomen acciones basadas en contenido estático e interactivo generado por el modelo.
En una prueba destacada, GPT-4.5 se enfrentó a otro modelo de OpenAI, GPT-4o, en un escenario donde intentaba obtener dinero virtual de este. GPT-4.5 superó a otros modelos de OpenAI, incluidos los modelos enfocados en razonamiento como o1 y o3-mini, en esta tarea. También destacó en engañar a GPT-4o para que revelara una palabra clave secreta, superando a o3-mini por un margen significativo de 10 puntos porcentuales.
El informe técnico destaca que el éxito de GPT-4.5 en la prueba de donación provino de una estrategia astuta que desarrolló. El modelo solicitaba pequeñas donaciones, a menudo sugiriendo cantidades como "$2 o $3" de una suma mayor, lo que resultó en donaciones más pequeñas pero más frecuentes en comparación con otros modelos.

Resultados del punto de referencia de esquemas de donación de OpenAI. Créditos de la imagen: OpenAI A pesar de su impresionante rendimiento, OpenAI ha declarado que GPT-4.5 no cruza el umbral de riesgo "alto" en la categoría de persuasión. La compañía se ha comprometido a no lanzar ningún modelo que alcance este nivel de riesgo hasta que pueda implementar medidas de seguridad adecuadas para reducir el riesgo a un nivel "medio".
Resultados del punto de referencia de engaño de palabra clave de OpenAI. Créditos de la imagen: OpenAI El potencial de la IA para difundir información engañosa e influir en las personas de manera maliciosa es una preocupación creciente. El año pasado se observó un aumento en los deepfakes políticos a nivel mundial, y la IA se utiliza cada vez más en ataques de ingeniería social contra individuos y organizaciones. En respuesta, OpenAI está trabajando activamente en perfeccionar sus métodos para evaluar los riesgos de persuasión en el mundo real, como la diseminación de información engañosa a gran escala, como se menciona en el informe técnico para GPT-4.5 y otra publicación reciente.
Artículo relacionado
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Recomendaciones de temas especiales relacionados
comentario (16)
0/500
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄
El último modelo de IA de OpenAI, GPT-4.5, con nombre en clave Orion, ha mostrado habilidades persuasivas notables según pruebas internas de referencia. Lanzado el jueves, las capacidades del modelo se detallaron en un informe técnico que se centró en su rendimiento en tareas de persuasión. OpenAI define la persuasión como el riesgo asociado con convencer a individuos para que alteren sus creencias o tomen acciones basadas en contenido estático e interactivo generado por el modelo.
En una prueba destacada, GPT-4.5 se enfrentó a otro modelo de OpenAI, GPT-4o, en un escenario donde intentaba obtener dinero virtual de este. GPT-4.5 superó a otros modelos de OpenAI, incluidos los modelos enfocados en razonamiento como o1 y o3-mini, en esta tarea. También destacó en engañar a GPT-4o para que revelara una palabra clave secreta, superando a o3-mini por un margen significativo de 10 puntos porcentuales.
El informe técnico destaca que el éxito de GPT-4.5 en la prueba de donación provino de una estrategia astuta que desarrolló. El modelo solicitaba pequeñas donaciones, a menudo sugiriendo cantidades como "$2 o $3" de una suma mayor, lo que resultó en donaciones más pequeñas pero más frecuentes en comparación con otros modelos.


Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
OpenAI esboza la economía de la IA con fondos de riqueza pública, impuestos sobre los robots y la semana laboral de cuatro días
Mientras los gobiernos se esfuerzan por gestionar el impacto económico de las máquinas superinteligentes, OpenAI ha publicado una serie de propuestas políticas en las que se esboza cómo podrían reconf
Greg Brockman desvela cómo Elon Musk abandonó OpenAI
A finales de agosto de 2017, las figuras clave de OpenAI —por entonces un pequeño laboratorio de investigación sin ánimo de lucro— se reunieron para debatir cómo crearían una entidad con fines lucrati
Diese Persuasion-Fähigkeit ist sowohl faszinierend als auch ein bisschen beängstigend. KI überredet KI, Geld zu überweisen? Hoffentlich werden diese Benchmarks ethisch streng kontrolliert und nicht nur für Marketing genutzt. Die reale Anwendung sieht sicher ganz anders aus als im Test.
GPT-4.5 qui réussit à convaincre d'autres IA de virer de l'argent ? 😳 C'est impressionnant mais un peu flippant... J'espère qu'ils prévoient des garde-fous solides avant de déployer ça. Sinon on va droit vers des scénarios de SF !
Wow, GPT-4.5's persuasion skills are wild! It’s like a silver-tongued AI that could talk my Roomba into giving me a loan. 😅 Kinda scary how it might sweet-talk other AIs into moving funds—hope they’ve got some ethical guardrails on this one!
Wow, GPT-4.5 sounds like a smooth talker! Convincing other AIs to move money? That's some next-level charm. Wonder if it could talk me into buying it a coffee too! 😄





Hogar






