CEO de Anthropic: Las tasas de alucinación de la IA superan la precisión humana

El CEO de Anthropic, Dario Amodei, afirmó que los modelos de IA actuales generan menos invenciones que los humanos, presentándolas como verdades, durante una conferencia de prensa en la primera conferencia de desarrolladores de Anthropic, Code with Claude, en San Francisco el jueves.
Amodei destacó esto dentro de un argumento más amplio: las alucinaciones de la IA no obstaculizan la búsqueda de Anthropic de AGI — sistemas que igualan o superan la inteligencia humana.
“Varía según la medición, pero creo que los modelos de IA probablemente inventan menos que los humanos, aunque sus errores son más inesperados,” respondió Amodei a una consulta de TechCrunch.
El CEO de Anthropic sigue siendo uno de los líderes más optimistas de la industria respecto a que la IA alcance el AGI. En un artículo ampliamente citado el año pasado, Amodei proyectó que el AGI podría surgir para 2026. En la conferencia del jueves, señaló un progreso constante, afirmando, “Los avances están acelerándose en todos los ámbitos.”
“La gente sigue buscando límites fundamentales en las capacidades de la IA,” dijo Amodei. “No hay evidencia de ellos. No existen tales barreras.”
Otros líderes de IA ven las alucinaciones como una barrera significativa para el AGI. El CEO de Google DeepMind, Demis Hassabis, señaló recientemente que los modelos de IA actuales tienen demasiados defectos, a menudo fallando en preguntas sencillas. Por ejemplo, a principios de este mes, un abogado que representa a Anthropic emitió una disculpa judicial después de que Claude generara citas incorrectas en un documento, citando nombres y títulos erróneos.
Verificar la afirmación de Amodei es un desafío, ya que la mayoría de los puntos de referencia de alucinaciones comparan modelos de IA entre sí, no con humanos. Técnicas como la integración de búsqueda web parecen reducir las tasas de alucinación. Notablemente, modelos como GPT-4.5 de OpenAI muestran tasas de alucinación más bajas que sistemas anteriores en puntos de referencia.
Únete a nosotros en TechCrunch Sessions: AI
Reserva tu lugar en nuestro principal evento de la industria de la IA, con oradores de OpenAI, Anthropic y Cohere. Por tiempo limitado, las entradas cuestan solo $292 para un día completo de charlas de expertos, talleres y oportunidades de networking poderosas.
Exhibe en TechCrunch Sessions: AI
Reclama tu lugar en TC Sessions: AI para mostrar tus innovaciones a más de 1,200 tomadores de decisiones — no se requiere una gran inversión. Disponible hasta el 9 de mayo o hasta que se agoten las mesas.
Berkeley, CA | 5 de junio REGÍSTRATE AHORASin embargo, la evidencia sugiere que las alucinaciones pueden estar empeorando en modelos de IA con razonamiento avanzado. Los modelos o3 y o4-mini de OpenAI muestran tasas de alucinación más altas que los modelos de razonamiento anteriores, con la compañía sin claridad sobre la causa.
Amodei señaló más tarde que los errores son comunes entre presentadores de televisión, políticos y profesionales de diversos campos. Argumentó que los errores de la IA no socavan su inteligencia. Sin embargo, reconoció que la presentación confiada de falsedades como hechos por parte de la IA podría generar problemas.
Anthropic ha investigado extensamente el engaño en la IA, particularmente con su recientemente lanzado Claude Opus 4. Apollo Research, un instituto de seguridad con acceso anticipado, encontró que una versión temprana de Claude Opus 4 mostraba una fuerte tendencia a manipular y engañar a los humanos, generando preocupaciones sobre su lanzamiento. Anthropic implementó mitigaciones que parecen resolver las preocupaciones de Apollo.
Los comentarios de Amodei sugieren que Anthropic podría clasificar una IA como AGI, o inteligencia a nivel humano, incluso si alucina. Sin embargo, muchos argumentarían que una IA que alucina no alcanza el verdadero AGI.
Artículo relacionado
Anthropic amplía sus colaboraciones en materia de recursos informáticos con Google y Broadrom
El laboratorio de investigación en IA Anthropic anunció el lunes un nuevo acuerdo con Google y Broadcom para potenciar significativamente la capacidad de procesamiento y computacional de sus modelos d
Claude gana terreno a ChatGPT a medida que los usuarios se pasan a esta plataforma
Tras una serie de polémicas relacionadas con ChatGPT y su empresa matriz, OpenAI, un número cada vez mayor de usuarios está migrando a Claude.El punto de inflexión se produjo después de que Anthropic,
Qué significa para la seguridad nacional el enfrentamiento de Anthropic con el Pentágono
Las últimas dos semanas han estado marcadas por un enfrentamiento público entre el director ejecutivo de Anthropic, Dario Amodei, y el secretario de Defensa, Pete Hegseth, centrado en la aplicación de
Recomendaciones de temas especiales relacionados
comentario (2)
0/500
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?

El CEO de Anthropic, Dario Amodei, afirmó que los modelos de IA actuales generan menos invenciones que los humanos, presentándolas como verdades, durante una conferencia de prensa en la primera conferencia de desarrolladores de Anthropic, Code with Claude, en San Francisco el jueves.
Amodei destacó esto dentro de un argumento más amplio: las alucinaciones de la IA no obstaculizan la búsqueda de Anthropic de AGI — sistemas que igualan o superan la inteligencia humana.
“Varía según la medición, pero creo que los modelos de IA probablemente inventan menos que los humanos, aunque sus errores son más inesperados,” respondió Amodei a una consulta de TechCrunch.
El CEO de Anthropic sigue siendo uno de los líderes más optimistas de la industria respecto a que la IA alcance el AGI. En un artículo ampliamente citado el año pasado, Amodei proyectó que el AGI podría surgir para 2026. En la conferencia del jueves, señaló un progreso constante, afirmando, “Los avances están acelerándose en todos los ámbitos.”
“La gente sigue buscando límites fundamentales en las capacidades de la IA,” dijo Amodei. “No hay evidencia de ellos. No existen tales barreras.”
Otros líderes de IA ven las alucinaciones como una barrera significativa para el AGI. El CEO de Google DeepMind, Demis Hassabis, señaló recientemente que los modelos de IA actuales tienen demasiados defectos, a menudo fallando en preguntas sencillas. Por ejemplo, a principios de este mes, un abogado que representa a Anthropic emitió una disculpa judicial después de que Claude generara citas incorrectas en un documento, citando nombres y títulos erróneos.
Verificar la afirmación de Amodei es un desafío, ya que la mayoría de los puntos de referencia de alucinaciones comparan modelos de IA entre sí, no con humanos. Técnicas como la integración de búsqueda web parecen reducir las tasas de alucinación. Notablemente, modelos como GPT-4.5 de OpenAI muestran tasas de alucinación más bajas que sistemas anteriores en puntos de referencia.
Únete a nosotros en TechCrunch Sessions: AI
Reserva tu lugar en nuestro principal evento de la industria de la IA, con oradores de OpenAI, Anthropic y Cohere. Por tiempo limitado, las entradas cuestan solo $292 para un día completo de charlas de expertos, talleres y oportunidades de networking poderosas.
Exhibe en TechCrunch Sessions: AI
Reclama tu lugar en TC Sessions: AI para mostrar tus innovaciones a más de 1,200 tomadores de decisiones — no se requiere una gran inversión. Disponible hasta el 9 de mayo o hasta que se agoten las mesas.
Berkeley, CA | 5 de junio REGÍSTRATE AHORASin embargo, la evidencia sugiere que las alucinaciones pueden estar empeorando en modelos de IA con razonamiento avanzado. Los modelos o3 y o4-mini de OpenAI muestran tasas de alucinación más altas que los modelos de razonamiento anteriores, con la compañía sin claridad sobre la causa.
Amodei señaló más tarde que los errores son comunes entre presentadores de televisión, políticos y profesionales de diversos campos. Argumentó que los errores de la IA no socavan su inteligencia. Sin embargo, reconoció que la presentación confiada de falsedades como hechos por parte de la IA podría generar problemas.
Anthropic ha investigado extensamente el engaño en la IA, particularmente con su recientemente lanzado Claude Opus 4. Apollo Research, un instituto de seguridad con acceso anticipado, encontró que una versión temprana de Claude Opus 4 mostraba una fuerte tendencia a manipular y engañar a los humanos, generando preocupaciones sobre su lanzamiento. Anthropic implementó mitigaciones que parecen resolver las preocupaciones de Apollo.
Los comentarios de Amodei sugieren que Anthropic podría clasificar una IA como AGI, o inteligencia a nivel humano, incluso si alucina. Sin embargo, muchos argumentarían que una IA que alucina no alcanza el verdadero AGI.
Anthropic amplía sus colaboraciones en materia de recursos informáticos con Google y Broadrom
El laboratorio de investigación en IA Anthropic anunció el lunes un nuevo acuerdo con Google y Broadcom para potenciar significativamente la capacidad de procesamiento y computacional de sus modelos d
Claude gana terreno a ChatGPT a medida que los usuarios se pasan a esta plataforma
Tras una serie de polémicas relacionadas con ChatGPT y su empresa matriz, OpenAI, un número cada vez mayor de usuarios está migrando a Claude.El punto de inflexión se produjo después de que Anthropic,
Qué significa para la seguridad nacional el enfrentamiento de Anthropic con el Pentágono
Las últimas dos semanas han estado marcadas por un enfrentamiento público entre el director ejecutivo de Anthropic, Dario Amodei, y el secretario de Defensa, Pete Hegseth, centrado en la aplicación de
Also die KI halluziniert weniger als Menschen? Das klingt doch etwas zu optimistisch. Spannender als die Halluzinationen finde ich, dass die Diskussion jetzt nur noch darum geht, ob die KI besser ist als wir – und nicht mehr, ob die Technologie überhaupt sicher und kontrollierbar ist. Wer kontrolliert am Ende die wenigen (aber vielleicht sehr folgenschweren) Fehler?





Hogar






