Hogar
Claude Opus 4.7 sale al mercado apostando por la fiabilidad por encima de la inteligencia
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue muy claro en el anuncio: «Este no es nuestro modelo más potente». La rumoreada y más potente versión preliminar de Claude Mythos sigue en espera. Aun así, Opus 4.7 ha generado una considerable atención porque aborda la cuestión de ser «más fiable» en lugar de «más inteligente».

Los resultados de las pruebas de rendimiento son notablemente impresionantes. En la rigurosa prueba de codificación SWE-bench Pro, el 4.7 pasó del 53,4 % de la versión anterior al 64,3 %, una ganancia de casi 11 puntos porcentuales, superando al GPT-5.4 (57,7 %) y al Gemini 3.1 Pro (54,2 %). En la prueba de razonamiento visual CharXiv, subió del 69,1 % al 82,1 %, impulsado por la nueva capacidad de reconocimiento de lados largos de 2576 píxeles, que ofrece más del triple de claridad que su predecesor. En la evaluación de identificación de herramientas MCP-Atlas, obtuvo una puntuación del 77,3 %, y en el banco de pruebas BigLaw de la plataforma de IA jurídica Harvey, alcanzó el 90,9 %. Sin embargo, en la evaluación de búsqueda agentiva BrowseComp, la versión 4.7 experimentó un ligero descenso del 83,7 % al 79,3 %, superada por GPT-5.4 y Gemini; esto se atribuye a su personalidad «sin inventos», que prefiere informar de los errores en lugar de adivinar cuando la información es incompleta.
Más allá de las cifras, el cambio de temperamento es más notable. El responsable de Replit señaló tras las pruebas: «Me plantea retos en las discusiones técnicas, me ayuda a tomar mejores decisiones y realmente actúa como un mejor compañero de trabajo». La plataforma de ciencia de datos Hex también observó que la versión 4.7 informa directamente de los errores cuando faltan datos, en lugar de proporcionar un valor alternativo «aparentemente razonable pero completamente incorrecto» como antes. Al mismo tiempo, la resiliencia en las tareas ha mejorado significativamente: las pruebas del equipo de Notion indican que la tasa de error de la herramienta se ha reducido a un tercio de los niveles anteriores y, cuando la cadena de herramientas falla, es capaz de sortear los obstáculos y completar las tareas de forma independiente. Vercel incluso descubrió un nuevo comportamiento: antes de escribir código a nivel del sistema, 4.7 primero realiza demostraciones matemáticas por su cuenta.

Por supuesto, el aumento de la capacidad tiene un coste. La versión 4.7 introduce un nuevo tokenizador, que genera entre 1 y 1,35 veces más tokens para el mismo texto. Además, tiende a «pensar un poco más» en tareas complejas, por lo que el consumo real es casi con toda seguridad mayor. Para abordar esto, Anthropic ha añadido un nivel de intensidad de pensamiento ultraalto denominado «xhigh». Claude Code ha configurado todos los paquetes en este nivel de forma predeterminada, y también ha lanzado la instrucción Deep Review / ultrareview, la extensión Auto Mode para usuarios de Max y una versión beta pública de la función «presupuesto de tareas» para ayudar a los desarrolladores a gestionar el uso de tokens.
La versión más potente, Mythos Preview, se puso recientemente a disposición de las empresas bajo el nombre de «Project Glasswing» para la investigación en ciberseguridad, pero debido a su abrumadora capacidad y a que las evaluaciones de seguridad aún no están completas, todavía no se ha lanzado al público.
La versión 4.7 de hoy representa el último hito en el ritmo de entregas de alta frecuencia de Anthropic. Mythos llegará finalmente, y cuando lo haga, la ya potente versión 4.7 podría resultar ser solo el principio.
Artículo relacionado
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Haier lanza el robot exoesqueleto deportivo con IA más ligero del mundo, con un peso de tan solo 1,75 kg
El Grupo Haier ha presentado el robot exoesqueleto con inteligencia artificial más ligero del mundo para el deporte: el Haier Exoskeleton Robot W3. Este lanzamiento establece un nuevo récord del secto
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Recomendaciones de temas especiales relacionados
comentario (0)
0/500
Anthropic ha mantenido un ritmo frenético este año, lanzando nuevas funciones casi cada dos días. El tan esperado Claude Opus 4.7 acaba de salir oficialmente al mercado y, curiosamente, Anthropic fue muy claro en el anuncio: «Este no es nuestro modelo más potente». La rumoreada y más potente versión preliminar de Claude Mythos sigue en espera. Aun así, Opus 4.7 ha generado una considerable atención porque aborda la cuestión de ser «más fiable» en lugar de «más inteligente».

Los resultados de las pruebas de rendimiento son notablemente impresionantes. En la rigurosa prueba de codificación SWE-bench Pro, el 4.7 pasó del 53,4 % de la versión anterior al 64,3 %, una ganancia de casi 11 puntos porcentuales, superando al GPT-5.4 (57,7 %) y al Gemini 3.1 Pro (54,2 %). En la prueba de razonamiento visual CharXiv, subió del 69,1 % al 82,1 %, impulsado por la nueva capacidad de reconocimiento de lados largos de 2576 píxeles, que ofrece más del triple de claridad que su predecesor. En la evaluación de identificación de herramientas MCP-Atlas, obtuvo una puntuación del 77,3 %, y en el banco de pruebas BigLaw de la plataforma de IA jurídica Harvey, alcanzó el 90,9 %. Sin embargo, en la evaluación de búsqueda agentiva BrowseComp, la versión 4.7 experimentó un ligero descenso del 83,7 % al 79,3 %, superada por GPT-5.4 y Gemini; esto se atribuye a su personalidad «sin inventos», que prefiere informar de los errores en lugar de adivinar cuando la información es incompleta.
Más allá de las cifras, el cambio de temperamento es más notable. El responsable de Replit señaló tras las pruebas: «Me plantea retos en las discusiones técnicas, me ayuda a tomar mejores decisiones y realmente actúa como un mejor compañero de trabajo». La plataforma de ciencia de datos Hex también observó que la versión 4.7 informa directamente de los errores cuando faltan datos, en lugar de proporcionar un valor alternativo «aparentemente razonable pero completamente incorrecto» como antes. Al mismo tiempo, la resiliencia en las tareas ha mejorado significativamente: las pruebas del equipo de Notion indican que la tasa de error de la herramienta se ha reducido a un tercio de los niveles anteriores y, cuando la cadena de herramientas falla, es capaz de sortear los obstáculos y completar las tareas de forma independiente. Vercel incluso descubrió un nuevo comportamiento: antes de escribir código a nivel del sistema, 4.7 primero realiza demostraciones matemáticas por su cuenta.

Por supuesto, el aumento de la capacidad tiene un coste. La versión 4.7 introduce un nuevo tokenizador, que genera entre 1 y 1,35 veces más tokens para el mismo texto. Además, tiende a «pensar un poco más» en tareas complejas, por lo que el consumo real es casi con toda seguridad mayor. Para abordar esto, Anthropic ha añadido un nivel de intensidad de pensamiento ultraalto denominado «xhigh». Claude Code ha configurado todos los paquetes en este nivel de forma predeterminada, y también ha lanzado la instrucción Deep Review / ultrareview, la extensión Auto Mode para usuarios de Max y una versión beta pública de la función «presupuesto de tareas» para ayudar a los desarrolladores a gestionar el uso de tokens.
La versión más potente, Mythos Preview, se puso recientemente a disposición de las empresas bajo el nombre de «Project Glasswing» para la investigación en ciberseguridad, pero debido a su abrumadora capacidad y a que las evaluaciones de seguridad aún no están completas, todavía no se ha lanzado al público.
La versión 4.7 de hoy representa el último hito en el ritmo de entregas de alta frecuencia de Anthropic. Mythos llegará finalmente, y cuando lo haga, la ya potente versión 4.7 podría resultar ser solo el principio.
El principal inversor de Suno: eliminar las publicaciones no tapará el agujero de la demanda por derechos de autor
La tan esperada plataforma de generación musical con IA, Suno, se enfrenta a una dura batalla por los derechos de autor, y un comentario sincero de su principal inversor podría haber proporcionado a l
Haier lanza el robot exoesqueleto deportivo con IA más ligero del mundo, con un peso de tan solo 1,75 kg
El Grupo Haier ha presentado el robot exoesqueleto con inteligencia artificial más ligero del mundo para el deporte: el Haier Exoskeleton Robot W3. Este lanzamiento establece un nuevo récord del secto
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c











