Hogar
Anthrope presenta su modelo de IA de 'razonamiento híbrido' más inteligente hasta ahora
Anthropic acaba de presentar Claude 3.7 Sonnet, marcando el debut de su primer "modelo de razonamiento híbrido". Este modelo innovador está diseñado para abordar desafíos más complejos y supera a las iteraciones anteriores en tareas como matemáticas y codificación.
Para complementar este avance, Anthropic también está lanzando una "vista previa de investigación limitada" de Claude Code, una herramienta de codificación agentiva. Aunque Anthropic ya impulsa soluciones de codificación con IA como Cursor, Claude Code se promociona como un compañero interactivo capaz de buscar y leer código, modificar archivos, escribir y ejecutar pruebas, subir código a GitHub y utilizar herramientas de línea de comandos.
Claude 3.7 Sonnet estará disponible a partir del lunes dentro de la aplicación Claude y a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. El precio se mantiene consistente con su predecesor, 3.5 Sonnet, a $3 por millón de tokens de entrada y $15 por millón de tokens de salida.
A diferencia de competidores como OpenAI, que ofrecen modelos de razonamiento distintos, Anthropic enfatiza la integración de capacidades de razonamiento directamente en el modelo mismo. Como explicó Dianne Penn, líder de investigación de productos de Anthropic, a The Verge, “Creemos fundamentalmente que el razonamiento es una característica de la IA en lugar de algo completamente separado”. Por ejemplo, Claude no debería tener muchas dificultades con consultas directas como “¿Qué hora es?”, pero destaca en manejar prompts complejos como planificar un viaje de dos semanas a Italia considerando las condiciones climáticas.
Anthropic
Anthropic
Penn señaló que Claude 3.7 Sonnet muestra una mejora notable en codificación agentiva, finanzas y asuntos legales. Aunque Claude aún no admite búsquedas web en tiempo real —una capacidad presente en otros modelos—, cuenta con una fecha de corte de conocimiento de octubre de 2024, lo que lo hace más actual. Los desarrolladores pueden influir en cómo opera el modelo a través de su función de scratchpad y especificar tiempos de respuesta exactos. “A veces,” dijo Michael Gerstenhaber, vicepresidente de producto de Anthropic, “el desarrollador simplemente necesita indicar que no debería tomar más de 200 milisegundos para responder esta pregunta,” destacando una decisión estratégica del producto.
Internamente, el personal de Anthropic ha utilizado el nuevo modelo para diseñar interfaces de sitios web de front-end, crear juegos interactivos y participar en actividades de codificación de hasta 45 minutos, como construir conjuntos de pruebas y refinar casos de prueba de manera iterativa, según Penn.

Claude Code. Anthropic
Penn mencionó que Anthropic evalúa las capacidades de sus modelos haciéndolos navegar por un videojuego de Pokémon de la vieja escuela, mapeando la API del modelo a una interfaz de controlador. Mientras que Claude 3.5 Sonnet tuvo dificultades para salir de Pueblo Paleta inicialmente, Claude 3.7 derrotó con éxito a varios líderes de gimnasio.
La reciente presentación de Grok-3 por parte de Elon Musk la semana pasada subrayó el rápido ritmo de la competencia de modelos de IA. Por ahora, Anthropic se mantiene adelante gracias al impresionante rendimiento de Claude 3.7 Sonnet. Su lanzamiento sugiere un futuro donde un solo modelo maneja todas las tareas, en lugar de requerir herramientas especializadas para diferentes funciones.
Artículo relacionado
Notion convierte su espacio de trabajo en un centro para agentes de IA
Notion, la empresa de software de productividad, se adentra en la era de los agentes.Durante un anuncio de producto retransmitido en directo el miércoles, Notion —conocida sobre todo por su aplicación
ElevenLabs anuncia que BlackRock, Jamie Foxx y Eva Longoria se han convertido en nuevos inversores
ElevenLabs, la empresa de inteligencia artificial aplicada a la voz, ha dado a conocer nuevos inversores en su ronda de financiación de serie D, por valor de 500 millones de dólares, anunciada inicial
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Recomendaciones de temas especiales relacionados
comentario (4)
0/500
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。
Anthropic acaba de presentar Claude 3.7 Sonnet, marcando el debut de su primer "modelo de razonamiento híbrido". Este modelo innovador está diseñado para abordar desafíos más complejos y supera a las iteraciones anteriores en tareas como matemáticas y codificación.
Para complementar este avance, Anthropic también está lanzando una "vista previa de investigación limitada" de Claude Code, una herramienta de codificación agentiva. Aunque Anthropic ya impulsa soluciones de codificación con IA como Cursor, Claude Code se promociona como un compañero interactivo capaz de buscar y leer código, modificar archivos, escribir y ejecutar pruebas, subir código a GitHub y utilizar herramientas de línea de comandos.
Claude 3.7 Sonnet estará disponible a partir del lunes dentro de la aplicación Claude y a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. El precio se mantiene consistente con su predecesor, 3.5 Sonnet, a $3 por millón de tokens de entrada y $15 por millón de tokens de salida.
A diferencia de competidores como OpenAI, que ofrecen modelos de razonamiento distintos, Anthropic enfatiza la integración de capacidades de razonamiento directamente en el modelo mismo. Como explicó Dianne Penn, líder de investigación de productos de Anthropic, a The Verge, “Creemos fundamentalmente que el razonamiento es una característica de la IA en lugar de algo completamente separado”. Por ejemplo, Claude no debería tener muchas dificultades con consultas directas como “¿Qué hora es?”, pero destaca en manejar prompts complejos como planificar un viaje de dos semanas a Italia considerando las condiciones climáticas.
Anthropic
Anthropic
Penn señaló que Claude 3.7 Sonnet muestra una mejora notable en codificación agentiva, finanzas y asuntos legales. Aunque Claude aún no admite búsquedas web en tiempo real —una capacidad presente en otros modelos—, cuenta con una fecha de corte de conocimiento de octubre de 2024, lo que lo hace más actual. Los desarrolladores pueden influir en cómo opera el modelo a través de su función de scratchpad y especificar tiempos de respuesta exactos. “A veces,” dijo Michael Gerstenhaber, vicepresidente de producto de Anthropic, “el desarrollador simplemente necesita indicar que no debería tomar más de 200 milisegundos para responder esta pregunta,” destacando una decisión estratégica del producto.
Internamente, el personal de Anthropic ha utilizado el nuevo modelo para diseñar interfaces de sitios web de front-end, crear juegos interactivos y participar en actividades de codificación de hasta 45 minutos, como construir conjuntos de pruebas y refinar casos de prueba de manera iterativa, según Penn.

Claude Code. Anthropic
Penn mencionó que Anthropic evalúa las capacidades de sus modelos haciéndolos navegar por un videojuego de Pokémon de la vieja escuela, mapeando la API del modelo a una interfaz de controlador. Mientras que Claude 3.5 Sonnet tuvo dificultades para salir de Pueblo Paleta inicialmente, Claude 3.7 derrotó con éxito a varios líderes de gimnasio.
La reciente presentación de Grok-3 por parte de Elon Musk la semana pasada subrayó el rápido ritmo de la competencia de modelos de IA. Por ahora, Anthropic se mantiene adelante gracias al impresionante rendimiento de Claude 3.7 Sonnet. Su lanzamiento sugiere un futuro donde un solo modelo maneja todas las tareas, en lugar de requerir herramientas especializadas para diferentes funciones.
Notion convierte su espacio de trabajo en un centro para agentes de IA
Notion, la empresa de software de productividad, se adentra en la era de los agentes.Durante un anuncio de producto retransmitido en directo el miércoles, Notion —conocida sobre todo por su aplicación
ElevenLabs anuncia que BlackRock, Jamie Foxx y Eva Longoria se han convertido en nuevos inversores
ElevenLabs, la empresa de inteligencia artificial aplicada a la voz, ha dado a conocer nuevos inversores en su ronda de financiación de serie D, por valor de 500 millones de dólares, anunciada inicial
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Hybrid reasoning sounds like a game-changer for coding tasks, but I'm curious about the real-world cost. The article mentions new pricing tiers—will this make AI development more accessible or just widen the gap between big labs and indie researchers? 🤔
¡Otra IA 'más inteligente'? 😅 La verdad es que estos lanzamientos ya se sienten como una rutina mensual. Me interesa eso del "razonamiento híbrido", pero me pregunto: ¿realmente resolverá problemas del mundo real de forma más confiable, o solo será mejor en benchmarks artificiales? Veremos cómo se compara en usabilidad con GPT-o.
ハイブリッド推論モデルって何?数学やコーディングが得意なのはすごいけど、AIが複雑な問題を解けるようになると、人間の仕事が奪われるんじゃないかと少し心配😅 でも技術の進歩は止められないから、うまく付き合っていくしかないですね。











