El nuevo modelo de IA de Anthrope opera computadoras como humanos, errores incluidos

Hogar

Noticias

9 de mayo de 2025

PaulGonzalez

133

El nuevo modelo de IA de Anthrope opera computadoras como humanos, errores incluidos

¿Alguna vez has soñado con una IA que pueda interactuar sin problemas con tu computadora, como lo haría un humano? Bueno, ese sueño ahora es una realidad, gracias a la última innovación de Anthropic. El martes, presentaron la nueva generación de su modelo de IA Claude, llamado Claude 3.5 Sonnet, que puede operar una computadora con una sorprendente destreza. Actualmente en modo beta, esta IA está disponible para que los desarrolladores experimenten con ella a través de una API.

Anthropic etiqueta con orgullo a Claude 3.5 Sonnet como el "primer modelo de IA de frontera que ofrece uso de computadora en beta pública." Esto significa que los desarrolladores pueden programarlo para realizar una variedad de tareas en una computadora, como ver la pantalla, mover el cursor, hacer clic en botones e incluso escribir en un teclado virtual. ¿El objetivo? Replicar la forma en que interactuamos con nuestras computadoras todos los días.

Ahora, aunque esta nueva IA aún está en fase experimental, no está exenta de problemas. Puede ser un poco torpe y propensa a errores en ocasiones. Pero eso es exactamente por lo que Anthropic la lanzó en beta: para recopilar valiosos comentarios de los desarrolladores y refinar el modelo con el tiempo.

¿Por qué debería importarnos que la IA use computadoras?

Anthropic tiene una respuesta clara para esa pregunta: "Una gran cantidad de trabajo moderno ocurre a través de computadoras." Al permitir que las IAs interactúen con el software de la misma manera que lo hacen los humanos, se desbloquea una gran cantidad de nuevas aplicaciones que los asistentes de IA actuales no pueden manejar.

¿Cómo pueden beneficiarse los desarrolladores y los usuarios?

En lugar de crear herramientas específicas para cada tarea, Anthropic está enseñando a Claude habilidades generales de computadora. Esto permite que la IA utilice una amplia gama de programas de software estándar diseñados para humanos. Los desarrolladores pueden aprovechar esta capacidad para automatizar tareas repetitivas, construir y probar software, e incluso realizar investigaciones.

Varias empresas ya están utilizando las habilidades informáticas de Claude 3.5 Sonnet, incluyendo Asana, Canva, Cognition, DoorDash, Replit y The Browser Company. Por ejemplo, Replit está utilizando estas capacidades para mejorar su producto Replit Agent.

¿Cómo entrenaron a Claude para usar computadoras?

Entrenar a Claude para navegar por una computadora implicó mucho ensayo y error, según Anthropic. El proceso requiere que la IA comprenda e interprete imágenes de la pantalla de la computadora, y luego decida qué acciones tomar basándose en lo que ve. Claude 3.5 Sonnet logra esto analizando capturas de pantalla, contando píxeles para mover el cursor con precisión y emitiendo comandos de ratón.

¿Qué tan bien está funcionando Claude?

En las pruebas de evaluación de OSWorld, que miden la capacidad de los modelos de IA para usar computadoras, Claude 3.5 Sonnet obtuvo una puntuación del 14.9%. Aunque esto es significativamente menor que el rendimiento humano del 70%-75%, es casi el doble del 7.7% obtenido por el siguiente mejor modelo de IA en la misma categoría.

A pesar de estos resultados prometedores, el uso de computadoras por parte de Claude aún está en sus primeras etapas. Todavía no puede realizar tareas más complejas como arrastrar ventanas o hacer zoom en la pantalla. Además, al depender de capturas de pantalla, podría pasar por alto ciertas acciones y notificaciones.

Anthropic se mantiene optimista, afirmando: "Esperamos que el uso de computadoras mejore rápidamente para volverse más rápido, más confiable y más útil para las tareas que nuestros usuarios desean completar." También enfatizan que, a medida que la tecnología evoluciona, se volverá más accesible para aquellos con menos experiencia en desarrollo de software, todo mientras se mantienen estrictas medidas de seguridad.

Claude 3.5 Sonnet ahora es accesible para todos. Los desarrolladores pueden comenzar a construir aplicaciones con la beta de uso de computadora en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud.

Artículo relacionado

Craig Federighi, de Apple, admite que Siri, impulsada por IA, tenía graves fallos en sus primeras fases Ejecutivos de Apple explican el retraso en la actualización de SiriDurante la WWDC 2024, Apple prometió en un principio importantes mejoras de Siri, como el conocimiento personalizado del contexto y

Dominar las Técnicas de Inpainting AI: Guía intermedia para una edición de imágenes impecable Descubra las capacidades transformadoras de la tecnología AI inpainting de Midjourney, una función revolucionaria que permite a los creadores refinar y perfeccionar las ilustraciones generadas por AI

Manus estrena su herramienta de IA "Wide Research" con más de 100 agentes para el raspado web Manus, empresa china innovadora en IA, que ya había llamado la atención por su pionera plataforma de orquestación multiagente dirigida tanto a consumidores como a usuarios profesionales, ha desvelado

comentario (5)

0/200

Entregar

WalterBaker

27 de agosto de 2025 19:01:33 GMT+02:00

Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!

JackWilson

4 de agosto de 2025 08:01:00 GMT+02:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

JackMitchell

31 de julio de 2025 03:42:05 GMT+02:00

Whoa, an AI that mimics human computer use, mistakes and all? That's wild! Wonder if Claude 3.5 Sonnet will accidentally open 20 browser tabs like I do. 😅 Curious to see how this plays out in real-world tasks!

JohnNelson

29 de julio de 2025 14:25:16 GMT+02:00

Whoa, an AI that mimics human computer use, errors and all? That's wild! 😄 I wonder how it handles my chaotic desktop—probably better than me!

JuanLewis

28 de julio de 2025 03:19:30 GMT+02:00

This AI acting like a human on computers is wild! 😮 Makes me wonder if it'll mess up my spreadsheets like my coworker does. Exciting stuff, but I hope it doesn't learn my bad habits too!

Noticias principales

Gemini 2.5 Pro ahora ilimitado y más barato que Claude, GPT-4O Generadores de Video AI Top de 2025: Pika Labs vs Alternativas Doblaje AI: Guía Definitiva para la Creación de Voz Realista La IA de Cambium transforma la madera de los desechos en madera Operai mejora el asistente de voz de IA para mejores chats Cómo garantizar que sus datos sean confiables para la integración de IA Notebooklm se expande a nivel mundial, agrega diapositivas y verificación de hechos mejorada Los ajustes a los centros de datos de EE. UU. Podrían desbloquear 76 GW de nueva capacidad de potencia Google utiliza IA para suspender más de 39 millones de cuentas publicitarias por sospecha de fraude Clonación de Voz IA: La guía definitiva para dominar la conversión de voz

Más

Presentado