El nuevo modelo de IA de Anthrope opera computadoras como humanos, errores incluidos

¿Alguna vez has soñado con una IA que pueda interactuar sin problemas con tu computadora, como lo haría un humano? Bueno, ese sueño ahora es una realidad, gracias a la última innovación de Anthropic. El martes, presentaron la nueva generación de su modelo de IA Claude, llamado Claude 3.5 Sonnet, que puede operar una computadora con una sorprendente destreza. Actualmente en modo beta, esta IA está disponible para que los desarrolladores experimenten con ella a través de una API.
Anthropic etiqueta con orgullo a Claude 3.5 Sonnet como el "primer modelo de IA de frontera que ofrece uso de computadora en beta pública." Esto significa que los desarrolladores pueden programarlo para realizar una variedad de tareas en una computadora, como ver la pantalla, mover el cursor, hacer clic en botones e incluso escribir en un teclado virtual. ¿El objetivo? Replicar la forma en que interactuamos con nuestras computadoras todos los días.
Ahora, aunque esta nueva IA aún está en fase experimental, no está exenta de problemas. Puede ser un poco torpe y propensa a errores en ocasiones. Pero eso es exactamente por lo que Anthropic la lanzó en beta: para recopilar valiosos comentarios de los desarrolladores y refinar el modelo con el tiempo.
¿Por qué debería importarnos que la IA use computadoras?
Anthropic tiene una respuesta clara para esa pregunta: "Una gran cantidad de trabajo moderno ocurre a través de computadoras." Al permitir que las IAs interactúen con el software de la misma manera que lo hacen los humanos, se desbloquea una gran cantidad de nuevas aplicaciones que los asistentes de IA actuales no pueden manejar.
¿Cómo pueden beneficiarse los desarrolladores y los usuarios?
En lugar de crear herramientas específicas para cada tarea, Anthropic está enseñando a Claude habilidades generales de computadora. Esto permite que la IA utilice una amplia gama de programas de software estándar diseñados para humanos. Los desarrolladores pueden aprovechar esta capacidad para automatizar tareas repetitivas, construir y probar software, e incluso realizar investigaciones.
Varias empresas ya están utilizando las habilidades informáticas de Claude 3.5 Sonnet, incluyendo Asana, Canva, Cognition, DoorDash, Replit y The Browser Company. Por ejemplo, Replit está utilizando estas capacidades para mejorar su producto Replit Agent.
¿Cómo entrenaron a Claude para usar computadoras?
Entrenar a Claude para navegar por una computadora implicó mucho ensayo y error, según Anthropic. El proceso requiere que la IA comprenda e interprete imágenes de la pantalla de la computadora, y luego decida qué acciones tomar basándose en lo que ve. Claude 3.5 Sonnet logra esto analizando capturas de pantalla, contando píxeles para mover el cursor con precisión y emitiendo comandos de ratón.
¿Qué tan bien está funcionando Claude?
En las pruebas de evaluación de OSWorld, que miden la capacidad de los modelos de IA para usar computadoras, Claude 3.5 Sonnet obtuvo una puntuación del 14.9%. Aunque esto es significativamente menor que el rendimiento humano del 70%-75%, es casi el doble del 7.7% obtenido por el siguiente mejor modelo de IA en la misma categoría.
A pesar de estos resultados prometedores, el uso de computadoras por parte de Claude aún está en sus primeras etapas. Todavía no puede realizar tareas más complejas como arrastrar ventanas o hacer zoom en la pantalla. Además, al depender de capturas de pantalla, podría pasar por alto ciertas acciones y notificaciones.
Anthropic se mantiene optimista, afirmando: "Esperamos que el uso de computadoras mejore rápidamente para volverse más rápido, más confiable y más útil para las tareas que nuestros usuarios desean completar." También enfatizan que, a medida que la tecnología evoluciona, se volverá más accesible para aquellos con menos experiencia en desarrollo de software, todo mientras se mantienen estrictas medidas de seguridad.
Claude 3.5 Sonnet ahora es accesible para todos. Los desarrolladores pueden comenzar a construir aplicaciones con la beta de uso de computadora en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud.
Artículo relacionado
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Recomendaciones de temas especiales relacionados
comentario (8)
0/500
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.

¿Alguna vez has soñado con una IA que pueda interactuar sin problemas con tu computadora, como lo haría un humano? Bueno, ese sueño ahora es una realidad, gracias a la última innovación de Anthropic. El martes, presentaron la nueva generación de su modelo de IA Claude, llamado Claude 3.5 Sonnet, que puede operar una computadora con una sorprendente destreza. Actualmente en modo beta, esta IA está disponible para que los desarrolladores experimenten con ella a través de una API.
Anthropic etiqueta con orgullo a Claude 3.5 Sonnet como el "primer modelo de IA de frontera que ofrece uso de computadora en beta pública." Esto significa que los desarrolladores pueden programarlo para realizar una variedad de tareas en una computadora, como ver la pantalla, mover el cursor, hacer clic en botones e incluso escribir en un teclado virtual. ¿El objetivo? Replicar la forma en que interactuamos con nuestras computadoras todos los días.
Ahora, aunque esta nueva IA aún está en fase experimental, no está exenta de problemas. Puede ser un poco torpe y propensa a errores en ocasiones. Pero eso es exactamente por lo que Anthropic la lanzó en beta: para recopilar valiosos comentarios de los desarrolladores y refinar el modelo con el tiempo.
¿Por qué debería importarnos que la IA use computadoras?
Anthropic tiene una respuesta clara para esa pregunta: "Una gran cantidad de trabajo moderno ocurre a través de computadoras." Al permitir que las IAs interactúen con el software de la misma manera que lo hacen los humanos, se desbloquea una gran cantidad de nuevas aplicaciones que los asistentes de IA actuales no pueden manejar.
¿Cómo pueden beneficiarse los desarrolladores y los usuarios?
En lugar de crear herramientas específicas para cada tarea, Anthropic está enseñando a Claude habilidades generales de computadora. Esto permite que la IA utilice una amplia gama de programas de software estándar diseñados para humanos. Los desarrolladores pueden aprovechar esta capacidad para automatizar tareas repetitivas, construir y probar software, e incluso realizar investigaciones.
Varias empresas ya están utilizando las habilidades informáticas de Claude 3.5 Sonnet, incluyendo Asana, Canva, Cognition, DoorDash, Replit y The Browser Company. Por ejemplo, Replit está utilizando estas capacidades para mejorar su producto Replit Agent.
¿Cómo entrenaron a Claude para usar computadoras?
Entrenar a Claude para navegar por una computadora implicó mucho ensayo y error, según Anthropic. El proceso requiere que la IA comprenda e interprete imágenes de la pantalla de la computadora, y luego decida qué acciones tomar basándose en lo que ve. Claude 3.5 Sonnet logra esto analizando capturas de pantalla, contando píxeles para mover el cursor con precisión y emitiendo comandos de ratón.
¿Qué tan bien está funcionando Claude?
En las pruebas de evaluación de OSWorld, que miden la capacidad de los modelos de IA para usar computadoras, Claude 3.5 Sonnet obtuvo una puntuación del 14.9%. Aunque esto es significativamente menor que el rendimiento humano del 70%-75%, es casi el doble del 7.7% obtenido por el siguiente mejor modelo de IA en la misma categoría.
A pesar de estos resultados prometedores, el uso de computadoras por parte de Claude aún está en sus primeras etapas. Todavía no puede realizar tareas más complejas como arrastrar ventanas o hacer zoom en la pantalla. Además, al depender de capturas de pantalla, podría pasar por alto ciertas acciones y notificaciones.
Anthropic se mantiene optimista, afirmando: "Esperamos que el uso de computadoras mejore rápidamente para volverse más rápido, más confiable y más útil para las tareas que nuestros usuarios desean completar." También enfatizan que, a medida que la tecnología evoluciona, se volverá más accesible para aquellos con menos experiencia en desarrollo de software, todo mientras se mantienen estrictas medidas de seguridad.
Claude 3.5 Sonnet ahora es accesible para todos. Los desarrolladores pueden comenzar a construir aplicaciones con la beta de uso de computadora en la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud.
La primera serie de AIGC de Yaoke Media, «El misterio del bronce en Qinling», se estrena hoy con protagonistas creados por IA
Hoy se estrena oficialmente la miniserie de misterio y fantasía con IA generativa (AIGC) de Yaoke Media, «La historia secreta del bronce de Qinling». Protagonizada por los dos primeros actores de IA c
Satya Nadella está listo para aprovechar el nuevo acuerdo con OpenAI
El miércoles, un analista de Wall Street preguntó directamente al CEO de Microsoft, Satya Nadella, cómo la revisada asociación con OpenAI afectaría las finanzas de la empresa.Nadella describió el nuevo acuerdo como una victoria para todos. “Estamos
WordPress.com ya permite que los agentes de IA redacten y publiquen entradas, entre otras cosas
WordPress.com, la popular plataforma de alojamiento web y publicación, está incorporando ahora agentes de IA, una iniciativa que podría transformar el aspecto y la experiencia de la web. La empresa an
Когда ИИ начинает делать те же ошибки, что и я в работе с компьютером, это по-своему успокаивает 😂 Меня беспокоит, насколько мы готовы доверить программному обеспечению такое прямое взаимодействие с интерфейсом. Это ведь прямая дорога как к невероятной производительности, так и к полному хаосу, если что-то пойдет не так. Кажется, пора задуматься о новых 'правилах дорожного движения' для роботов-помощников.
Этот AI, который делает ошибки, как человек, звучит одновременно и забавно, и немного тревожно 😅 Получается, мы создали идеального цифрового стажёра, который тоже путает Ctrl+C и Ctrl+V? Интересно, как это повлияет на безопасность — вдруг он случайно удалит что-то важное, пытаясь 'помочь'?
Wow, Claude 3.5 Sonnet sounds like a game-changer! An AI that mimics human computer use, errors and all? That’s wild. I wonder how it handles my messy desktop and random browser tabs 😅. Super curious to see it in action!
This AI acting like a human on computers is wild! 😮 Makes me wonder if it’ll start rage-quitting when apps crash like I Elyse.





Hogar






