

Las nuevas herramientas de agente de IA de OpenAI podrían revolucionar su experiencia de codificación
26 de abril de 2025
FrankJackson
0
Si ha pasado algún tiempo como desarrollador de producción, es muy consciente de que las interfaces de programación de aplicaciones (API) pueden cambiar en un centavo, a menudo por capricho del proveedor. Un día, su aplicación se ejecuta sin problemas y estás soñando con su brillante futuro. A la mañana siguiente, se despierta para descubrir que uno de sus proveedores de API ha anunciado un cambio importante, lo que lo obliga a pasar los próximos seis meses reescribiendo su aplicación para adaptarse. Confía en mí, he estado allí.
Las aplicaciones basadas en IA no son una excepción a esta regla de la vida de API. Operai ha anunciado recientemente la introducción de la API de respuestas, lo que significa que la API de sus asistentes está en el horizonte, establecido durante algún tiempo en 2026.
Al igual que con la mayoría de las actualizaciones de API, la nueva API de respuestas promete más características, un mejor rendimiento y menos dolores de cabeza. Pero a pesar de estas mejoras, los primeros adoptantes de las API anteriores tendrán las manos llenas con nuevas tareas.
Operai también ha introducido una serie de nuevas características a nivel de programador para construir agentes de IA, incluida la nueva API. Tomemos un momento para comprender el contexto de este cambio.
Desde el surgimiento de la IA generativa (Gen AI) hace unos años, parece que todos los productos y servicios se han subido al carro de IA, agregando características a la IA a sus ofertas. Estos no siempre están construidos desde cero; Muchas compañías están aprovechando las API de proveedores de IA como OpenAI. Estas API ofrecen funcionalidad de IA a un costo predecible por transacción. Por ejemplo, con un solo dólar, un desarrollador puede hacer aproximadamente 67 consultas de chat típicas GPT-4.5, 1,176 consultas GPT-4O o una friolera de 20,000 mini consultas GPT-4O.
Gracias a las API de OpenAI y otras compañías de IA, los desarrolladores ahora pueden agregar capacidades de IA a su código con llamadas de funciones simples y una tarjeta de crédito, evitando años de desarrollo e infraestructura considerables e costos de investigación.
Las nuevas respuestas API
Hasta ahora, OpenAI proporcionó la API de finalización de chat para enviar indicaciones de chat a ChatGPT y recibir respuestas, y la API de asistentes, lo que permitió a los agentes realizar archivos de razonamiento y acceso de varios pasos. La nueva API de respuestas fusiona las capacidades de ambos. Si bien la API de finalización de chat se quedará, la API de asistentes está programada para la jubilación el próximo año, dando paso a la API de respuestas más potente.
El precio de la API de las respuestas se puede encontrar en la página de precios de OpenAI y varía según el modelo y el uso.
La API de respuestas viene con tres herramientas incorporadas para programadores: búsqueda web, búsqueda de archivos y uso de la computadora.
La herramienta de búsqueda web
Si alguna vez ha usado CHATGPT para recorrer la web y compilar respuestas, está familiarizado con lo que hace la herramienta de búsqueda web. Con la API de respuestas, los desarrolladores pueden iniciar tales consultas directamente de sus programas. La API devuelve respuestas de texto junto con enlaces a fuentes y citas en línea. Mientras que Operai informa que las pruebas con GPT-4O mostraron solo una tasa de precisión del 38%, la vista previa de búsqueda GPT-4O y la vista previa de búsqueda de MINI GPT-4O lograron una tasa de precisión del 90%. No es perfecto, pero bastante bueno, ¿verdad?
La herramienta de búsqueda de archivos
El siguiente es la herramienta de búsqueda de archivos, diseñada para buscar a través de la biblioteca de documentos de su empresa. Openai asegura a los usuarios que los datos comerciales no se utilizarán para capacitar a sus AIS, por lo que puede sentirse algo seguro al cargar sus datos. Sin embargo, a $ 0.10 por gigabyte por mes, el almacenamiento de archivos no es barato. Por ejemplo, la base de datos de documentos 57TB de mi pequeña empresa costaría casi $ 6,000 por mes para almacenar con OpenAI. Si bien las herramientas de búsqueda de IA pueden desglosar silos, los precios pueden limitar la practicidad de esta característica para muchas empresas.
Herramienta de uso de la computadora
Finalmente, está la herramienta de uso de la computadora, que es fundamental para el agente de operadores de OpenAI. Está destinado a leer pantallas y realizar acciones basadas en lo que ve. De las demostraciones, está claro que esta herramienta todavía tiene un camino por recorrer antes de que se vuelva universalmente útil. Tendremos que vigilar su progreso.
Agentes SDK
Una API es esencialmente un conjunto de puntos finales o llamadas de función que permiten la interacción con un sistema externo. Un SDK (Kit de desarrollo de software), por otro lado, es un paquete más completo que incluye herramientas de software, API, bibliotecas y servicios públicos, todo trabajando juntos.
Operai ha introducido el SDK de los Agentes, un conjunto de herramientas para la construcción, la depuración y los agentes de monitoreo. Este kit incorpora la API de respuestas y agrega orquestación de flujo de trabajo, lo que permite a los desarrolladores ejecutar razonamiento y tareas de varios pasos. También permite la creación de equipos de agentes, cada uno con roles específicos e incluye una funcionalidad de "transferencia" donde un agente puede transmitir tareas a otro.
Quizás una de las características más cruciales es el tablero de monitoreo, que permite a los desarrolladores rastrear cada interacción con la IA, identificar qué agentes se usaron para qué y cómo se les encargó. Dado el tema de las alucinaciones de IA, es vital vigilar lo que están haciendo estas tareas independientes.
¿Qué piensas de las últimas actualizaciones de Openai?
¿Está planeando integrar las respuestas API en sus proyectos, o la API de los asistentes le da una pausa? ¿Qué piensas sobre las herramientas incorporadas como la búsqueda web, la búsqueda de archivos y el uso de la computadora? ¿Abordan las necesidades reales o traen nuevos desafíos?
¿Y qué hay del SDK de los agentes? ¿Lo ves como un cambio de juego para el desarrollo de agentes de IA, o todavía hay vacíos para llenar? Comparta sus ideas en los comentarios a continuación.

Manténgase conectado con mis actualizaciones de proyecto diarias en las redes sociales. No olvide suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @davidgewirtz, en Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en Bluesky en @Davidgewirtz.com, y en YouTube en YouTube.com/davidgewirtztztv.
Artículo relacionado
Davos 2025: Navegando el regreso de Trump y los cambios económicos globales
Davos 2025 fue un espectáculo de montañas nevadas, líderes mundiales y gigantes económicos, pero el verdadero zumbido fue sobre el regreso de una cara familiar: Donald Trump. Su segunda inauguración como presidente de los Estados Unidos y su dirección virtual al foro prepararon el escenario para una reevaluación del comercio global, seguridad, un
Super Mario Brothers: A Dark Fan Fiction Adventure
Si pensabas que el universo de Super Mario Brothers tenía que ver con colores brillantes y aventuras alegres, piense de nuevo. Sumérgete en esta ficción de fanáticos asistidos que voltea el guión, hundiendo a Mario y Luigi en un mundo tambaleándose en el borde de la desesperación, con alianzas inesperadas y un apocalipo inminente
La composición de canciones con IA desbloquea Bard Inner, plantea implicaciones
El mundo de la música está experimentando una transformación fascinante a medida que la inteligencia artificial (IA) entra en el ámbito de la composición de canciones. Ya no es solo un concepto de ciencia ficción, la composición de canciones de IA está aquí, desafiando nuestros puntos de vista tradicionales sobre la creatividad, la autoría y la expresión artística. Exploremos cómo es AI CR
Comentario (0)
0/200






Si ha pasado algún tiempo como desarrollador de producción, es muy consciente de que las interfaces de programación de aplicaciones (API) pueden cambiar en un centavo, a menudo por capricho del proveedor. Un día, su aplicación se ejecuta sin problemas y estás soñando con su brillante futuro. A la mañana siguiente, se despierta para descubrir que uno de sus proveedores de API ha anunciado un cambio importante, lo que lo obliga a pasar los próximos seis meses reescribiendo su aplicación para adaptarse. Confía en mí, he estado allí.
Las aplicaciones basadas en IA no son una excepción a esta regla de la vida de API. Operai ha anunciado recientemente la introducción de la API de respuestas, lo que significa que la API de sus asistentes está en el horizonte, establecido durante algún tiempo en 2026.
Al igual que con la mayoría de las actualizaciones de API, la nueva API de respuestas promete más características, un mejor rendimiento y menos dolores de cabeza. Pero a pesar de estas mejoras, los primeros adoptantes de las API anteriores tendrán las manos llenas con nuevas tareas.
Operai también ha introducido una serie de nuevas características a nivel de programador para construir agentes de IA, incluida la nueva API. Tomemos un momento para comprender el contexto de este cambio.
Desde el surgimiento de la IA generativa (Gen AI) hace unos años, parece que todos los productos y servicios se han subido al carro de IA, agregando características a la IA a sus ofertas. Estos no siempre están construidos desde cero; Muchas compañías están aprovechando las API de proveedores de IA como OpenAI. Estas API ofrecen funcionalidad de IA a un costo predecible por transacción. Por ejemplo, con un solo dólar, un desarrollador puede hacer aproximadamente 67 consultas de chat típicas GPT-4.5, 1,176 consultas GPT-4O o una friolera de 20,000 mini consultas GPT-4O.
Gracias a las API de OpenAI y otras compañías de IA, los desarrolladores ahora pueden agregar capacidades de IA a su código con llamadas de funciones simples y una tarjeta de crédito, evitando años de desarrollo e infraestructura considerables e costos de investigación.
Las nuevas respuestas API
Hasta ahora, OpenAI proporcionó la API de finalización de chat para enviar indicaciones de chat a ChatGPT y recibir respuestas, y la API de asistentes, lo que permitió a los agentes realizar archivos de razonamiento y acceso de varios pasos. La nueva API de respuestas fusiona las capacidades de ambos. Si bien la API de finalización de chat se quedará, la API de asistentes está programada para la jubilación el próximo año, dando paso a la API de respuestas más potente.
El precio de la API de las respuestas se puede encontrar en la página de precios de OpenAI y varía según el modelo y el uso.
La API de respuestas viene con tres herramientas incorporadas para programadores: búsqueda web, búsqueda de archivos y uso de la computadora.
La herramienta de búsqueda web
Si alguna vez ha usado CHATGPT para recorrer la web y compilar respuestas, está familiarizado con lo que hace la herramienta de búsqueda web. Con la API de respuestas, los desarrolladores pueden iniciar tales consultas directamente de sus programas. La API devuelve respuestas de texto junto con enlaces a fuentes y citas en línea. Mientras que Operai informa que las pruebas con GPT-4O mostraron solo una tasa de precisión del 38%, la vista previa de búsqueda GPT-4O y la vista previa de búsqueda de MINI GPT-4O lograron una tasa de precisión del 90%. No es perfecto, pero bastante bueno, ¿verdad?
La herramienta de búsqueda de archivos
El siguiente es la herramienta de búsqueda de archivos, diseñada para buscar a través de la biblioteca de documentos de su empresa. Openai asegura a los usuarios que los datos comerciales no se utilizarán para capacitar a sus AIS, por lo que puede sentirse algo seguro al cargar sus datos. Sin embargo, a $ 0.10 por gigabyte por mes, el almacenamiento de archivos no es barato. Por ejemplo, la base de datos de documentos 57TB de mi pequeña empresa costaría casi $ 6,000 por mes para almacenar con OpenAI. Si bien las herramientas de búsqueda de IA pueden desglosar silos, los precios pueden limitar la practicidad de esta característica para muchas empresas.
Herramienta de uso de la computadora
Finalmente, está la herramienta de uso de la computadora, que es fundamental para el agente de operadores de OpenAI. Está destinado a leer pantallas y realizar acciones basadas en lo que ve. De las demostraciones, está claro que esta herramienta todavía tiene un camino por recorrer antes de que se vuelva universalmente útil. Tendremos que vigilar su progreso.
Agentes SDK
Una API es esencialmente un conjunto de puntos finales o llamadas de función que permiten la interacción con un sistema externo. Un SDK (Kit de desarrollo de software), por otro lado, es un paquete más completo que incluye herramientas de software, API, bibliotecas y servicios públicos, todo trabajando juntos.
Operai ha introducido el SDK de los Agentes, un conjunto de herramientas para la construcción, la depuración y los agentes de monitoreo. Este kit incorpora la API de respuestas y agrega orquestación de flujo de trabajo, lo que permite a los desarrolladores ejecutar razonamiento y tareas de varios pasos. También permite la creación de equipos de agentes, cada uno con roles específicos e incluye una funcionalidad de "transferencia" donde un agente puede transmitir tareas a otro.
Quizás una de las características más cruciales es el tablero de monitoreo, que permite a los desarrolladores rastrear cada interacción con la IA, identificar qué agentes se usaron para qué y cómo se les encargó. Dado el tema de las alucinaciones de IA, es vital vigilar lo que están haciendo estas tareas independientes.
¿Qué piensas de las últimas actualizaciones de Openai?
¿Está planeando integrar las respuestas API en sus proyectos, o la API de los asistentes le da una pausa? ¿Qué piensas sobre las herramientas incorporadas como la búsqueda web, la búsqueda de archivos y el uso de la computadora? ¿Abordan las necesidades reales o traen nuevos desafíos?
¿Y qué hay del SDK de los agentes? ¿Lo ves como un cambio de juego para el desarrollo de agentes de IA, o todavía hay vacíos para llenar? Comparta sus ideas en los comentarios a continuación.
Manténgase conectado con mis actualizaciones de proyecto diarias en las redes sociales. No olvide suscribirse a mi boletín de actualizaciones semanales y sígueme en Twitter/X en @davidgewirtz, en Facebook en Facebook.com/davidgewirtz, en Instagram en Instagram.com/davidgewirtz, en Bluesky en @Davidgewirtz.com, y en YouTube en YouTube.com/davidgewirtztztv.












