Die neuen AI -Agenten -Tools von OpenAI könnten Ihre Codierungserfahrung revolutionieren

Se você gastou algum tempo como desenvolvedor de produção, está ciente de que as interfaces de programação de aplicativos (APIs) podem mudar em um centavo, geralmente por capricho do provedor. Um dia, seu aplicativo está funcionando sem problemas e você está sonhando com seu futuro brilhante. Na manhã seguinte, você acorda para descobrir que um de seus provedores de API anunciou uma grande mudança, forçando você a passar os próximos seis meses reescrevendo seu aplicativo para se adaptar. Confie em mim, eu estive lá.
Os aplicativos baseados em IA não são exceção a esta regra da vida da API. A OpenAI anunciou recentemente a introdução da API de respostas, o que significa que o pôr do sol de sua API de assistentes está no horizonte, definido em algum momento em 2026.
Como na maioria das atualizações da API, a nova API de respostas promete mais recursos, melhor desempenho e menos dores de cabeça. Mas, apesar dessas melhorias, os primeiros adotantes das APIs anteriores terão as mãos cheias de novas tarefas.
A OpenAI também introduziu uma série de novos recursos no nível do programador para a construção de agentes de IA, incluindo a nova API. Vamos tomar um momento para entender o contexto dessa mudança.
Desde a ascensão da IA generativa (Gen AI) há alguns anos, parece que todos os produtos e serviços saltaram na onda da IA, adicionando recursos movidos a IA às suas ofertas. Estes nem sempre são construídos do zero; Muitas empresas estão alavancando APIs de provedores de IA como o OpenAI. Essas APIs oferecem funcionalidade de IA a um custo previsível por transação. Por exemplo, com um único dólar, um desenvolvedor pode fazer cerca de 67 consultas típicas de bate-papo GPT-4.5, 1.176 consultas GPT-4o ou uma enorme quantidade de consultas GPT-4o.
Graças às APIs do OpenAI e de outras empresas de IA, os desenvolvedores agora podem adicionar recursos de IA ao seu código com chamadas de função simples e um cartão de crédito, ignorando anos de desenvolvimento e custos de infraestrutura e pesquisa.
A nova API de respostas
Até agora, o OpenAI forneceu a API de conclusão de bate-papo para enviar solicitações de bate-papo para ChatGPT e receber respostas, e a API de assistentes, que permitiu aos agentes executar arquivos de raciocínio e acesso de várias etapas. A API de novas respostas mescla os recursos de ambos. Enquanto a API de conclusão de bate -papo permanecerá por aí, a API de assistentes está programada para se aposentar no próximo ano, abrindo caminho para a API de respostas mais poderosa.
Os preços da API de respostas podem ser encontrados na página de preços do OpenAI e varia de acordo com o modelo e o uso.
A API de respostas vem com três ferramentas embutidas para programadores: pesquisa da web, pesquisa de arquivos e uso do computador.
A ferramenta de pesquisa na web
Se você já usou o ChatGPT para vasculhar a web e compilar respostas, conhece o que a ferramenta de pesquisa da web faz. Com a API de respostas, os desenvolvedores podem iniciar essas consultas diretamente de seus programas. A API retorna respostas de texto, juntamente com links para fontes e citações embutidas. Enquanto o OpenAI relata que os testes com o GPT-4O mostraram apenas uma taxa de precisão de 38%, a visualização de pesquisa do GPT-4O e a pré-visualização do GPT-4O Mini Search alcançaram uma taxa de precisão de 90%. Não é perfeito, mas muito bom, certo?
A ferramenta de pesquisa de arquivos
Em seguida, é a ferramenta de pesquisa de arquivos, projetada para pesquisar na biblioteca de documentos da sua empresa. O OpenAI garante aos usuários que os dados comerciais não serão usados para treinar seus AIs, para que você possa se sentir um pouco seguro em enviar seus dados. No entanto, a US $ 0,10 por gigabyte por mês, o armazenamento de arquivos não é barato. Por exemplo, o banco de dados de documentos de 57 TB da minha pequena empresa custaria quase US $ 6.000 por mês para armazenar com o OpenAI. Embora as ferramentas de pesquisa de IA possam quebrar os silos, o preço pode limitar a praticidade desse recurso para muitas empresas.
Ferramenta de uso do computador
Finalmente, há a ferramenta de uso do computador, que é central para o agente operador da OpenAI. Ele deve ler telas e executar ações com base no que vê. A partir das demos, fica claro que essa ferramenta ainda tem um caminho a percorrer antes de se tornar universalmente útil. Teremos que ficar de olho em seu progresso.
Agentes SDK
Uma API é essencialmente um conjunto de pontos de extremidade ou chamadas de função que permitem interação com um sistema externo. Um SDK (kit de desenvolvimento de software), por outro lado, é um pacote mais abrangente que inclui ferramentas de software, APIs, bibliotecas e utilitários, todos trabalhando juntos.
O OpenAI introduziu o agente SDK, um kit de ferramentas para agentes de construção, depuração e monitoramento. Este kit incorpora a API de respostas e adiciona orquestração de fluxo de trabalho, permitindo que os desenvolvedores executem raciocínio e tarefas em várias etapas. Ele também permite a criação de equipes de agentes, cada uma com funções específicas, e inclui uma funcionalidade de "transferência", na qual um agente pode transmitir tarefas para outro.
Talvez um dos recursos mais cruciais seja o painel de monitoramento, que permite aos desenvolvedores rastrear todas as interações com a IA, identificar quais agentes foram usados para quê e como foram encarregados. Dada a questão das alucinações da IA, é vital acompanhar o que essas tarefas independentes estão fazendo.
O que você acha das últimas atualizações do OpenAI?
Você está planejando integrar a API de respostas em seus projetos ou o pôr do sol da API de assistentes lhe dá uma pausa? O que você acha das ferramentas embutidas, como pesquisa na web, pesquisa de arquivos e uso do computador? Eles atendem às necessidades reais ou trazem novos desafios?
E quanto aos agentes SDK? Você vê isso como um divisor de águas para o desenvolvimento do agente de IA ou ainda há lacunas a serem preenchidas? Compartilhe suas idéias nos comentários abaixo.
Mantenha-se conectado às minhas atualizações diárias do projeto nas mídias sociais. Não se esqueça de se inscrever no meu boletim de atualização semanal e siga -me no Twitter/x em @davidgewirtz, no Facebook em facebook.com/davidgewirtz, no Instagram em Instagram.com/davidgewirtz, em bluesky em @Davidgewirtz.com e no youtube em youtube.com/davidgewirtztv.
Verwandter Artikel
KI-gestützte Zusammenfassung: Ein vollständiger Leitfaden zur Zusammenfassung von YouTube-Videos
In der heutigen schnelllebigen Welt ist die Fähigkeit, Informationen schnell zu verarbeiten und zu verstehen, wichtiger denn je. YouTube, mit seiner unendlichen Vielfalt an Videos, ist eine Schatzkamm
KI revolutioniert Ultraschall für Point-of-Care-Bewertungen
Künstliche Intelligenz revolutioniert die Gesundheitsversorgung, und die Ultraschalltechnologie profitiert von dieser Veränderung. Dieser Artikel beleuchtet, wie KI Point-of-Care-Ultraschall (POCUS)-B
Maschinenlernen-Spickzettel: Unverzichtbarer AI-Schnellreferenzleitfaden
In der dynamischen Welt der Technologie, in der KI und Cloud-Computing Innovationen vorantreiben, ist es entscheidend, auf dem Laufenden und vorbereitet zu sein. Ob Sie Strategien mit einem Kollegen b
Kommentare (0)
0/200
Se você gastou algum tempo como desenvolvedor de produção, está ciente de que as interfaces de programação de aplicativos (APIs) podem mudar em um centavo, geralmente por capricho do provedor. Um dia, seu aplicativo está funcionando sem problemas e você está sonhando com seu futuro brilhante. Na manhã seguinte, você acorda para descobrir que um de seus provedores de API anunciou uma grande mudança, forçando você a passar os próximos seis meses reescrevendo seu aplicativo para se adaptar. Confie em mim, eu estive lá.
Os aplicativos baseados em IA não são exceção a esta regra da vida da API. A OpenAI anunciou recentemente a introdução da API de respostas, o que significa que o pôr do sol de sua API de assistentes está no horizonte, definido em algum momento em 2026.
Como na maioria das atualizações da API, a nova API de respostas promete mais recursos, melhor desempenho e menos dores de cabeça. Mas, apesar dessas melhorias, os primeiros adotantes das APIs anteriores terão as mãos cheias de novas tarefas.
A OpenAI também introduziu uma série de novos recursos no nível do programador para a construção de agentes de IA, incluindo a nova API. Vamos tomar um momento para entender o contexto dessa mudança.
Desde a ascensão da IA generativa (Gen AI) há alguns anos, parece que todos os produtos e serviços saltaram na onda da IA, adicionando recursos movidos a IA às suas ofertas. Estes nem sempre são construídos do zero; Muitas empresas estão alavancando APIs de provedores de IA como o OpenAI. Essas APIs oferecem funcionalidade de IA a um custo previsível por transação. Por exemplo, com um único dólar, um desenvolvedor pode fazer cerca de 67 consultas típicas de bate-papo GPT-4.5, 1.176 consultas GPT-4o ou uma enorme quantidade de consultas GPT-4o.
Graças às APIs do OpenAI e de outras empresas de IA, os desenvolvedores agora podem adicionar recursos de IA ao seu código com chamadas de função simples e um cartão de crédito, ignorando anos de desenvolvimento e custos de infraestrutura e pesquisa.
A nova API de respostas
Até agora, o OpenAI forneceu a API de conclusão de bate-papo para enviar solicitações de bate-papo para ChatGPT e receber respostas, e a API de assistentes, que permitiu aos agentes executar arquivos de raciocínio e acesso de várias etapas. A API de novas respostas mescla os recursos de ambos. Enquanto a API de conclusão de bate -papo permanecerá por aí, a API de assistentes está programada para se aposentar no próximo ano, abrindo caminho para a API de respostas mais poderosa.
Os preços da API de respostas podem ser encontrados na página de preços do OpenAI e varia de acordo com o modelo e o uso.
A API de respostas vem com três ferramentas embutidas para programadores: pesquisa da web, pesquisa de arquivos e uso do computador.
A ferramenta de pesquisa na web
Se você já usou o ChatGPT para vasculhar a web e compilar respostas, conhece o que a ferramenta de pesquisa da web faz. Com a API de respostas, os desenvolvedores podem iniciar essas consultas diretamente de seus programas. A API retorna respostas de texto, juntamente com links para fontes e citações embutidas. Enquanto o OpenAI relata que os testes com o GPT-4O mostraram apenas uma taxa de precisão de 38%, a visualização de pesquisa do GPT-4O e a pré-visualização do GPT-4O Mini Search alcançaram uma taxa de precisão de 90%. Não é perfeito, mas muito bom, certo?
A ferramenta de pesquisa de arquivos
Em seguida, é a ferramenta de pesquisa de arquivos, projetada para pesquisar na biblioteca de documentos da sua empresa. O OpenAI garante aos usuários que os dados comerciais não serão usados para treinar seus AIs, para que você possa se sentir um pouco seguro em enviar seus dados. No entanto, a US $ 0,10 por gigabyte por mês, o armazenamento de arquivos não é barato. Por exemplo, o banco de dados de documentos de 57 TB da minha pequena empresa custaria quase US $ 6.000 por mês para armazenar com o OpenAI. Embora as ferramentas de pesquisa de IA possam quebrar os silos, o preço pode limitar a praticidade desse recurso para muitas empresas.
Ferramenta de uso do computador
Finalmente, há a ferramenta de uso do computador, que é central para o agente operador da OpenAI. Ele deve ler telas e executar ações com base no que vê. A partir das demos, fica claro que essa ferramenta ainda tem um caminho a percorrer antes de se tornar universalmente útil. Teremos que ficar de olho em seu progresso.
Agentes SDK
Uma API é essencialmente um conjunto de pontos de extremidade ou chamadas de função que permitem interação com um sistema externo. Um SDK (kit de desenvolvimento de software), por outro lado, é um pacote mais abrangente que inclui ferramentas de software, APIs, bibliotecas e utilitários, todos trabalhando juntos.
O OpenAI introduziu o agente SDK, um kit de ferramentas para agentes de construção, depuração e monitoramento. Este kit incorpora a API de respostas e adiciona orquestração de fluxo de trabalho, permitindo que os desenvolvedores executem raciocínio e tarefas em várias etapas. Ele também permite a criação de equipes de agentes, cada uma com funções específicas, e inclui uma funcionalidade de "transferência", na qual um agente pode transmitir tarefas para outro.
Talvez um dos recursos mais cruciais seja o painel de monitoramento, que permite aos desenvolvedores rastrear todas as interações com a IA, identificar quais agentes foram usados para quê e como foram encarregados. Dada a questão das alucinações da IA, é vital acompanhar o que essas tarefas independentes estão fazendo.
O que você acha das últimas atualizações do OpenAI?
Você está planejando integrar a API de respostas em seus projetos ou o pôr do sol da API de assistentes lhe dá uma pausa? O que você acha das ferramentas embutidas, como pesquisa na web, pesquisa de arquivos e uso do computador? Eles atendem às necessidades reais ou trazem novos desafios?
E quanto aos agentes SDK? Você vê isso como um divisor de águas para o desenvolvimento do agente de IA ou ainda há lacunas a serem preenchidas? Compartilhe suas idéias nos comentários abaixo.
Mantenha-se conectado às minhas atualizações diárias do projeto nas mídias sociais. Não se esqueça de se inscrever no meu boletim de atualização semanal e siga -me no Twitter/x em @davidgewirtz, no Facebook em facebook.com/davidgewirtz, no Instagram em Instagram.com/davidgewirtz, em bluesky em @Davidgewirtz.com e no youtube em youtube.com/davidgewirtztv.












