OpenAi의 새로운 AI 에이전트 도구는 코딩 경험에 혁명을 일으킬 수 있습니다.

프로덕션 개발자로서 시간을 보냈다면, 응용 프로그램 인터페이스(API)가 제공자의 변덕에 따라 순식간에 변경될 수 있다는 것을 잘 알고 있을 것입니다. 어느 날, 앱이 원활하게 실행되며 밝은 미래를 꿈꾸고 있습니다. 하지만 다음 날 아침, API 제공업체 중 하나가 주요 변경을 발표했다는 소식을 듣고, 앱을 새로 적응시키기 위해 다음 6개월을 다시 작성해야 하는 상황에 직면합니다. 저를 믿으세요, 저도 그 상황을 겪어봤습니다.
AI 기반 앱도 이 API 생태계의 규칙에서 예외는 아닙니다. OpenAI는 최근 Responses API의 도입을 발표했으며, 이는 Assistants API가 2026년에 종료될 예정임을 의미합니다.
대부분의 API 업데이트와 마찬가지로, 새로운 Responses API는 더 많은 기능, 더 나은 성능, 그리고 더 적은 문제를 약속합니다. 하지만 이러한 개선에도 불구하고, 이전 API의 초기 사용자들은 새로운 작업으로 바빠질 것입니다.
OpenAI는 또한 새로운 API를 포함하여 AI 에이전트 구축을 위한 일련의 새로운 프로그래머 수준 기능을 도입했습니다. 이 변화의 맥락을 잠시 살펴보겠습니다.
몇 년 전 생성 AI(Gen AI)의 부상 이후, 모든 제품과 서비스가 AI 열풍에 동참하여 AI 기반 기능을 추가하고 있는 것 같습니다. 이들은 항상 처음부터 만들어지는 것은 아니며, 많은 기업이 OpenAI와 같은 AI 제공업체의 API를 활용하고 있습니다. 이러한 API는 거래당 예측 가능한 비용으로 AI 기능을 제공합니다. 예를 들어, 1달러로 개발자는 약 67개의 GPT-4.5 일반 채팅 쿼리, 1,176개의 GPT-4o 쿼리, 또는 무려 20,000개의 GPT-4o 미니 쿼리를 실행할 수 있습니다.
OpenAI 및 기타 AI 회사의 API 덕분에 개발자는 이제 간단한 함수 호출과 신용카드로 코드에 AI 기능을 추가할 수 있으며, 수년간의 개발과 막대한 인프라 및 연구 비용을 우회할 수 있습니다.
새로운 Responses API
지금까지 OpenAI는 ChatGPT에 채팅 프롬프트를 보내고 응답을 받기 위한 Chat Completions API와, 에이전트가 다단계 추론을 수행하고 파일에 접근할 수 있게 해주는 Assistants API를 제공했습니다. 새로운 Responses API는 이 두 가지의 기능을 통합합니다. Chat Completions API는 계속 유지되지만, Assistants API는 내년에 종료될 예정이며, 더 강력한 Responses API로 대체됩니다.
Responses API의 가격은 OpenAI의 가격 페이지에서 확인할 수 있으며, 모델과 사용량에 따라 다릅니다.
Responses API는 프로그래머를 위한 세 가지 기본 제공 도구를 포함합니다: 웹 검색, 파일 검색, 그리고 컴퓨터 사용.
웹 검색 도구
ChatGPT를 사용해 웹을 검색하고 답변을 컴파일한 적이 있다면, 웹 검색 도구가 무엇을 하는지 익숙할 것입니다. Responses API를 통해 개발자는 프로그램에서 직접 이러한 쿼리를 시작할 수 있습니다. API는 텍스트 응답과 함께 소스 링크 및 인라인 인용을 반환합니다. OpenAI는 GPT-4o로 테스트한 결과 정확도가 38%에 불과했지만, GPT-4o 검색 미리보기와 GPT-4o 미니 검색 미리보기는 90%의 정확도를 달성했다고 보고했습니다. 완벽하지는 않지만, 꽤 괜찮죠?
파일 검색 도구
다음은 회사 문서 라이브러리를 검색하도록 설계된 파일 검색 도구입니다. OpenAI는 비즈니스 데이터가 AI 훈련에 사용되지 않을 것이라고 보장하므로 데이터를 업로드하는 데 다소 안심할 수 있습니다. 하지만 월 1GB당 0.10달러의 비용으로 파일 저장은 저렴하지 않습니다. 예를 들어, 제 소규모 회사의 57TB 문서 데이터베이스를 OpenAI에 저장하려면 월 6,000달러 가까이 비용이 들 것입니다. AI 검색 도구는 사일로를 허물 수 있지만, 가격은 많은 기업에게 이 기능의 실용성을 제한할 수 있습니다.
컴퓨터 사용 도구
마지막으로, OpenAI의 Operator 에이전트의 핵심인 컴퓨터 사용 도구가 있습니다. 이는 화면을 읽고 그에 따라 작업을 수행하도록 설계되었습니다. 데모를 보면 이 도구가 보편적으로 유용해지기까지는 아직 갈 길이 멀다는 것이 분명합니다. 그 진행 상황을 계속 주시해야 할 것입니다.
Agents SDK
API는 기본적으로 외부 시스템과 상호작용할 수 있는 엔드포인트 또는 함수 호출의 집합입니다. 반면 SDK(소프트웨어 개발 키트)는 소프트웨어 도구, API, 라이브러리, 유틸리티를 포함하는 더 포괄적인 패키지로, 모두 함께 작동합니다.
OpenAI는 에이전트 구축, 디버깅, 모니터링을 위한 툴킷인 Agents SDK를 도입했습니다. 이 키트는 Responses API를 포함하며 워크플로 오케스트레이션을 추가하여 개발자가 다단계 추론 및 작업을 실행할 수 있도록 합니다. 또한 특정 역할이 있는 에이전트 팀을 생성할 수 있으며, 한 에이전트가 다른 에이전트에게 작업을 넘기는 "핸드오프" 기능도 포함합니다.
아마도 가장 중요한 기능 중 하나는 모니터링 대시보드로, 개발자가 AI와의 모든 상호작용을 추적하고, 어떤 에이전트가 어떤 작업에 사용되었는지, 그리고 어떻게 작업이 수행되었는지 확인할 수 있게 합니다. AI 환각 문제를 고려할 때, 이러한 독립적인 작업이 무엇을 하고 있는지 추적하는 것이 중요합니다.
OpenAI의 최신 업데이트에 대해 어떻게 생각하시나요?
Responses API를 프로젝트에 통합할 계획이 있나요, 아니면 Assistants API의 종료가 망설이게 하나요? 웹 검색, 파일 검색, 컴퓨터 사용과 같은 기본 제공 도구에 대한 생각은 어떠신가요? 이들이 실제 필요를 해결하나요, 아니면 새로운 도전을 가져오나요?
그리고 Agents SDK는 어떠신가요? AI 에이전트 개발에 있어 판도를 바꾸는 요소로 보이나요, 아니면 아직 채워야 할 공백이 있나요? 아래 댓글에서 당신의 통찰을 공유해주세요.
소셜 미디어에서 제 일상적인 프로젝트 업데이트를 확인하세요. 주간 업데이트 뉴스레터를 구독하는 것을 잊지 마시고, Twitter/X에서 @DavidGewirtz, Facebook에서 Facebook.com/DavidGewirtz, Instagram에서 Instagram.com/DavidGewirtz, Bluesky에서 @DavidGewirtz.com, 그리고 YouTube에서 YouTube.com/DavidGewirtzTV를 팔로우하세요.
관련 기사
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
구글, NotebookLM과 개인 지식 기반을 통합한 ‘제미니 노트북(Gemini Notebooks)’ 공개
구글은 최근 사용자가 맞춤형 지식 기반을 구축하여 복잡한 프로젝트를 관리할 수 있도록 돕기 위해 제미니(Gemini)용 ‘노트북(Notebooks)’ 기능을 출시했습니다. 이번 업데이트는 제미니와 AI 연구 보조 도구인 NotebookLM 간의 데이터 격차를 해소하며, 구글이 폐쇄형 AI 워크플로우를 구축하기 위한 노력의 중요한 단계가 되었습니다.노트북은
루마 AI, 텍스트와 픽셀을 동시에 생성하는 ‘Uni-1’ 자기회귀 모델 공개
루마 랩스(Luma Labs)는 3월 23일 이미지 생성 모델 ‘Uni-1’을 출시하며, ‘Unified Intelligence’ 아키텍처를 기반으로 한 자사의 첫 공개 모델을 선보였습니다. 현재 공식 웹사이트에서 무료 체험을 이용할 수 있으며, API 요금제가 발표되었고 기업용 접근 채널도 단계적으로 확대되고 있습니다.아키텍처 전환: 확산 모델에서 자기회
관련 특별 주제 추천
의견 (2)
0/500
Die Idee, dass KI-Tools uns helfen, API-Änderungen abzufangen, klingt fast zu schön, um wahr zu sein 😅. Ich frage mich, wie gut das in der Praxis wirklich funktioniert – gerade bei speziellen Legacy-Systemen. Einerseits klingt es nach einer Riesenentlastung, andererseits macht es uns Entwickler vielleicht auch abhängiger von einer einzelnen Technologie. Mal sehen, wie das Preismodell am Ende aussieht.

프로덕션 개발자로서 시간을 보냈다면, 응용 프로그램 인터페이스(API)가 제공자의 변덕에 따라 순식간에 변경될 수 있다는 것을 잘 알고 있을 것입니다. 어느 날, 앱이 원활하게 실행되며 밝은 미래를 꿈꾸고 있습니다. 하지만 다음 날 아침, API 제공업체 중 하나가 주요 변경을 발표했다는 소식을 듣고, 앱을 새로 적응시키기 위해 다음 6개월을 다시 작성해야 하는 상황에 직면합니다. 저를 믿으세요, 저도 그 상황을 겪어봤습니다.
AI 기반 앱도 이 API 생태계의 규칙에서 예외는 아닙니다. OpenAI는 최근 Responses API의 도입을 발표했으며, 이는 Assistants API가 2026년에 종료될 예정임을 의미합니다.
대부분의 API 업데이트와 마찬가지로, 새로운 Responses API는 더 많은 기능, 더 나은 성능, 그리고 더 적은 문제를 약속합니다. 하지만 이러한 개선에도 불구하고, 이전 API의 초기 사용자들은 새로운 작업으로 바빠질 것입니다.
OpenAI는 또한 새로운 API를 포함하여 AI 에이전트 구축을 위한 일련의 새로운 프로그래머 수준 기능을 도입했습니다. 이 변화의 맥락을 잠시 살펴보겠습니다.
몇 년 전 생성 AI(Gen AI)의 부상 이후, 모든 제품과 서비스가 AI 열풍에 동참하여 AI 기반 기능을 추가하고 있는 것 같습니다. 이들은 항상 처음부터 만들어지는 것은 아니며, 많은 기업이 OpenAI와 같은 AI 제공업체의 API를 활용하고 있습니다. 이러한 API는 거래당 예측 가능한 비용으로 AI 기능을 제공합니다. 예를 들어, 1달러로 개발자는 약 67개의 GPT-4.5 일반 채팅 쿼리, 1,176개의 GPT-4o 쿼리, 또는 무려 20,000개의 GPT-4o 미니 쿼리를 실행할 수 있습니다.
OpenAI 및 기타 AI 회사의 API 덕분에 개발자는 이제 간단한 함수 호출과 신용카드로 코드에 AI 기능을 추가할 수 있으며, 수년간의 개발과 막대한 인프라 및 연구 비용을 우회할 수 있습니다.
새로운 Responses API
지금까지 OpenAI는 ChatGPT에 채팅 프롬프트를 보내고 응답을 받기 위한 Chat Completions API와, 에이전트가 다단계 추론을 수행하고 파일에 접근할 수 있게 해주는 Assistants API를 제공했습니다. 새로운 Responses API는 이 두 가지의 기능을 통합합니다. Chat Completions API는 계속 유지되지만, Assistants API는 내년에 종료될 예정이며, 더 강력한 Responses API로 대체됩니다.
Responses API의 가격은 OpenAI의 가격 페이지에서 확인할 수 있으며, 모델과 사용량에 따라 다릅니다.
Responses API는 프로그래머를 위한 세 가지 기본 제공 도구를 포함합니다: 웹 검색, 파일 검색, 그리고 컴퓨터 사용.
웹 검색 도구
ChatGPT를 사용해 웹을 검색하고 답변을 컴파일한 적이 있다면, 웹 검색 도구가 무엇을 하는지 익숙할 것입니다. Responses API를 통해 개발자는 프로그램에서 직접 이러한 쿼리를 시작할 수 있습니다. API는 텍스트 응답과 함께 소스 링크 및 인라인 인용을 반환합니다. OpenAI는 GPT-4o로 테스트한 결과 정확도가 38%에 불과했지만, GPT-4o 검색 미리보기와 GPT-4o 미니 검색 미리보기는 90%의 정확도를 달성했다고 보고했습니다. 완벽하지는 않지만, 꽤 괜찮죠?
파일 검색 도구
다음은 회사 문서 라이브러리를 검색하도록 설계된 파일 검색 도구입니다. OpenAI는 비즈니스 데이터가 AI 훈련에 사용되지 않을 것이라고 보장하므로 데이터를 업로드하는 데 다소 안심할 수 있습니다. 하지만 월 1GB당 0.10달러의 비용으로 파일 저장은 저렴하지 않습니다. 예를 들어, 제 소규모 회사의 57TB 문서 데이터베이스를 OpenAI에 저장하려면 월 6,000달러 가까이 비용이 들 것입니다. AI 검색 도구는 사일로를 허물 수 있지만, 가격은 많은 기업에게 이 기능의 실용성을 제한할 수 있습니다.
컴퓨터 사용 도구
마지막으로, OpenAI의 Operator 에이전트의 핵심인 컴퓨터 사용 도구가 있습니다. 이는 화면을 읽고 그에 따라 작업을 수행하도록 설계되었습니다. 데모를 보면 이 도구가 보편적으로 유용해지기까지는 아직 갈 길이 멀다는 것이 분명합니다. 그 진행 상황을 계속 주시해야 할 것입니다.
Agents SDK
API는 기본적으로 외부 시스템과 상호작용할 수 있는 엔드포인트 또는 함수 호출의 집합입니다. 반면 SDK(소프트웨어 개발 키트)는 소프트웨어 도구, API, 라이브러리, 유틸리티를 포함하는 더 포괄적인 패키지로, 모두 함께 작동합니다.
OpenAI는 에이전트 구축, 디버깅, 모니터링을 위한 툴킷인 Agents SDK를 도입했습니다. 이 키트는 Responses API를 포함하며 워크플로 오케스트레이션을 추가하여 개발자가 다단계 추론 및 작업을 실행할 수 있도록 합니다. 또한 특정 역할이 있는 에이전트 팀을 생성할 수 있으며, 한 에이전트가 다른 에이전트에게 작업을 넘기는 "핸드오프" 기능도 포함합니다.
아마도 가장 중요한 기능 중 하나는 모니터링 대시보드로, 개발자가 AI와의 모든 상호작용을 추적하고, 어떤 에이전트가 어떤 작업에 사용되었는지, 그리고 어떻게 작업이 수행되었는지 확인할 수 있게 합니다. AI 환각 문제를 고려할 때, 이러한 독립적인 작업이 무엇을 하고 있는지 추적하는 것이 중요합니다.
OpenAI의 최신 업데이트에 대해 어떻게 생각하시나요?
Responses API를 프로젝트에 통합할 계획이 있나요, 아니면 Assistants API의 종료가 망설이게 하나요? 웹 검색, 파일 검색, 컴퓨터 사용과 같은 기본 제공 도구에 대한 생각은 어떠신가요? 이들이 실제 필요를 해결하나요, 아니면 새로운 도전을 가져오나요?
그리고 Agents SDK는 어떠신가요? AI 에이전트 개발에 있어 판도를 바꾸는 요소로 보이나요, 아니면 아직 채워야 할 공백이 있나요? 아래 댓글에서 당신의 통찰을 공유해주세요.
소셜 미디어에서 제 일상적인 프로젝트 업데이트를 확인하세요. 주간 업데이트 뉴스레터를 구독하는 것을 잊지 마시고, Twitter/X에서 @DavidGewirtz, Facebook에서 Facebook.com/DavidGewirtz, Instagram에서 Instagram.com/DavidGewirtz, Bluesky에서 @DavidGewirtz.com, 그리고 YouTube에서 YouTube.com/DavidGewirtzTV를 팔로우하세요.
오픈AI, 공공 부유 기금, 로봇세, 주 4일 근무제를 통해 AI 경제 구상 제시
각국 정부가 초지능 기계가 초래할 경제적 영향을 관리하기 위해 고심하는 가운데, 오픈AI는 ‘지능 시대’에 부와 일자리가 어떻게 재편될 수 있을지 제시하는 일련의 정책 제안을 발표했다. 이 제안들은 공공 부유 기금이나 사회 안전망 확충과 같은 전통적인 진보적 방안들을 근본적으로 자본주의적이고 시장 주도적인 경제 체계와 결합하고 있다.오픈AI의 제안은 본질적
구글, NotebookLM과 개인 지식 기반을 통합한 ‘제미니 노트북(Gemini Notebooks)’ 공개
구글은 최근 사용자가 맞춤형 지식 기반을 구축하여 복잡한 프로젝트를 관리할 수 있도록 돕기 위해 제미니(Gemini)용 ‘노트북(Notebooks)’ 기능을 출시했습니다. 이번 업데이트는 제미니와 AI 연구 보조 도구인 NotebookLM 간의 데이터 격차를 해소하며, 구글이 폐쇄형 AI 워크플로우를 구축하기 위한 노력의 중요한 단계가 되었습니다.노트북은
루마 AI, 텍스트와 픽셀을 동시에 생성하는 ‘Uni-1’ 자기회귀 모델 공개
루마 랩스(Luma Labs)는 3월 23일 이미지 생성 모델 ‘Uni-1’을 출시하며, ‘Unified Intelligence’ 아키텍처를 기반으로 한 자사의 첫 공개 모델을 선보였습니다. 현재 공식 웹사이트에서 무료 체험을 이용할 수 있으며, API 요금제가 발표되었고 기업용 접근 채널도 단계적으로 확대되고 있습니다.아키텍처 전환: 확산 모델에서 자기회
Die Idee, dass KI-Tools uns helfen, API-Änderungen abzufangen, klingt fast zu schön, um wahr zu sein 😅. Ich frage mich, wie gut das in der Praxis wirklich funktioniert – gerade bei speziellen Legacy-Systemen. Einerseits klingt es nach einer Riesenentlastung, andererseits macht es uns Entwickler vielleicht auch abhängiger von einer einzelnen Technologie. Mal sehen, wie das Preismodell am Ende aussieht.





집






