옵션
뉴스
OpenAI, 속도를 줄이면서 경제적인 AI 작업을 위한 플렉스 프로세싱 도입

OpenAI, 속도를 줄이면서 경제적인 AI 작업을 위한 플렉스 프로세싱 도입

2025년 9월 10일
0

OpenAI, 속도를 줄이면서 경제적인 AI 작업을 위한 플렉스 프로세싱 도입

OpenAI, AI 모델을 위한 비용 절감형 Flex 프로세싱 도입

경쟁력 강화를 위한 전략적 움직임의 일환으로, OpenAI는 다양한 성능 특성을 제공하는 대신 가격을 대폭 낮춘 새로운 API 계층인 Flex 프로세싱을 공개했습니다. 이 접근 방식은 고객이 가변적인 리소스 가용성을 수용하여 비용을 최적화할 수 있는 클라우드 컴퓨팅 제공업체에서 사용하는 유사한 전략을 반영합니다.

플렉스 처리 세부 정보

새로운 옵션은 다음을 제공합니다:

  • 모든 토큰 처리에서 50% 비용 절감
  • 표준 처리와 비교하여 응답 시간 연장
  • 잠재적인 간헐적 서비스 가용성

현재 모델에 대한 가격 비교:

모델표준 입력플렉스 입력표준 출력플렉스 출력
o310/M 토큰5/M 토큰40/M 토큰20/M 토큰
o4-mini1.10/M 토큰0.55/M 토큰4.40/M 토큰2.20/M 토큰

대상 사용 사례

OpenAI는 Flex 처리를 다음과 같은 경우에 이상적이라고 생각합니다:

  • 실험적 모델 테스트
  • 대규모 데이터 처리
  • 백그라운드 분석 작업
  • 개발 환경 워크로드

확장된 검증 요건

Flex 출시와 동시에 OpenAI는 새로운 인증 조치를 시행했습니다:

  • 티어 1~3 사용자에 대한 필수 ID 확인
  • 고급 API 기능에 대한 액세스 제어
  • 강화된 정책 시행 메커니즘

Flex 프로세싱의 도입은 Google을 비롯한 주요 제공업체들이 가격 대비 성능을 강조하는 Gemini 2.5 Flash와 같은 최적화된 모델을 출시하는 등 AI 분야의 경쟁이 치열한 시기에 이루어졌습니다. OpenAI의 이러한 움직임은 개발자들 사이에서 점점 더 커지는 비용 민감도를 해결하면서 시장 지위를 유지하기 위한 것으로 보입니다.

관련 기사
샘 알트먼: 최소한의 물을 사용하는 ChatGPT 쿼리 - 1/15 티스푼에 해당하는 양 샘 알트먼: 최소한의 물을 사용하는 ChatGPT 쿼리 - 1/15 티스푼에 해당하는 양 화요일 블로그 게시물에서 AI의 글로벌 영향력을 탐구한 OpenAI의 CEO인 샘 알트먼은 평균 쿼리당 약 0.000085갤런의 물을 사용하며 이는 티스푼의 약 1/15에 해당한다고 언급하면서 ChatGPT의 자원 소비량에 대한 놀라운 통계를 공개했습니다. 물 사용량에 대한 논의와 함께 알트먼은 각 쿼리가 약 0.34와트시를 소비하며, 이는 오븐을 잠깐 가
미국 상원, 논란 속에 예산 법안에서 AI 모라토리엄 삭제 미국 상원, 논란 속에 예산 법안에서 AI 모라토리엄 삭제 상원, 압도적인 표결로 AI 규제 유예안 폐지미국 의원들은 화요일 초당적인 단결의 드문 모습을 보여주기 위해 거의 만장일치로 이전 행정부에서 통과된 획기적인 법안에서 10년 동안 논란이 되어온 주 차원의 AI 규제 금지 조항을 폐지하는 투표를 진행했습니다. 99대 1의 결정적인 표결은 빠르게 진화하는 AI 분야에서 혁신과 소비자 보호의 균형을 맞추는 것
OpenAI 두 개의 고급 오픈 웨이트 AI 모델 공개 OpenAI 두 개의 고급 오픈 웨이트 AI 모델 공개 OpenAI는 화요일, o-시리즈와 유사한 성능을 자랑하는 두 개의 오픈 웨이트 AI 추론 모델을 공개했다. 두 모델 모두 Hugging Face에서 무료로 다운로드 가능하며, OpenAI는 이들이 오픈 모델 벤치마크에서 "최고 성능"을 달성했다고 밝혔다.모델은 두 가지 변형으로 제공된다: 단일 Nvidia GPU에서 실행 가능한 강력한 gpt-oss-12
의견 (0)
0/200
위로 돌아갑니다
OR