옵션
뉴스
OpenAI 두 개의 고급 오픈 웨이트 AI 모델 공개

OpenAI 두 개의 고급 오픈 웨이트 AI 모델 공개

2025년 8월 28일
0

OpenAI는 화요일, o-시리즈와 유사한 성능을 자랑하는 두 개의 오픈 웨이트 AI 추론 모델을 공개했다. 두 모델 모두 Hugging Face에서 무료로 다운로드 가능하며, OpenAI는 이들이 오픈 모델 벤치마크에서 "최고 성능"을 달성했다고 밝혔다.

모델은 두 가지 변형으로 제공된다: 단일 Nvidia GPU에서 실행 가능한 강력한 gpt-oss-120b와 16GB 메모리의 표준 노트북에서 실행되도록 설계된 경량 gpt-oss-20b.

이번 출시는 GPT-2 이후 5년 만에 OpenAI의 첫 오픈 언어 모델이다.

브리핑에서 OpenAI는 오픈 모델이 복잡한 쿼리를 처리하기 위해 TechCrunch가 이전에 보도한 대로 고급 클라우드 기반 AI 시스템에 연결될 수 있다고 밝혔다. 이를 통해 개발자는 필요 시 이미지 처리와 같은 작업을 위해 OpenAI의 독점 모델에 오픈 모델을 연결할 수 있다.

OpenAI는 처음에는 오픈 소스 AI 모델을 수용했지만, 주로 독점 개발 모델로 전환하여 기업과 개발자에게 API 액세스를 제공하며 번창하는 비즈니스를 구축했다.

1월, CEO Sam Altman은 OpenAI가 오픈 소스 기술을 우선시하지 않은 것이 실수였을 수 있다고 인정했다. 현재 DeepSeek, Alibaba의 Qwen, Moonshot AI와 같은 중국 AI 연구소들이 높은 성능의 오픈 모델로 주목받으며 치열한 경쟁을 벌이고 있다. (Meta의 Llama 모델은 과거 오픈 AI 분야에서 선두였으나 지난 1년간 뒤처졌다.)

7월, 트럼프 행정부는 미국 AI 개발자들에게 미국 가치를 전 세계적으로 반영한 AI 발전을 위해 더 많은 오픈 소스 기술을 채택할 것을 촉구했다.

테크 및 VC 리더들이 Disrupt 2025 헤드라인 장식

Netflix, ElevenLabs, Wayve, Sequoia Capital 등이 Disrupt 2025 의제에 포함되어 스타트업 성공과 혁신을 위한 통찰을 공유한다. TechCrunch Disrupt 20주년 기념 행사에서 테크 업계 최고의 목소리를 배울 기회를 놓치지 마세요—지금 티켓을 확보하여 8월 7일 가격 인상 전에 최대 $675를 절약하세요.

테크 및 VC 리더들이 Disrupt 2025 헤드라인 장식

Netflix, ElevenLabs, Wayve, Sequoia Capital 등이 Disrupt 2025 의제에 포함되어 스타트업 성공과 혁신을 위한 통찰을 공유한다. TechCrunch Disrupt 20주년 기념 행사에서 테크 업계 최고의 목소리를 배울 기회를 놓치지 마세요—지금 티켓을 확보하여 8월 7일 가격 인상 전에 최대 $675를 절약하세요.

San Francisco | 2025년 10월 27-29일 지금 등록하세요

gpt-oss를 통해 OpenAI는 개발자들을 끌어들이고, 중국 AI 연구소의 오픈 소스 분야 부상을 언급한 트럼프 행정부의 촉구에 부응하고자 한다.

“2015년 설립 이후, OpenAI의 사명은 인류 전체의 이익을 위한 AGI 발전이었습니다,”라고 CEO Sam Altman이 TechCrunch에 보낸 성명에서 밝혔다. “미국 민주주의 가치에 기반한 오픈 AI 프레임워크가 자유롭게 접근 가능하고 널리 유익하게 활용되는 것을 보고 기쁩니다.”

Open AI CEO Sam Altman
(사진: Tomohiro Ohsumi/Getty Images)이미지 제공: Tomohiro Ohsumi / Getty Images

모델 성능 개요

OpenAI는 오픈 웨이트 AI 시스템 중 선두를 달리도록 오픈 모델을 설계했으며, 이 목표를 달성했다고 주장한다.

Codeforces(도구 사용) 경쟁 코딩 테스트에서 gpt-oss-120b는 2622점, gpt-oss-20b는 2516점을 기록하여 DeepSeek의 R1을 능가했지만 o3와 o4-mini에는 뒤졌다.

OpenAI의 오픈 모델 Codeforces 성능 (제공: OpenAI).

다양한 주제에 걸친 엄격한 크라우드소싱 테스트인 Humanity’s Last Exam(도구 사용)에서 gpt-oss-120b와 gpt-oss-20b는 각각 19%와 17.3%를 달성하여 DeepSeek과 Qwen의 선도 오픈 모델을 능가했지만 o3에는 미치지 못했다.

OpenAI의 오픈 모델 HLE 성능 (제공: OpenAI).

특히, OpenAI의 오픈 모델은 최신 추론 모델인 o3와 o4-mini보다 훨씬 높은 환각률을 보인다.

OpenAI의 최근 AI 추론 모델에서 환각 현상이 더 두드러졌으며, 회사는 그 원인을 아직 조사 중이라고 밝혔다. 백서에서 OpenAI는 “세계 지식이 적은 소규모 모델은 대규모 프론티어 모델보다 더 많이 환각할 것으로 예상된다”고 언급했다.

개인의 정확성을 평가하는 OpenAI 내부 벤치마크인 PersonQA에서 gpt-oss-120b와 gpt-oss-20b는 각각 49%와 53%의 응답에서 환각을 보였으며, 이는 o1 모델(16%)의 3배 이상, o4-mini(36%)보다 높다.

신규 모델 훈련

OpenAI는 오픈 모델이 독점 모델과 유사한 기술로 개발되었다고 밝혔다. 각 모델은 전문가 혼합(MoE) 접근법을 활용하여 쿼리당 더 적은 파라미터를 활성화해 효율성을 높였다. gpt-oss-120b는 총 1170억 개 파라미터 중 토큰당 51억 개만 사용한다.

오픈 모델은 Nvidia GPU 클러스터를 사용한 고연산 강화 학습(RL)으로 훈련되었으며, 이는 시뮬레이션 환경에서 AI 의사결정을 개선하는 사후 훈련 방식이다. 이는 OpenAI의 o-시리즈 훈련을 반영하며, 응답을 추론하는 데 추가 시간과 자원이 필요한 사고 연쇄 과정을 포함한다.

이 훈련은 오픈 모델이 웹 검색이나 Python 코드 실행과 같은 도구를 지원하며 AI 에이전트를 구동하는 데 탁월하도록 한다. 그러나 텍스트 전용 작업에 제한되며, OpenAI의 다른 모델과 달리 이미지나 오디오를 처리하거나 생성할 수 없다.

gpt-oss-120b와 gpt-oss-20b 모델은 Apache 2.0 라이선스 하에 배포되어 기업이 OpenAI의 수수료나 허가 없이 이를 상업화할 수 있다.

AI2와 같은 연구소의 완전 오픈 소스 모델과 달리, OpenAI는 오픈 모델의 훈련 데이터를 공개하지 않을 것이며, 이는 AI 훈련에서 저작권 자료의 부적절한 사용을 둘러싼 소송의 영향을 받은 결정으로 보인다.

OpenAI는 안전 문제로 인해 오픈 모델 출시를 여러 차례 연기했다. 표준 안전 프로토콜 외에도, 회사는 악의적인 행위자가 gpt-oss를 사이버 공격이나 생물학적, 화학적 무기 제작과 같은 유해한 목적으로 미세 조정할 수 있는지 평가했다.

OpenAI와 외부 평가자들의 테스트 결과, gpt-oss는 생물학적 능력을 약간 향상시킬 수 있지만 미세 조정 후에도 위험에 대한 회사의 “높은 역량” 기준에 도달하지 않는다고 밝혔다.

OpenAI의 모델이 오픈 모델 중 선두를 달리고 있지만, 개발자들은 DeepSeek의 R2와 Meta의 슈퍼인텔리전스 연구소의 새로운 오픈 모델 출시를 기대하고 있다.

관련 기사
ByteDance, Seed-Thinking-v1.5 AI 모델 공개로 추론 능력 강화 ByteDance, Seed-Thinking-v1.5 AI 모델 공개로 추론 능력 강화 고급 추론 AI를 위한 경쟁은 2024년 9월 OpenAI의 o1 모델로 시작되었으며, 2025년 1월 DeepSeek의 R1 출시로 더욱 가속화되었습니다.주요 AI 개발자들은 이제 체인 오브 쏘트 프로세스를 통해 정확하고 신중한 응답을 제공하는 더 빠르고 비용 효율적인 추론 AI 모델을 만들기 위해 경쟁하고 있습니다.TikTok의 모회사인 ByteDanc
Oracle의 400억 달러 Nvidia 칩 투자로 텍사스 AI 데이터센터 강화 Oracle의 400억 달러 Nvidia 칩 투자로 텍사스 AI 데이터센터 강화 Oracle은 Financial Times에 따르면 OpenAI가 개발한 텍사스 주요 신규 데이터센터를 지원하기 위해 Nvidia 칩에 약 400억 달러를 투자할 예정입니다. 이는 지금까지 가장 큰 칩 인수 거래 중 하나로, AI 컴퓨팅 자원에 대한 급증하는 수요를 보여줍니다.텍사스 애빌린에 위치한 이 시설은 미국 최초의 “Stargate” 데이터센터입니다
소프트뱅크, 일본 AI 데이터센터를 위해 6억7600만 달러 샤프 공장 인수 소프트뱅크, 일본 AI 데이터센터를 위해 6억7600만 달러 샤프 공장 인수 소프트뱅크는 독립적으로 그리고 OpenAI와의 파트너십을 통해 일본에 주요 AI 허브를 설립하려는 목표를 추진하고 있다. 이 기술 대기업은 금요일, 6억7600만 달러를 투자해 샤프의 LCD 패널 공장을 인수해 AI 데이터센터로 전환한다고 확인했다.소프트뱅크와 샤프의 거래에는 오사카의 사카이 공장의 토지와 건물이 포함되며, 1000억 엔(6억7600만 달러
의견 (0)
0/200
위로 돌아갑니다
OR