4개월간의 리디자인 끝에 GPT Image2의 13인 핵심 팀 공개
최근 GPT Image2가 놀라울 정도로 사실적인 이미지 생성 능력으로 소셜 미디어를 강타했습니다. 프로젝트의 인기가 치솟으면서, 이를 개발한 소규모의 무명 팀이 주목을 받게 되었습니다. 정보에 따르면 핵심 팀은 단 13명으로 구성되어 있으며, 이들은 불과 4개월 만에 기반 아키텍처를 완전히 재구축해 냈습니다. 연구 책임자인 첸 보위안(Chen Boyuan)은 구체적인 기술적 세부 사항을 공개하지는 않았지만, 이 새로운 모델을 "시각 영역을 위한 GPT"라고 묘사하며 범용 기능 면에서 큰 도약을 예고했습니다.
팀의 핵심 인물인 천보위안은 놀라운 개인적 이력을 가지고 있다. 박사 과정 중 그는 "Diffusion Forcing"과 같은 혁신적인 접근법을 개척했으며, 이후 구글의 제미니 2.0에 채택된 지시어 튜닝 기술 개발에도 기여했다. 흥미롭게도 그는 처음 고등학교 과학 캠프에 참가했을 때 파이썬을 전혀 알지 못했다. 오픈AI로 이직한 후, 그는 GPT 이미지 모델의 모든 훈련을 주도했을 뿐만 아니라 소라(Sora) 영상 생성 팀의 핵심 멤버로도 활동했다. 한 시연에서 그는 중국어, 한국어, 벵골어로 완벽하게 렌더링된 텍스트가 포함된 포스터를 생성함으로써 모델의 뛰어난 언어 이해 능력을 강조했다.

텍스트 렌더링을 넘어, GPT Image2는 세계 지식 이해와 복잡한 지시사항 수행 측면에서 새로운 차원을 달성했다. 중국과학기술대학의 왕젠펑(Jianfeng Wang) 박사가 이끄는 이 모듈은 기존 모델들이 항상 시계를 10시 10분으로 그리는 것과 같은 AI 이미지 생성의 고질적인 문제를 해결한다. 새로운 모델은 지정된 시간과 복잡한 공간 배치를 정확하게 해석한다. 왕 박사는 이 모델이 사용자의 창의적 비전과 최종 생성 결과물 간의 격차를 효과적으로 좁히고 있다고 언급했다.
생산성 측면에서는 저장대학교 주위안 칼리지의 양유광(Yuguang Yang)이 긴 연구 논문을 고해상도 파워포인트 프레젠테이션과 인포그래픽으로 즉시 변환하는 이 도구의 능력을 선보였습니다. 이러한 기능은 팀이 다중 모달 이해, 전문가 혼합(Mixture of Experts, MoE) 아키텍처, 장문 컨텍스트 가이드 기술을 심도 있게 통합한 결과입니다.
초기 DALL-E에서 오늘날의 GPT Image2 까지
관련 기사
중국 공과대학교(MIIT)가 AI 모델 컨텍스트 프로토콜을 포함한 121개 산업 표준에 대한 대중의 의견을 구하고 있습니다.
중국 산업정보기술부는 “인공지능 보안 거버넌스 모델 컨텍스트 프로토콜의 애플리케이션 보안 요구사항”을 포함한 121개 산업 표준화 프로젝트에 대한 대중의 의견을 구하는 공지를 공식적으로 발표했습니다. 이번 발표는 중국이 인공지능 분야에서 기초 표준과 안전 감독 체계를 수립하기 위한 노력에서 중요한 이정표입니다. 대중 의견 수렴 기간은 모델 컨텍스트 프로토콜의 애플리케이션 보안에 초점을 맞추고 있으며, 표준화된 기술 사양을 통해 다모달 상호작용,
오픈AI, 미국 국방부와 협력… 챗GPT 제거 건수 295% 급증
대중의 분노: OpenAI의 군사 협력이 ‘제거 열풍’을 불러일으키다최근, AI 선두주자인 OpenAI는 미국 국방부와의 긴밀한 협력을 발표하며 자사의 AI 모델을 최고 기밀 군사 네트워크에 통합했습니다. 이 소식은 미국 전역에서 사용자들의 거센 반발을 불러일으켰으며, ‘ChatGPT 보이콧’ 운동이 확산되기 시작했습니다.시장 분석 기관 Sensor Tower에 따르면, 2026년 2월 28일 OpenAI가 이 협력을 공식적으로 발표한 날,
오픈AI, ‘사이트’ 기능 출시… 텍스트 기반 웹사이트로 ‘노코드’ 시대의 종막을 알리다
OpenAI는 자사의 소프트웨어 엔지니어링용 AI인 Codex를 위한 새로운 기능인 ‘Sites’를 선보였습니다. 현재 프리뷰 단계에 있는 이 기능은 유료 Business 및 Enterprise 구독자만 이용할 수 있으며, 웹 및 애플리케이션 개발의 기존 장벽을 없애는 것을 목표로 합니다.본질적으로 'Sites'는 추상적인 아이디어를 실제 작동하는 도구로
관련 특별 주제 추천
의견 (0)
0/500
최근
팀의 핵심 인물인

텍스트 렌더링을 넘어,
생산성 측면에서는 저장대학교 주위안 칼리지의 양유광(Yuguang Yang)이 긴 연구 논문을 고해상도 파워포인트 프레젠테이션과 인포그래픽으로 즉시 변환하는 이 도구의 능력을 선보였습니다. 이러한 기능은 팀이 다중 모달 이해, 전문가 혼합(Mixture of Experts, MoE) 아키텍처, 장문 컨텍스트 가이드 기술을 심도 있게 통합한 결과입니다.
초기 DALL-E에서 오늘날의
중국 공과대학교(MIIT)가 AI 모델 컨텍스트 프로토콜을 포함한 121개 산업 표준에 대한 대중의 의견을 구하고 있습니다.
중국 산업정보기술부는 “인공지능 보안 거버넌스 모델 컨텍스트 프로토콜의 애플리케이션 보안 요구사항”을 포함한 121개 산업 표준화 프로젝트에 대한 대중의 의견을 구하는 공지를 공식적으로 발표했습니다. 이번 발표는 중국이 인공지능 분야에서 기초 표준과 안전 감독 체계를 수립하기 위한 노력에서 중요한 이정표입니다. 대중 의견 수렴 기간은 모델 컨텍스트 프로토콜의 애플리케이션 보안에 초점을 맞추고 있으며, 표준화된 기술 사양을 통해 다모달 상호작용,
오픈AI, 미국 국방부와 협력… 챗GPT 제거 건수 295% 급증
대중의 분노: OpenAI의 군사 협력이 ‘제거 열풍’을 불러일으키다최근, AI 선두주자인 OpenAI는 미국 국방부와의 긴밀한 협력을 발표하며 자사의 AI 모델을 최고 기밀 군사 네트워크에 통합했습니다. 이 소식은 미국 전역에서 사용자들의 거센 반발을 불러일으켰으며, ‘ChatGPT 보이콧’ 운동이 확산되기 시작했습니다.시장 분석 기관 Sensor Tower에 따르면, 2026년 2월 28일 OpenAI가 이 협력을 공식적으로 발표한 날,
오픈AI, ‘사이트’ 기능 출시… 텍스트 기반 웹사이트로 ‘노코드’ 시대의 종막을 알리다
OpenAI는 자사의 소프트웨어 엔지니어링용 AI인 Codex를 위한 새로운 기능인 ‘Sites’를 선보였습니다. 현재 프리뷰 단계에 있는 이 기능은 유료 Business 및 Enterprise 구독자만 이용할 수 있으며, 웹 및 애플리케이션 개발의 기존 장벽을 없애는 것을 목표로 합니다.본질적으로 'Sites'는 추상적인 아이디어를 실제 작동하는 도구로





집






