GPT Image 2, 전 세계 시각 모델 순위에서 Nano Banana2를 능가하다
오픈AI의 최신 텍스트-to-이미지 모델인 GPT Image2는 최근 여러 권위 있는 벤치마크에서 인상적인 성능을 보여주었습니다. SuperCLUE의 최신 데이터에 따르면, 이 모델은 이제 구글의 Nano Banana2를 제치고 전 세계 텍스트-to-이미지 모델 순위에서 1위를 차지했습니다. 보도에 따르면, 4월 21일에 출시된 이후 이 모델은 이미지 품질, 프롬프트 이해력, 세부 사항의 정확성 등에서 상당한 개선을 보였으며, 업계에 새로운 기준을 설정했습니다.
이러한 평가에서 GPT Image2는 여러 핵심 지표에서 강력한 능력을 입증했습니다. 특히 중국어 문자 생성 분야에서는 비원어 모델에게 역사적으로 어려운 과제였지만, 93.07이라는 높은 점수를 받았으며, 텍스트 정확도에서는 완벽한 평가를 받았습니다. 이 모델은 복잡한 중국어 문자를 정확하게 인식하고 생성할 수 있을 뿐만 아니라, 아크릴이나 청백자와 같은 다양한 재질의 텍스트와도 원활하게 결합하여 텍스트가 “떠오르는” 현상이나 문자 손상과 같은 기술적 문제를 효과적으로 해결할 수 있습니다.

텍스트 처리 능력의 향상 외에도, 이 모델은 상세한 시나리오를 재현할 때 복잡한 지시사항을 높은 수준으로 준수하는 것으로 나타났습니다. 전통적인 활기찬 베이커리부터 비물질 문화유산인 철꽃 예술에 이르기까지, GPT Image2는 세밀한 시각적 디테일을 정확하게 포착합니다. 또한, 긴 프롬프트나 논리적 추론이 필요한 작업에 직면했을 때도 과학적 도표나 전문 포스터와 같은 어려운 콘텐츠를 생성할 수 있으며, 텍스트와 이미지 간의 일관성이 뛰어납니다.
평가 보고서에 따르면 GPT Image2는 공간 관계 이해나 심층 지식 추론과 같은 분야에서 아직 개선의 여지가 있지만, 사실적인 이미지 생성과 창의적인 추론 능력에서는 구글이나 바이두와 같은 경쟁자들과 확연히 구별됩니다.
업계 분석가들은 GPT Image2의 출시가 오픈AI가 시각적 생성 분야에서 선도적인 위치를 유지하고 있음을 다시 한번 확인해 주는 동시에, 텍스트-to-이미지 기술이 기본적인 이미지 생성에서 고정밀도와 논리적 일관성에 초점을 맞춘 보다 정교한 단계로 발전하고 있음을 시사한다고 지적합니다. 모델 최적화가 계속됨에 따라, AI를 활용한 시각적 생성의 한계는 더욱 확장될 것으로 예상됩니다.
관련 기사
알리의 대형 모델 확대 전략: ‘Qwen’ 디지털 휴먼 공개, 핵심 생태계 통합
AI 경쟁이 애플리케이션 단계로 접어들면서, 알리바바는 자사의 AI 생태계를 통합하는 중요한 행보를 보였습니다. 4월 22일, 알리바바는 ‘Qwen 샤오지우워(Qwen Xiaojiuwo)’라는 통합 AI 디지털 페르소나를 공식 발표했습니다. 이를 통해 ‘통이 첸원(Tongyi Qianwen)’에 더욱 뚜렷한 브랜드 정체성을 부여하는 동시에 핵심 AI 기술의
알리바바 2026 회계연도 4분기 실적 보고서: AI 매출 급증, 바이리안 플랫폼 연간 반복 매출(ARR) 100억 위안 돌파
알리바바 그룹은 오늘 2026년 4분기 및 연간 실적을 발표하며, AI 기반 클라우드 사업이 폭발적인 성장세를 보이고 있음을 밝혔다. 보고서에 따르면, 매각된 사업을 제외한 4분기 매출은 전년 동기 대비 11% 증가한 2,433억 8천만 위안을 기록했으며, 특히 AI 모델 및 애플리케이션 서비스가 주요 성장 동력으로 부각되었다.알리바바 클라우드의 '바이리안
일론 머스크, 샘 알트먼 및 오픈AI를 상대로 한 소송에서 패소
엘론 머스크가 오픈AI의 공동 창립자들이 자신을 속였다고 주장한 것은 캘리포니아주의 9명의 배심원들이 그의 소송이 너무 늦게 제기되었다고 만장일치로 판결함으로써 무너졌다.머스크는 샘 올트먼, 그렉 브록먼, 오픈AI, 마이크로소프트가 이 고급 AI 연구소의 수익 창출 부서를 설립함으로써 “자선 단체의 자산을 도난했다”고 주장했다. 그러나 배심원들은 머스크가 입었을 수 있는 어떠한 손해도 그가 소송을 제기할 법적 기한 이전에 발생했다고 결정했다.
관련 특별 주제 추천
의견 (0)
0/500
오픈AI의 최신 텍스트-to-이미지 모델인 GPT Image2는 최근 여러 권위 있는 벤치마크에서 인상적인 성능을 보여주었습니다. SuperCLUE의 최신 데이터에 따르면, 이 모델은 이제 구글의 Nano Banana2를 제치고 전 세계 텍스트-to-이미지 모델 순위에서 1위를 차지했습니다. 보도에 따르면, 4월 21일에 출시된 이후 이 모델은 이미지 품질, 프롬프트 이해력, 세부 사항의 정확성 등에서 상당한 개선을 보였으며, 업계에 새로운 기준을 설정했습니다.
이러한 평가에서 GPT Image2는 여러 핵심 지표에서 강력한 능력을 입증했습니다. 특히 중국어 문자 생성 분야에서는 비원어 모델에게 역사적으로 어려운 과제였지만, 93.07이라는 높은 점수를 받았으며, 텍스트 정확도에서는 완벽한 평가를 받았습니다. 이 모델은 복잡한 중국어 문자를 정확하게 인식하고 생성할 수 있을 뿐만 아니라, 아크릴이나 청백자와 같은 다양한 재질의 텍스트와도 원활하게 결합하여 텍스트가 “떠오르는” 현상이나 문자 손상과 같은 기술적 문제를 효과적으로 해결할 수 있습니다.

텍스트 처리 능력의 향상 외에도, 이 모델은 상세한 시나리오를 재현할 때 복잡한 지시사항을 높은 수준으로 준수하는 것으로 나타났습니다. 전통적인 활기찬 베이커리부터 비물질 문화유산인 철꽃 예술에 이르기까지, GPT Image2는 세밀한 시각적 디테일을 정확하게 포착합니다. 또한, 긴 프롬프트나 논리적 추론이 필요한 작업에 직면했을 때도 과학적 도표나 전문 포스터와 같은 어려운 콘텐츠를 생성할 수 있으며, 텍스트와 이미지 간의 일관성이 뛰어납니다.
평가 보고서에 따르면 GPT Image2는 공간 관계 이해나 심층 지식 추론과 같은 분야에서 아직 개선의 여지가 있지만, 사실적인 이미지 생성과 창의적인 추론 능력에서는 구글이나 바이두와 같은 경쟁자들과 확연히 구별됩니다.
업계 분석가들은 GPT Image2의 출시가 오픈AI가 시각적 생성 분야에서 선도적인 위치를 유지하고 있음을 다시 한번 확인해 주는 동시에, 텍스트-to-이미지 기술이 기본적인 이미지 생성에서 고정밀도와 논리적 일관성에 초점을 맞춘 보다 정교한 단계로 발전하고 있음을 시사한다고 지적합니다. 모델 최적화가 계속됨에 따라, AI를 활용한 시각적 생성의 한계는 더욱 확장될 것으로 예상됩니다.
알리의 대형 모델 확대 전략: ‘Qwen’ 디지털 휴먼 공개, 핵심 생태계 통합
AI 경쟁이 애플리케이션 단계로 접어들면서, 알리바바는 자사의 AI 생태계를 통합하는 중요한 행보를 보였습니다. 4월 22일, 알리바바는 ‘Qwen 샤오지우워(Qwen Xiaojiuwo)’라는 통합 AI 디지털 페르소나를 공식 발표했습니다. 이를 통해 ‘통이 첸원(Tongyi Qianwen)’에 더욱 뚜렷한 브랜드 정체성을 부여하는 동시에 핵심 AI 기술의
알리바바 2026 회계연도 4분기 실적 보고서: AI 매출 급증, 바이리안 플랫폼 연간 반복 매출(ARR) 100억 위안 돌파
알리바바 그룹은 오늘 2026년 4분기 및 연간 실적을 발표하며, AI 기반 클라우드 사업이 폭발적인 성장세를 보이고 있음을 밝혔다. 보고서에 따르면, 매각된 사업을 제외한 4분기 매출은 전년 동기 대비 11% 증가한 2,433억 8천만 위안을 기록했으며, 특히 AI 모델 및 애플리케이션 서비스가 주요 성장 동력으로 부각되었다.알리바바 클라우드의 '바이리안
일론 머스크, 샘 알트먼 및 오픈AI를 상대로 한 소송에서 패소
엘론 머스크가 오픈AI의 공동 창립자들이 자신을 속였다고 주장한 것은 캘리포니아주의 9명의 배심원들이 그의 소송이 너무 늦게 제기되었다고 만장일치로 판결함으로써 무너졌다.머스크는 샘 올트먼, 그렉 브록먼, 오픈AI, 마이크로소프트가 이 고급 AI 연구소의 수익 창출 부서를 설립함으로써 “자선 단체의 자산을 도난했다”고 주장했다. 그러나 배심원들은 머스크가 입었을 수 있는 어떠한 손해도 그가 소송을 제기할 법적 기한 이전에 발생했다고 결정했다.





집






