JD.com의 JoyAI-Image-Edit, 사진을 3D 모델로 변환
JD.com 연구소는 자체 개발한 ‘JoyAI-Image-Edit’ 모델을 오픈소스로 공개했는데, 이는 AI 사진 편집 기술이 기존의 2D 조작에서 진보된 3D 공간 모델링으로 도약했음을 의미합니다. ‘공간 지능’에 초점을 맞춘 업계 최초의 오픈소스 모델로서, 이 모델은 AI가 물리적 환경을 진정으로 이해하고 재구성할 수 있는 능력을 부여합니다.

고급 3D 공간 모델링
이 모델은 실제 물리 법칙을 충실히 따르도록 설계되어, 카메라 인식 및 물체 변위와 같은 요소를 포괄적으로 모델링합니다. 이를 통해 개발자는 장면의 기하학적 일관성을 유지하면서 정밀한 공간 편집을 위한 추론 코드를 활용할 수 있습니다.
JoyAI-Image-Edit는 오픈소스 커뮤니티 내에서 지속되어 온 공간 이해의 과제를 해결하며, 높은 인식 정확도를 제공합니다. 주요 특징 중 하나는 자연어 명령에 따라 카메라의 요(yaw), 피치(pitch), 줌(zoom) 수준을 유연하게 조정할 수 있다는 점입니다.
다용도 애플리케이션 지원
또한, 이 모델은 지속적인 원근 이동 기능을 지원하여 논리적으로 일관된 시각적 시퀀스를 생성합니다. 특정 객체를 확대하거나 재배치할 때 전체적인 구조적 일관성을 유지함으로써 자연스러운 조명, 그림자 및 가림 효과를 보장합니다.
선도적인 공간 기능 외에도, 이 모델은 객체 추가, 제거, 스타일 전이 등 15가지 일반적인 편집 작업을 완벽하게 지원합니다. 이미 전자상거래 제작, 창의적 디자인, 체화 지능 분야에 적용되고 있으며, 다양한 산업에 필수적인 기반 기술을 제공하고 있습니다.
관련 기사
WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다
인기 웹 호스팅 및 게시 플랫폼인 WordPress.com이 이제 AI 에이전트를 도입하고 있으며, 이는 웹의 모습과 사용 경험을 재편할 수 있는 움직임입니다. 이 회사는 금요일, AI 에이전트가 고객 웹사이트에서 콘텐츠를 작성, 편집 및 게시할 뿐만 아니라 댓글을 관리하고, 메타데이터를 업데이트 및 수정하며, 태그와 카테고리를 통해 콘텐츠를 정리할 수 있
Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다
인공지능이 급속도로 발전하는 가운데, 앤트로픽(Anthropic)은 지난 금요일 ‘프로젝트 딜(Project Deal)’이라는 내부 실험을 조용히 시작하며 전자상거래 분야에서 AI의 잠재력을 선보였다. 이 실험에서는 AI 모델 ‘클로드(Claude)’가 실제 금융 거래가 이루어지는 폐쇄형 시장 환경 내에서 구매, 판매, 가격 협상을 자율적으로 수행했다.실험
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code
관련 특별 주제 추천
의견 (0)
0/500
JD.com 연구소는 자체 개발한 ‘JoyAI-Image-Edit’ 모델을 오픈소스로 공개했는데, 이는 AI 사진 편집 기술이 기존의 2D 조작에서 진보된 3D 공간 모델링으로 도약했음을 의미합니다. ‘공간 지능’에 초점을 맞춘 업계 최초의 오픈소스 모델로서, 이 모델은 AI가 물리적 환경을 진정으로 이해하고 재구성할 수 있는 능력을 부여합니다.

고급 3D 공간 모델링
이 모델은 실제 물리 법칙을 충실히 따르도록 설계되어, 카메라 인식 및 물체 변위와 같은 요소를 포괄적으로 모델링합니다. 이를 통해 개발자는 장면의 기하학적 일관성을 유지하면서 정밀한 공간 편집을 위한 추론 코드를 활용할 수 있습니다.
JoyAI-Image-Edit는 오픈소스 커뮤니티 내에서 지속되어 온 공간 이해의 과제를 해결하며, 높은 인식 정확도를 제공합니다. 주요 특징 중 하나는 자연어 명령에 따라 카메라의 요(yaw), 피치(pitch), 줌(zoom) 수준을 유연하게 조정할 수 있다는 점입니다.
다용도 애플리케이션 지원
또한, 이 모델은 지속적인 원근 이동 기능을 지원하여 논리적으로 일관된 시각적 시퀀스를 생성합니다. 특정 객체를 확대하거나 재배치할 때 전체적인 구조적 일관성을 유지함으로써 자연스러운 조명, 그림자 및 가림 효과를 보장합니다.
선도적인 공간 기능 외에도, 이 모델은 객체 추가, 제거, 스타일 전이 등 15가지 일반적인 편집 작업을 완벽하게 지원합니다. 이미 전자상거래 제작, 창의적 디자인, 체화 지능 분야에 적용되고 있으며, 다양한 산업에 필수적인 기반 기술을 제공하고 있습니다.
WordPress.com에서는 이제 AI 에이전트가 게시물을 작성하고 게시할 수 있게 되었으며, 그 외에도 다양한 기능이 추가되었습니다
인기 웹 호스팅 및 게시 플랫폼인 WordPress.com이 이제 AI 에이전트를 도입하고 있으며, 이는 웹의 모습과 사용 경험을 재편할 수 있는 움직임입니다. 이 회사는 금요일, AI 에이전트가 고객 웹사이트에서 콘텐츠를 작성, 편집 및 게시할 뿐만 아니라 댓글을 관리하고, 메타데이터를 업데이트 및 수정하며, 태그와 카테고리를 통해 콘텐츠를 정리할 수 있
Anthropic의 실험용 AI ‘클로드(Claude)’가 전자상거래 테스트에서 협상과 거래를 성공적으로 완료했다
인공지능이 급속도로 발전하는 가운데, 앤트로픽(Anthropic)은 지난 금요일 ‘프로젝트 딜(Project Deal)’이라는 내부 실험을 조용히 시작하며 전자상거래 분야에서 AI의 잠재력을 선보였다. 이 실험에서는 AI 모델 ‘클로드(Claude)’가 실제 금융 거래가 이루어지는 폐쇄형 시장 환경 내에서 구매, 판매, 가격 협상을 자율적으로 수행했다.실험
DeepSeek Code, 출시를 앞두고 있다
AI 기술이 가속화됨에 따라 DeepSeek은 흥미진진한 전환점을 맞이하고 있습니다. 이 AI 기업은 최근 700억 위안 이상의 자금을 조달했다고 밝혔습니다. 경영진은 단기적인 상업적 이익보다 획기적인 AI 연구에 전념하겠다는 의지를 강조했습니다. 이러한 전략적 전환은 DeepSeek이 새로운 제품, 특히 많은 기대를 모으고 있는 ‘DeepSeek Code





집






