애플, 조명 정확도를 37% 향상시켜 단일 이미지를 3D로 변환하는 LiTo 모델 공개
애플의 AI 연구팀은 최근 LiTo (Surface Light Field Tokenization)라는 획기적인 3D 생성 모델을 선보였습니다. 이 기술은 단 하나의 2D 이미지만으로도 사실적인 조명을 갖춘 완벽하고 고해상도의 3D 물체를 생성함으로써, 3D 재구성의 핵심 과제를 해결합니다.

LiTo의 혁신은 새로운 잠재 공간과 통합된 3D 표현 프레임워크에 중점을 두고 있습니다:
효율적인 인코딩: 복잡한 표면 광장 데이터를 간결한 벡터 집합으로 압축하여, 물체의 기하학적 구조와 빛과의 상호작용을 수학적으로 포착합니다.
양방향 아키텍처: 인코더-디코더 구조를 사용하여, 인코더는 기초적인 기하학적 및 외관 특징을 추출합니다. 이후 디코더는 이 데이터를 재구성하여, 스페큘러 하이라이트나 프레넬 반사 같은 고급 시각 효과를 정확하게 렌더링합니다.
성능: 모든 시점에서 탁월한 조명 일관성
LiTo는 수천 개의 물체를 포함한 포괄적인 3D 데이터셋으로 훈련되었습니다. 주요 실험 결과는 다음과 같습니다:
방향성 편향 제거: LiTo는 카메라 좌표계를 엄격히 준수하여 다른 모델에서 흔히 발생하는 방향 오류를 보정합니다.
최첨단 성능 지표: 다중 뷰 조명 일관성 측면에서 LiTo는 기존 선도 모델인 TRELLIS보다 약 37% 더 우수한 성능을 보입니다 .
이러한 발전은 고품질 3D 콘텐츠 제작의 진입 장벽을 크게 낮춥니다. 이는 Vision Pro와 같은 기기를 포함한 미래의 증강 현실(AR) 및 공간 컴퓨팅 플랫폼을 위해 우수한 자산 생성을 제공할 준비가 되어 있습니다.
관련 기사
알리바바 투하오 M890, 3배의 성능으로 출시되어 칩-클라우드-모델-추론을 위한 풀스택 에이전트 시대를 열다
2026년 5월 20일, 알리바바 클라우드 서밋에서 알리바바 클라우드는 에이전트 시대를 위해 설계된 풀스택 기술 시스템 업그레이드가 완료되었다고 발표했습니다. 이 변화는 기본 칩과 클라우드 플랫폼부터 모델 및 추론 솔루션에 이르기까지 전체 시스템을 재구성했습니다. 이를 통해 알리바바 클라우드는 거대한 에이전트들이 24시간 연중무휴로 작동할 수 있도록 지원하는 AI 공장으로 자리매김하게 되었으며, 이는 더 이상 인간 사용자에게 직접 서비스를 제공
펜티엄 4 리바이벌: 20년 된 CPU로 메타 라마 3 대형 모델을 실행하다
최근 유튜브의 기술 채널 Fully Buffered에서 인상적이고 대담한 실험을 진행했습니다. 2006년에 출시된 펜티엄 4 641 프로세서에서 메타의 최신 대형 모델인 Llama 3.2 3B를 성공적으로 실행한 것입니다.이 실험은 현대 인공지능을 20년 전의 하드웨어와 맞닿게 했으며, LLM의 기본적인 호환성 한계를 드러내는 동시에 많은 시청자들로 하여금 AI 시대에 무어의 법칙이 어떻게 이런 특이한 방식으로 세대 간의 교류를 이루었는지 생
항저우 상성구, 절강성 최초의 AIGC 시청각 ‘황금 십조치’ 도입 및 50억 원 규모 산업 펀드 조성 발표
16일, AIGC 오디오-비주얼 산업 혁신 생태계 컨퍼런스가 항저우 상성구에서 열렸습니다. 이 행사에서 해당 지방은 AIGC 오디오-비주얼 산업을 위한 첫 번째 전용 정책인 “골든 텐”을 발표했습니다. 이 정책은 기술 혁신, 비용 절감, 콘텐츠 품질 향상, 인재 양성, 글로벌 확장 등 산업 성장의 모든 측면을 다루고 있습니다.이 정책에는 강력한 인센티브가 포함되어 있습니다. 기술 혁신 분야에서는 AIGC 도구, AI 가상 촬영, AI 대화형
관련 특별 주제 추천
의견 (1)
0/500
애플의 AI 연구팀은 최근 LiTo (Surface Light Field Tokenization)라는 획기적인 3D 생성 모델을 선보였습니다. 이 기술은 단 하나의 2D 이미지만으로도 사실적인 조명을 갖춘 완벽하고 고해상도의 3D 물체를 생성함으로써, 3D 재구성의 핵심 과제를 해결합니다.

LiTo의 혁신은 새로운 잠재 공간과 통합된 3D 표현 프레임워크에 중점을 두고 있습니다:
효율적인 인코딩: 복잡한 표면 광장 데이터를 간결한 벡터 집합으로 압축하여, 물체의 기하학적 구조와 빛과의 상호작용을 수학적으로 포착합니다.
양방향 아키텍처: 인코더-디코더 구조를 사용하여, 인코더는 기초적인 기하학적 및 외관 특징을 추출합니다. 이후 디코더는 이 데이터를 재구성하여, 스페큘러 하이라이트나 프레넬 반사 같은 고급 시각 효과를 정확하게 렌더링합니다.
성능: 모든 시점에서 탁월한 조명 일관성
LiTo는 수천 개의 물체를 포함한 포괄적인 3D 데이터셋으로 훈련되었습니다. 주요 실험 결과는 다음과 같습니다:
방향성 편향 제거: LiTo는 카메라 좌표계를 엄격히 준수하여 다른 모델에서 흔히 발생하는 방향 오류를 보정합니다.
최첨단 성능 지표: 다중 뷰 조명 일관성 측면에서 LiTo는 기존 선도 모델인 TRELLIS보다 약 37% 더 우수한 성능을 보입니다 .
이러한 발전은 고품질 3D 콘텐츠 제작의 진입 장벽을 크게 낮춥니다. 이는 Vision Pro와 같은 기기를 포함한 미래의 증강 현실(AR) 및 공간 컴퓨팅 플랫폼을 위해 우수한 자산 생성을 제공할 준비가 되어 있습니다.
알리바바 투하오 M890, 3배의 성능으로 출시되어 칩-클라우드-모델-추론을 위한 풀스택 에이전트 시대를 열다
2026년 5월 20일, 알리바바 클라우드 서밋에서 알리바바 클라우드는 에이전트 시대를 위해 설계된 풀스택 기술 시스템 업그레이드가 완료되었다고 발표했습니다. 이 변화는 기본 칩과 클라우드 플랫폼부터 모델 및 추론 솔루션에 이르기까지 전체 시스템을 재구성했습니다. 이를 통해 알리바바 클라우드는 거대한 에이전트들이 24시간 연중무휴로 작동할 수 있도록 지원하는 AI 공장으로 자리매김하게 되었으며, 이는 더 이상 인간 사용자에게 직접 서비스를 제공
펜티엄 4 리바이벌: 20년 된 CPU로 메타 라마 3 대형 모델을 실행하다
최근 유튜브의 기술 채널 Fully Buffered에서 인상적이고 대담한 실험을 진행했습니다. 2006년에 출시된 펜티엄 4 641 프로세서에서 메타의 최신 대형 모델인 Llama 3.2 3B를 성공적으로 실행한 것입니다.이 실험은 현대 인공지능을 20년 전의 하드웨어와 맞닿게 했으며, LLM의 기본적인 호환성 한계를 드러내는 동시에 많은 시청자들로 하여금 AI 시대에 무어의 법칙이 어떻게 이런 특이한 방식으로 세대 간의 교류를 이루었는지 생
항저우 상성구, 절강성 최초의 AIGC 시청각 ‘황금 십조치’ 도입 및 50억 원 규모 산업 펀드 조성 발표
16일, AIGC 오디오-비주얼 산업 혁신 생태계 컨퍼런스가 항저우 상성구에서 열렸습니다. 이 행사에서 해당 지방은 AIGC 오디오-비주얼 산업을 위한 첫 번째 전용 정책인 “골든 텐”을 발표했습니다. 이 정책은 기술 혁신, 비용 절감, 콘텐츠 품질 향상, 인재 양성, 글로벌 확장 등 산업 성장의 모든 측면을 다루고 있습니다.이 정책에는 강력한 인센티브가 포함되어 있습니다. 기술 혁신 분야에서는 AIGC 도구, AI 가상 촬영, AI 대화형





집






