세계 최초의 이벤트 기반 체화 지능 세계 모델, 로봇의 프레임 단위 학습 시대를 마감하다
5월 29일, Variable Robot 팀은 “이벤트 수준 예측”을 기반으로 한 세계 최초의 체화 지능 세계 모델인 WALL-WM을 공개했다. 이 모델은 시간의 흐름에 따라 프레임 단위로 동작을 학습하는 기존의 신체 기반 대형 모델에서 벗어나, 세계 모델의 예측 단위를 의미론적 이벤트로 전환했습니다. 이는 로봇이 작업을 이해하고 수행하는 방식에 있어 새로운 단계를 의미합니다.

현재 신체 기반 지능 산업에서 주류인 비전-언어-행동(VLA) 모델은 일반적으로 현재 이미지와 지시를 입력받아 고정 길이의 행동 블록을 예측합니다. 이러한 프레임 단위 훈련 방식은 로봇이 사소한 신체 움직임에만 집중하게 하고 행동의 궁극적인 목표를 놓치게 하는 경우가 많습니다. 컵이나 테이블이 바뀌는 것과 같은 상황에 직면했을 때, 로봇은 일반화 능력 부족으로 인해 자주 실패한다. 이러한 업계의 고질적인 문제를 해결하기 위해 Variable 팀은 학술 논문을 통해 텍스트, 비전, 행동 정보가 현실 세계에서 자연스럽게 서로 다른 시간 척도와 다양체 기하학에 존재한다고 지적했다. 이들을 단일 공유 공간에 강제로 끼워 맞추면 사전 훈련된 기하학적 선험적 지식이 쉽게 손상될 수 있습니다.
이러한 과제를 해결하기 위해 WALL-WM 세계 모델은 혁신적인 이벤트 중심 훈련 및 실행 메커니즘을 도입합니다. 이 모델은 복잡한 작업을 '도달', '잡기', '이동'과 같이 의미론적으로 명확한 이벤트 단위로 분해합니다. 실행 시, 이 모델은 더 이상 다음 이미지 프레임을 경직되게 계산하지 않습니다. 대신, 먼저 다음 이벤트로 인해 세계가 어떻게 변화할지 시뮬레이션한 다음, 그 시각적 변화를 로봇 팔의 운동 궤적으로 정확하게 변환합니다.

이 새로운 아키텍처가 실제 환경에 안정적으로 적용될 수 있도록, Variable Robot 팀은 일련의 철저한 엔지니어링 개편을 수행했습니다. 이 시스템은 동일한 기본 가중치를 기반으로 "이벤트 모드"(가변 길이 동작 출력)와 "통합 모드"(실시간 폐쇄 루프 제어) 간 유연한 전환을 지원합니다. 또한 비디오 모델과 동작 모델 간의 단방향 결합을 구현하여, 인터넷 비디오에서 얻은 귀중한 동적 선행 정보가 동작 데이터에 의해 조기에 편향되는 것을 방지합니다. 여러 카메라에 걸친 기하학적 인식을 위해, 이 모델은 프러스텀 마스크와 튜브형 마스크를 도입하여 AI가 크로스 뷰(cross-view)의 진정한 3차원 기하학적 대응 관계를 개발하도록 유도합니다. 결정 지연 문제를 해결하기 위해, 논리적 해석 가능성을 유지하면서 디코딩 지연을 크게 줄여주는 새로운 "단계적 사고 사슬 디코딩(stepped chain-of-thought decoding)" 기법을 사용합니다.

관련 기사
머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격
오픈AI, 알트먼 해임을 어렵게 만들기 위해 정관을 몰래 변경
2023년 쿠데타와 유사한 사건 이후, 오픈AI는 정관을 개정하여 샘 알트만 CEO에 대한 보호 장치를 한층 더 강화했다. 최근 공개된 법원 문서에 따르면, 알트만 CEO의 지위는 이제 바위처럼 견고해졌으며, 외부 간섭이나 이사회 내부의 해임 시도에 대한 방어 장벽이 훨씬 더 높아졌다.일론 머스크가 오픈AI를 상대로 제기한 소송의 전문가 증인은 이러한 변경
메타 AI가 이제 페이스북 마켓플레이스에서 구매자의 메시지에 응답합니다
페이스북 마켓플레이스가 구매자 문의에 대한 자동 응답 기능을 포함한 새로운 메타 AI 기능을 도입한다고 목요일 회사 측이 발표했다. 또한 이 플랫폼은 AI를 활용해 상품 등록을 가속화하고 판매자 프로필을 요약하며, 이제 판매자가 상품 목록에 배송 옵션을 제공할 수 있도록 지원한다.판매자들은 종종 수많은 구매자 문의를 받기 때문에, 페이스북은 메타 AI 기반
관련 특별 주제 추천
의견 (0)
0/500
5월 29일, Variable Robot 팀은 “이벤트 수준 예측”을 기반으로 한 세계 최초의 체화 지능 세계 모델인 WALL-WM을 공개했다. 이 모델은 시간의 흐름에 따라 프레임 단위로 동작을 학습하는 기존의 신체 기반 대형 모델에서 벗어나, 세계 모델의 예측 단위를 의미론적 이벤트로 전환했습니다. 이는 로봇이 작업을 이해하고 수행하는 방식에 있어 새로운 단계를 의미합니다.

현재 신체 기반 지능 산업에서 주류인 비전-언어-행동(VLA) 모델은 일반적으로 현재 이미지와 지시를 입력받아 고정 길이의 행동 블록을 예측합니다. 이러한 프레임 단위 훈련 방식은 로봇이 사소한 신체 움직임에만 집중하게 하고 행동의 궁극적인 목표를 놓치게 하는 경우가 많습니다. 컵이나 테이블이 바뀌는 것과 같은 상황에 직면했을 때, 로봇은 일반화 능력 부족으로 인해 자주 실패한다. 이러한 업계의 고질적인 문제를 해결하기 위해 Variable 팀은 학술 논문을 통해 텍스트, 비전, 행동 정보가 현실 세계에서 자연스럽게 서로 다른 시간 척도와 다양체 기하학에 존재한다고 지적했다. 이들을 단일 공유 공간에 강제로 끼워 맞추면 사전 훈련된 기하학적 선험적 지식이 쉽게 손상될 수 있습니다.
이러한 과제를 해결하기 위해 WALL-WM 세계 모델은 혁신적인 이벤트 중심 훈련 및 실행 메커니즘을 도입합니다. 이 모델은 복잡한 작업을 '도달', '잡기', '이동'과 같이 의미론적으로 명확한 이벤트 단위로 분해합니다. 실행 시, 이 모델은 더 이상 다음 이미지 프레임을 경직되게 계산하지 않습니다. 대신, 먼저 다음 이벤트로 인해 세계가 어떻게 변화할지 시뮬레이션한 다음, 그 시각적 변화를 로봇 팔의 운동 궤적으로 정확하게 변환합니다.

이 새로운 아키텍처가 실제 환경에 안정적으로 적용될 수 있도록, Variable Robot 팀은 일련의 철저한 엔지니어링 개편을 수행했습니다. 이 시스템은 동일한 기본 가중치를 기반으로 "이벤트 모드"(가변 길이 동작 출력)와 "통합 모드"(실시간 폐쇄 루프 제어) 간 유연한 전환을 지원합니다. 또한 비디오 모델과 동작 모델 간의 단방향 결합을 구현하여, 인터넷 비디오에서 얻은 귀중한 동적 선행 정보가 동작 데이터에 의해 조기에 편향되는 것을 방지합니다. 여러 카메라에 걸친 기하학적 인식을 위해, 이 모델은 프러스텀 마스크와 튜브형 마스크를 도입하여 AI가 크로스 뷰(cross-view)의 진정한 3차원 기하학적 대응 관계를 개발하도록 유도합니다. 결정 지연 문제를 해결하기 위해, 논리적 해석 가능성을 유지하면서 디코딩 지연을 크게 줄여주는 새로운 "단계적 사고 사슬 디코딩(stepped chain-of-thought decoding)" 기법을 사용합니다.

머스크의 ‘그록(Grok)’: 1조 5천억 개의 파라미터와 커서 코드 통합—게임 체인저인가, 허세인가?
일론 머스크가 드디어 움직이기 시작했다.AI 프로그래밍 경쟁에서 OpenAI와 Anthropic은 속도를 내고 있는 반면, xAI는 뒤처지는 듯하다. 머스크는 클로드(Claude)에 대항하겠다는 목표를 수차례 밝혔으나, Grok4.X 시리즈에 대한 여러 차례의 업데이트에도 불구하고 결과는 이론상으로는 좋아 보이지만 실제 적용에서는 기대에 미치지 못하며, 격
오픈AI, 알트먼 해임을 어렵게 만들기 위해 정관을 몰래 변경
2023년 쿠데타와 유사한 사건 이후, 오픈AI는 정관을 개정하여 샘 알트만 CEO에 대한 보호 장치를 한층 더 강화했다. 최근 공개된 법원 문서에 따르면, 알트만 CEO의 지위는 이제 바위처럼 견고해졌으며, 외부 간섭이나 이사회 내부의 해임 시도에 대한 방어 장벽이 훨씬 더 높아졌다.일론 머스크가 오픈AI를 상대로 제기한 소송의 전문가 증인은 이러한 변경
메타 AI가 이제 페이스북 마켓플레이스에서 구매자의 메시지에 응답합니다
페이스북 마켓플레이스가 구매자 문의에 대한 자동 응답 기능을 포함한 새로운 메타 AI 기능을 도입한다고 목요일 회사 측이 발표했다. 또한 이 플랫폼은 AI를 활용해 상품 등록을 가속화하고 판매자 프로필을 요약하며, 이제 판매자가 상품 목록에 배송 옵션을 제공할 수 있도록 지원한다.판매자들은 종종 수많은 구매자 문의를 받기 때문에, 페이스북은 메타 AI 기반





집






