제너럴리스트, 물리 시스템을 위한 범용 AI 모델 ‘GEN-1’ 공개

Generalist는 GEN-1을 개발하기 위해 훈련 안정성을 강화하고, 맞춤형 커널을 제작하며, 실시간 추론을 위한 새로운 페이지드 어텐션(paged attention) 기법을 고안하고, 훈련 후 기법을 개선했으며, 더 부드럽고 정밀한 작동을 위한 제어 기능을 향상시켰습니다. | 출처: Generalist AI
Generalist AI Inc.는 어제 로봇 공학을 위한 범용 AI 모델인 GEN-1을 공개했습니다. 이 회사는 이 시스템이 기존 모델의 64%에 비해 평균 작업 성공률을 99%로 높였다고 밝혔습니다. 또한 Generalist에 따르면, 이 시스템은 현재 방식보다 약 3배 빠르게 작업을 완료하며, 작업당 단 1시간의 로봇 데이터만으로 이러한 결과를 달성합니다.
2024년에 설립된 이 회사는 다목적 로봇을 위한 신체 기반 파운데이션 모델을 개발한다. 캘리포니아주 샌마테오에 본사를 둔 제너럴리스트는 GEN-1이 "광범위한 응용 분야에서 상업적 타당성을 확보한다"고 주장한다. 이번 출시 소식은 로봇공학 분야에서 스케일링 법칙의 존재를 입증했다고 회사가 밝힌 GEN-0 모델 발표 이후 불과 5개월 만에 나온 것이다.
Generalist는 AI 모델의 발전에 대해 낙관적인 입장을 보였지만, GEN-1이 모든 과제를 해결할 수는 없다고 인정했다. 이 스타트업은 일부 실제 응용 분야의 경우 실질적인 유용성을 확보하기 위해서는 99%를 상회하는 성공률이 필요할 것이라고 덧붙였다.
편집자 주: 5월 27일과 28일 보스턴에서 열리는 '2026 로보틱스 서밋 & 엑스포(2026 Robotics Summit & Expo)'에서는 신체 기반 및 물리적 AI 개발에 관한 세션이 마련될 예정이다. 현재 참가 등록이 진행 중이다.
GEN-1은 GEN-0을 기반으로 확장하여 실제 데이터로 훈련됩니다
제너럴리스트 AI는 GEN-1이 GEN-0의 기반을 바탕으로 추가적인 확장 및 알고리즘 개선을 통해 기본 과제를 숙달하기 시작했다고 설명했다. 이 모델은 50만 시간에 달하는 실제 데이터로 구성된 자사 데이터셋을 바탕으로 처음부터 훈련되었다.
Generalist는 GEN-0을 통해 언어 모델에서 볼 수 있는 예측 가능한 발전과 유사하게, 로봇 학습을 일반화된 방식으로 확장할 수 있음을 입증했습니다. 회사는 모니터링한 모든 제로샷(zero-shot) 작업에서 동시적인 개선이 나타났다고 밝혔습니다. 그러나 모델의 성능이 "상업적 배포에는 충분하지 않았다"고 인정했습니다.
제너럴리스트는 GEN-1이 알고리즘적 돌파구에 힘입어 데이터와 연산 규모를 확대한 결과물이라고 밝혔다. 회사는 일부 작업이 이제 경제적으로 실현 가능한 실제 사용에 필요한 성능 기준에 도달하고 있다고 보고했다.
이 회사는 이전에 90% 이상의 성공률을 달성한 기존 일반 로봇 모델들이 방대하고 비용이 많이 들며 확장하기 어려운 원격 조작 데이터셋에 의존했다고 지적했다. 반면, GEN-0과 GEN-1의 기본 파운데이션 모델은 로봇 전용 데이터 없이 훈련되었다.
대신 이 모델은 수백만 가지 활동을 수행하는 인간이 착용한 저비용 웨어러블 기기에서 수집된 데이터를 활용한다. 제너럴리스트는 이러한 사전 훈련 방식이 대규모 원격 조작 또는 시뮬레이션 데이터셋 없이도 높은 숙달도를 이끌어낼 수 있음을 입증했다고 밝혔다.
Generalist는 다양한 기술 분야의 발전을 활용합니다
Generalist AI에 따르면, GEN-1은 계산 효율성을 높이는 사전 훈련 혁신 기술을 통합하고 있다. 사후 훈련 기법, 경험 기반 학습(강화 학습), 다중 모달 인간 안내, 그리고 새로운 추론 시간 방법의 발전 또한 주어진 모든 작업에서 더 높은 성능을 발휘하는 데 기여했다.
이러한 개선 사항 외에도, 회사는 GEN-1이 이전 모델에 비해 계산 규모가 크게 증가했다고 밝혔다. Generalist는 "이 모델은 새로운 작업을 빠르게 학습하고, 새로운 환경에 적응하며, 물리적 상식을 발휘하는 능력을 보여주었다"고 언급했다.
이 회사는 GEN-1이 데이터 효율적인 학습 모델이라고 주장한다. 특정 테스트에서 이 모델은 GEN-0과 동등한 성능을 달성하면서도 작업별 데이터는 10분의 1 수준으로 줄이고 미세 조정 단계도 더 적게 거쳤다.
Generalist는 사전 훈련 데이터셋에 로봇 데이터가 포함되어 있지 않기 때문에, GEN-1이 새로운 작업에 적응할 때 특정 로봇 구현 방식과 작업 자체를 동시에 처음 학습하게 된다고 설명했습니다.
GEN-1은 신뢰성과 즉흥적 지능을 향상시킵니다
"구현 기반 모델은 신뢰할 수 있고 빠르며, 예상치 못한 상황에서 회복할 수 있어야 합니다,"라고 Generalist는 말했다. 신뢰성과 관련하여, 이 회사는 GEN-1이 사람의 개입 없이도 장기간에 걸쳐 높은 신뢰성 수준으로 여러 작업을 수행할 수 있다고 밝혔다.
이 회사는 6가지 과제를 통해 GEN-1을 시연했다. 1시간 넘게 자동차 부품을 키팅하고, 티셔츠를 86회 연속으로 접으며, 로봇 청소기를 200회 이상 연속으로 정비하고, 블록을 1,800회 이상 연속으로 포장하고, 상자를 200회 이상 연속으로 접으며, 휴식 없이 100회 이상 휴대폰을 포장하는 작업이었다.
사전 학습 없이 처음부터 훈련된 작업들은 평균 19%의 성공률로 저조한 성능을 보였습니다. 이러한 작업에 대해 미세 조정된 GEN-0 모델은 64%의 성공률을 기록했습니다. 제너럴리스트는 GEN-1이 평균 99%의 성공률을 달성해 생산 수준에 도달했다고 밝혔습니다.
제너럴리스트는 이 모델들이 예기치 못한 시나리오에 창의적으로 대응할 수 있다고 밝혔다. 자동차 키트 조립 예시에서, 와셔가 제 위치에서 밀려나면 로봇은 이를 내려놓고 다시 집어 올릴 수 있으며, 외적 정교성을 발휘해 슬릿에 부분적으로 삽입하거나, 심지어 다른 손을 사용해 양손으로 직접 다시 집어 올릴 수도 있다.
제너럴리스트는 티셔츠와 같은 크고 변형 가능한 물체가 예상치 못한 형태로 놓이게 되더라도 모델이 복구 방법을 알아낼 수 있다고 설명했습니다. 회사는 "이러한 행동들은 훈련 데이터 분포를 훨씬 벗어난 것이며, 드물고 예상치 못한 사건으로부터 복구하는 데 직접적으로 기여한다"고 언급했습니다.
Generalist 모델, 작업 완료 속도 향상
제너럴리스트 AI는 GEN-1이 시연 과제 수행 속도가 현재의 최첨단(SOTA) 모델보다 약 3배 빠르다고 밝혔다. 이 모델은 새로운 물체의 물리적 특성에 동적으로 대응할 수 있다.
예를 들어, GEN-1은 상자를 12.1초 만에 조립할 수 있다. Generalist에 따르면 이는 기존 최첨단 기술보다 2.8배 빠른 속도이며, GEN-0과 π0 모두 동일한 상자를 조립하는 데 약 34초가 소요되었다. 또한 GEN-1은 휴대폰을 케이스에 넣는 작업을 15.5초 만에 완료할 수 있으며, 이는 GEN-0보다 2.8배 빠른 속도다.
Generalist에 따르면, 이러한 속도 향상은 여러 구성 요소 덕분에 가능했습니다. 이 모델들은 경험을 통해 학습하며, 하모닉 리저닝(Harmonic Reasoning)을 통해 추론 방식의 진화를 보여줍니다.
또한 Generalist는 자사의 데이터 수집 장치가 모델에 방대한 양의 사전 훈련 데이터를 제공했다고 평가했다. 이 데이터는 다양한 작업을 고속으로 수행하며 수집된 것으로, 일반적인 노출을 통해 얻은 지식을 관련 역학에 적용할 수 있게 해준다. Generalist는 이를 힘 피드백 부족, 지연 시간, 가시성 문제로 인해 자연스럽게 더 느리고 덜 유연한 데이터를 생성하는 기존 원격 조작 시스템과 대비시켰다.
Generalist AI는 "GEN-1을 구축하는 것은 어려운 과제였습니다. 우리는 페타바이트 규모의 물리적 상호작용 데이터를 기본적으로 지원할 수 있도록 분산 훈련 인프라를 재설계했습니다"라고 밝혔다. 이 회사는 얼리 액세스 파트너들이 이제 해당 모델에 접근할 수 있게 되었다고 발표했다.
관련 기사
MoveIt Pro 9.0, 향상된 인식 및 원격 조작 기능으로 업그레이드
PickNik에 따르면, MoveIt Pro 9.0을 통해 로봇은 변화하는 지형과 다양한 표면이 있는 환경에서도 효율적으로 작업할 수 있다. | 출처: PickNik RoboticsPickNik Inc.는 로봇 팔 애플리케이션을 구축하기 위한 자사 플랫폼의 최신 버전인 MoveIt Pro 9.0을 출시했다. 이번 업데이트에서는 향상된 지각-동작 변환 기능과
SS Innovations, 드론 배송용 수술용 로봇 개발
SSi 비마나 에어로 드론 시스템은 전장에서 부상당한 군인들에게 직접 응급 의료 지원을 제공하는 것을 목표로 합니다. | 출처: SS Innovations InternationalSS Innovations International Inc.는 최근 인도 뉴델리에서 열린 '글로벌 다학제 로봇 수술 컨퍼런스(Global Multi-Specialty Robotic
페블 타임 2 최종 디자인 공개
페블이 본연의 모습으로 돌아오면서, 올해 말 고객에게 배송될 예정인 차기작 페블 타임 2의 공식 미리보기가 공개되었습니다. (3월에 초기 디자인이 공개된 바 있으나, 당시 디자인은 아직 예비 단계였습니다.)코어 디바이스의 에릭 미기코프스키 CEO가 오늘 자신의 블로그와 유튜브 채널을 통해 디자인을 공개했습니다. 타임 2는 네 가지 색상으로 출시될 예정이지만
관련 특별 주제 추천
의견 (0)
0/500

Generalist는 GEN-1을 개발하기 위해 훈련 안정성을 강화하고, 맞춤형 커널을 제작하며, 실시간 추론을 위한 새로운 페이지드 어텐션(paged attention) 기법을 고안하고, 훈련 후 기법을 개선했으며, 더 부드럽고 정밀한 작동을 위한 제어 기능을 향상시켰습니다. | 출처: Generalist AI
Generalist AI Inc.는 어제 로봇 공학을 위한 범용 AI 모델인 GEN-1을 공개했습니다. 이 회사는 이 시스템이 기존 모델의 64%에 비해 평균 작업 성공률을 99%로 높였다고 밝혔습니다. 또한 Generalist에 따르면, 이 시스템은 현재 방식보다 약 3배 빠르게 작업을 완료하며, 작업당 단 1시간의 로봇 데이터만으로 이러한 결과를 달성합니다.
2024년에 설립된 이 회사는 다목적 로봇을 위한 신체 기반 파운데이션 모델을 개발한다. 캘리포니아주 샌마테오에 본사를 둔 제너럴리스트는 GEN-1이 "광범위한 응용 분야에서 상업적 타당성을 확보한다"고 주장한다. 이번 출시 소식은 로봇공학 분야에서 스케일링 법칙의 존재를 입증했다고 회사가 밝힌 GEN-0 모델 발표 이후 불과 5개월 만에 나온 것이다.
Generalist는 AI 모델의 발전에 대해 낙관적인 입장을 보였지만, GEN-1이 모든 과제를 해결할 수는 없다고 인정했다. 이 스타트업은 일부 실제 응용 분야의 경우 실질적인 유용성을 확보하기 위해서는 99%를 상회하는 성공률이 필요할 것이라고 덧붙였다.
편집자 주: 5월 27일과 28일 보스턴에서 열리는 '2026 로보틱스 서밋 & 엑스포(2026 Robotics Summit & Expo)'에서는 신체 기반 및 물리적 AI 개발에 관한 세션이 마련될 예정이다. 현재 참가 등록이 진행 중이다.
GEN-1은 GEN-0을 기반으로 확장하여 실제 데이터로 훈련됩니다
제너럴리스트 AI는 GEN-1이 GEN-0의 기반을 바탕으로 추가적인 확장 및 알고리즘 개선을 통해 기본 과제를 숙달하기 시작했다고 설명했다. 이 모델은 50만 시간에 달하는 실제 데이터로 구성된 자사 데이터셋을 바탕으로 처음부터 훈련되었다.
Generalist는 GEN-0을 통해 언어 모델에서 볼 수 있는 예측 가능한 발전과 유사하게, 로봇 학습을 일반화된 방식으로 확장할 수 있음을 입증했습니다. 회사는 모니터링한 모든 제로샷(zero-shot) 작업에서 동시적인 개선이 나타났다고 밝혔습니다. 그러나 모델의 성능이 "상업적 배포에는 충분하지 않았다"고 인정했습니다.
제너럴리스트는 GEN-1이 알고리즘적 돌파구에 힘입어 데이터와 연산 규모를 확대한 결과물이라고 밝혔다. 회사는 일부 작업이 이제 경제적으로 실현 가능한 실제 사용에 필요한 성능 기준에 도달하고 있다고 보고했다.
이 회사는 이전에 90% 이상의 성공률을 달성한 기존 일반 로봇 모델들이 방대하고 비용이 많이 들며 확장하기 어려운 원격 조작 데이터셋에 의존했다고 지적했다. 반면, GEN-0과 GEN-1의 기본 파운데이션 모델은 로봇 전용 데이터 없이 훈련되었다.
대신 이 모델은 수백만 가지 활동을 수행하는 인간이 착용한 저비용 웨어러블 기기에서 수집된 데이터를 활용한다. 제너럴리스트는 이러한 사전 훈련 방식이 대규모 원격 조작 또는 시뮬레이션 데이터셋 없이도 높은 숙달도를 이끌어낼 수 있음을 입증했다고 밝혔다.
Generalist는 다양한 기술 분야의 발전을 활용합니다
Generalist AI에 따르면, GEN-1은 계산 효율성을 높이는 사전 훈련 혁신 기술을 통합하고 있다. 사후 훈련 기법, 경험 기반 학습(강화 학습), 다중 모달 인간 안내, 그리고 새로운 추론 시간 방법의 발전 또한 주어진 모든 작업에서 더 높은 성능을 발휘하는 데 기여했다.
이러한 개선 사항 외에도, 회사는 GEN-1이 이전 모델에 비해 계산 규모가 크게 증가했다고 밝혔다. Generalist는 "이 모델은 새로운 작업을 빠르게 학습하고, 새로운 환경에 적응하며, 물리적 상식을 발휘하는 능력을 보여주었다"고 언급했다.
이 회사는 GEN-1이 데이터 효율적인 학습 모델이라고 주장한다. 특정 테스트에서 이 모델은 GEN-0과 동등한 성능을 달성하면서도 작업별 데이터는 10분의 1 수준으로 줄이고 미세 조정 단계도 더 적게 거쳤다.
Generalist는 사전 훈련 데이터셋에 로봇 데이터가 포함되어 있지 않기 때문에, GEN-1이 새로운 작업에 적응할 때 특정 로봇 구현 방식과 작업 자체를 동시에 처음 학습하게 된다고 설명했습니다.
GEN-1은 신뢰성과 즉흥적 지능을 향상시킵니다
"구현 기반 모델은 신뢰할 수 있고 빠르며, 예상치 못한 상황에서 회복할 수 있어야 합니다,"라고 Generalist는 말했다. 신뢰성과 관련하여, 이 회사는 GEN-1이 사람의 개입 없이도 장기간에 걸쳐 높은 신뢰성 수준으로 여러 작업을 수행할 수 있다고 밝혔다.
이 회사는 6가지 과제를 통해 GEN-1을 시연했다. 1시간 넘게 자동차 부품을 키팅하고, 티셔츠를 86회 연속으로 접으며, 로봇 청소기를 200회 이상 연속으로 정비하고, 블록을 1,800회 이상 연속으로 포장하고, 상자를 200회 이상 연속으로 접으며, 휴식 없이 100회 이상 휴대폰을 포장하는 작업이었다.
사전 학습 없이 처음부터 훈련된 작업들은 평균 19%의 성공률로 저조한 성능을 보였습니다. 이러한 작업에 대해 미세 조정된 GEN-0 모델은 64%의 성공률을 기록했습니다. 제너럴리스트는 GEN-1이 평균 99%의 성공률을 달성해 생산 수준에 도달했다고 밝혔습니다.
제너럴리스트는 이 모델들이 예기치 못한 시나리오에 창의적으로 대응할 수 있다고 밝혔다. 자동차 키트 조립 예시에서, 와셔가 제 위치에서 밀려나면 로봇은 이를 내려놓고 다시 집어 올릴 수 있으며, 외적 정교성을 발휘해 슬릿에 부분적으로 삽입하거나, 심지어 다른 손을 사용해 양손으로 직접 다시 집어 올릴 수도 있다.
제너럴리스트는 티셔츠와 같은 크고 변형 가능한 물체가 예상치 못한 형태로 놓이게 되더라도 모델이 복구 방법을 알아낼 수 있다고 설명했습니다. 회사는 "이러한 행동들은 훈련 데이터 분포를 훨씬 벗어난 것이며, 드물고 예상치 못한 사건으로부터 복구하는 데 직접적으로 기여한다"고 언급했습니다.
Generalist 모델, 작업 완료 속도 향상
제너럴리스트 AI는 GEN-1이 시연 과제 수행 속도가 현재의 최첨단(SOTA) 모델보다 약 3배 빠르다고 밝혔다. 이 모델은 새로운 물체의 물리적 특성에 동적으로 대응할 수 있다.
예를 들어, GEN-1은 상자를 12.1초 만에 조립할 수 있다. Generalist에 따르면 이는 기존 최첨단 기술보다 2.8배 빠른 속도이며, GEN-0과 π0 모두 동일한 상자를 조립하는 데 약 34초가 소요되었다. 또한 GEN-1은 휴대폰을 케이스에 넣는 작업을 15.5초 만에 완료할 수 있으며, 이는 GEN-0보다 2.8배 빠른 속도다.
Generalist에 따르면, 이러한 속도 향상은 여러 구성 요소 덕분에 가능했습니다. 이 모델들은 경험을 통해 학습하며, 하모닉 리저닝(Harmonic Reasoning)을 통해 추론 방식의 진화를 보여줍니다.
또한 Generalist는 자사의 데이터 수집 장치가 모델에 방대한 양의 사전 훈련 데이터를 제공했다고 평가했다. 이 데이터는 다양한 작업을 고속으로 수행하며 수집된 것으로, 일반적인 노출을 통해 얻은 지식을 관련 역학에 적용할 수 있게 해준다. Generalist는 이를 힘 피드백 부족, 지연 시간, 가시성 문제로 인해 자연스럽게 더 느리고 덜 유연한 데이터를 생성하는 기존 원격 조작 시스템과 대비시켰다.
Generalist AI는 "GEN-1을 구축하는 것은 어려운 과제였습니다. 우리는 페타바이트 규모의 물리적 상호작용 데이터를 기본적으로 지원할 수 있도록 분산 훈련 인프라를 재설계했습니다"라고 밝혔다. 이 회사는 얼리 액세스 파트너들이 이제 해당 모델에 접근할 수 있게 되었다고 발표했다.
SS Innovations, 드론 배송용 수술용 로봇 개발
SSi 비마나 에어로 드론 시스템은 전장에서 부상당한 군인들에게 직접 응급 의료 지원을 제공하는 것을 목표로 합니다. | 출처: SS Innovations InternationalSS Innovations International Inc.는 최근 인도 뉴델리에서 열린 '글로벌 다학제 로봇 수술 컨퍼런스(Global Multi-Specialty Robotic
페블 타임 2 최종 디자인 공개
페블이 본연의 모습으로 돌아오면서, 올해 말 고객에게 배송될 예정인 차기작 페블 타임 2의 공식 미리보기가 공개되었습니다. (3월에 초기 디자인이 공개된 바 있으나, 당시 디자인은 아직 예비 단계였습니다.)코어 디바이스의 에릭 미기코프스키 CEO가 오늘 자신의 블로그와 유튜브 채널을 통해 디자인을 공개했습니다. 타임 2는 네 가지 색상으로 출시될 예정이지만





집






