멀티버스 컴퓨팅, 압축 AI 모델의 대중화를 주도하다
비상장 기업의 부도율이 9.2%에 달하며 수년 만에 최고치를 기록함에 따라, 벤처 캐피털 회사 럭스 캐피털(Lux Capital)은 최근 AI에 의존하는 기업들에게 컴퓨팅 용량에 대한 서면 약정을 확보할 것을 권고했다. AI 공급망 전반에 걸쳐 재정적 불안정이 확산됨에 따라, 럭스 캐피털은 구두 약속만으로는 더 이상 충분하지 않다고 경고했다.
하지만 완전히 다른 선택지가 있습니다. 바로 외부 컴퓨팅 인프라에 대한 의존을 아예 버리는 것입니다. 데이터 센터나 클라우드 제공업체가 필요 없고 거래 상대방 리스크도 없는, 사용자의 기기에서 직접 실행되는 소형 AI 모델들이 이제 진지하게 고려할 만한 수준에 이르렀습니다. 그리고 멀티버스 컴퓨팅(Multiverse Computing)이 그 선두에 나서고 있습니다.
이 스페인 스타트업은 일부 경쟁사에 비해 비교적 낮은 프로필을 유지해 왔으나, AI 효율성에 대한 수요가 급증함에 따라 상황이 바뀌고 있다. OpenAI, 메타(Meta), 딥시크(DeepSeek), 미스트랄 AI(Mistral AI) 등 주요 AI 연구소의 모델을 압축한 후, 압축된 모델의 성능을 보여주는 앱과 개발자가 해당 모델에 접근하고 이를 기반으로 구축할 수 있는 관문인 API 포털, 이 두 가지 제품을 출시하여 모델의 접근성을 대폭 높였다.
멀티버스의 양자 영감 압축 기술에서 이름을 따온 '컴팩티파이(CompactifAI)' 앱은 ChatGPT나 미스트랄의 '르 챗(Le Chat)'과 유사한 AI 채팅 도구다. 사용자가 질문을 하면 모델이 응답한다. 차이점은 멀티버스가 '길다(Gilda)'를 내장했다는 점인데, 회사에 따르면 이 모델은 매우 작아서 로컬 및 오프라인 환경에서도 실행될 수 있다.

최종 사용자에게 이는 데이터가 기기를 벗어나지 않고 인터넷 연결도 필요 없는 엣지 AI를 경험할 수 있는 기회를 제공합니다. 하지만 한 가지 조건이 있습니다. 모바일 기기에 충분한 RAM과 저장 공간이 있어야 한다는 점입니다. 만약 그렇지 않다면(많은 구형 아이폰의 경우 그렇습니다), 앱은 API를 통해 클라우드 기반 모델로 전환됩니다. 로컬과 클라우드 처리 간의 라우팅은 멀티버스가 '애쉬 나즈그(Ash Nazg)'라고 부르는 시스템에 의해 자동으로 처리됩니다. 이 이름은 톨킨 팬이라면 『반지의 제왕』에 등장하는 '하나의 반지'에 새겨진 문구를 연상시킬 것입니다. 하지만 앱이 클라우드로 라우팅되면, 가장 큰 장점인 개인정보 보호 기능은 상실됩니다.
이러한 한계는 CompactifAI가 아직 대중적인 소비자 채택을 위한 준비가 되어 있지 않음을 시사하지만, 애초에 그런 의도가 아니었을 수도 있습니다. 센서 타워(Sensor Tower)에 따르면, 이 앱은 지난 한 달 동안 5,000건 미만의 다운로드 수를 기록했습니다.
진정한 초점은 기업 시장입니다. 오늘, 멀티버스는 개발자와 기업이 AWS 마켓플레이스를 거치지 않고도 압축된 모델에 직접 접근할 수 있도록 하는 셀프 서비스 API 포털을 출시합니다.
엔리케 리자소(Enrique Lizaso) CEO는 성명을 통해 “CompactifAI API 포털은 개발자들에게 압축된 모델에 대한 직접적인 접근 권한을 제공하며, 이를 실제 운영 환경에서 실행하는 데 필요한 투명성과 제어 기능을 갖추고 있다”고 밝혔다.
실시간 사용량 모니터링은 이 API의 핵심 기능이며, 이는 결코 우연이 아닙니다. 엣지 배포의 잠재적 이점과 더불어, 컴퓨팅 비용 절감은 기업들이 대규모 언어 모델(LLM)의 대안으로 소형 모델을 모색하는 주요 이유입니다.
또한 소형 모델이 과거보다 훨씬 덜 제약받는 점도 도움이 됩니다. 이번 주 초, 미스트랄(Mistral)은 일반 채팅, 코딩, 에이전트 작업 및 추론에 최적화되었다고 밝힌 '미스트랄 스몰 4(Mistral Small 4)'를 출시하며 소형 모델 라인업을 업데이트했습니다. 이 프랑스 기업은 또한 기업이 사용 사례에 가장 적합한 절충점을 선택할 수 있는 소형 모델을 포함한 맞춤형 모델을 구축할 수 있게 해주는 시스템인 '포지(Forge)'를 출시했습니다.
멀티버스(Multiverse)의 최근 성과 역시 대형 언어 모델(LLM)과의 격차가 좁혀지고 있음을 시사한다. 멀티버스의 최신 압축 모델인 '하이퍼노바 60B 2602(HyperNova 60B 2602)'는 공개된 소스 코드를 기반으로 하는 오픈AI 모델인 'gpt-oss-120b'를 기반으로 구축되었다. 이 회사는 원본 모델보다 더 낮은 비용으로 더 빠른 응답을 제공한다고 주장하는데, 이는 AI가 복잡하고 다단계인 프로그래밍 작업을 자율적으로 처리하는 에이전트 기반 코딩 워크플로우에서 특히 중요한 장점이다.
모바일 기기에서 실행할 수 있을 만큼 모델을 작게 만들면서도 유용성을 유지하는 것은 큰 과제입니다. Apple Intelligence는 온디바이스 모델과 클라우드 모델을 결합하여 이 문제를 우회했습니다. Multiverse의 CompactifAI 앱도 API를 통해 gpt-oss-120b로 요청을 전달할 수 있지만, 이 앱의 주된 목표는 Gilda 및 향후 후속 모델과 같은 로컬 모델이 비용 절감 이상의 이점을 제공한다는 점을 입증하는 것입니다.
중요 분야 종사자들에게 클라우드 연결 없이 로컬에서 실행되는 모델은 더 높은 수준의 개인정보 보호와 복원력을 제공합니다. 하지만 더 큰 가치는 이를 통해 가능해지는 비즈니스 활용 사례에 있습니다. 예를 들어, 안정적인 연결을 보장할 수 없는 드론, 위성 및 기타 환경에 AI를 내장하는 것이죠.
이 회사는 이미 캐나다 중앙은행, 보쉬, 이베르드롤라를 포함한 전 세계 100여 개 고객사에 서비스를 제공하고 있지만, 고객 기반을 확대하면 추가 자금 조달에 도움이 될 수 있습니다. 지난해 2억 1,500만 달러 규모의 시리즈 B 투자를 유치한 데 이어, 현재 기업 가치 15억 유로를 상회하는 조건으로 5억 유로 규모의 신규 자금 조달을 진행 중인 것으로 알려졌습니다.
관련 기사
코히어, 오픈소스 다국어 AI 모델 제품군 공개
기업용 AI 기업 코히어(Cohere)는 현재 진행 중인 인도 AI 서밋(India AI Summit)에서 ‘Tiny Aya’라는 이름의 새로운 다국어 모델 제품군을 공개했다. 이 오픈 웨이트 모델(핵심 코드를 누구나 공개적으로 이용하고 수정할 수 있음)은 70개 이상의 언어를 지원하며, 인터넷 연결 없이도 노트북과 같은 일상적인 기기에서 작동할 수 있다.
멀티버스 컴퓨팅, 무료 압축 생성형 AI 모델 출시
대규모 언어 모델은 상당한 과제에 직면해 있습니다: 바로 그 방대한 규모입니다. 스페인 스타트업 멀티버스 컴퓨팅(Multiverse Computing)은 최첨단 AI의 성능과 기업이 실질적으로 도입할 수 있는 수준 사이의 격차를 해소하기 위해 설계된 압축 모델을 개발함으로써 이 문제를 해결하고 있습니다.핵심 혁신은 양자 컴퓨팅 원리에서 영감을 받은 압축 기
구글, NotebookLM과 개인 지식 기반을 통합한 ‘제미니 노트북(Gemini Notebooks)’ 공개
구글은 최근 사용자가 맞춤형 지식 기반을 구축하여 복잡한 프로젝트를 관리할 수 있도록 돕기 위해 제미니(Gemini)용 ‘노트북(Notebooks)’ 기능을 출시했습니다. 이번 업데이트는 제미니와 AI 연구 보조 도구인 NotebookLM 간의 데이터 격차를 해소하며, 구글이 폐쇄형 AI 워크플로우를 구축하기 위한 노력의 중요한 단계가 되었습니다.노트북은
관련 특별 주제 추천
의견 (0)
0/500
비상장 기업의 부도율이 9.2%에 달하며 수년 만에 최고치를 기록함에 따라, 벤처 캐피털 회사 럭스 캐피털(Lux Capital)은 최근 AI에 의존하는 기업들에게 컴퓨팅 용량에 대한 서면 약정을 확보할 것을 권고했다. AI 공급망 전반에 걸쳐 재정적 불안정이 확산됨에 따라, 럭스 캐피털은 구두 약속만으로는 더 이상 충분하지 않다고 경고했다.
하지만 완전히 다른 선택지가 있습니다. 바로 외부 컴퓨팅 인프라에 대한 의존을 아예 버리는 것입니다. 데이터 센터나 클라우드 제공업체가 필요 없고 거래 상대방 리스크도 없는, 사용자의 기기에서 직접 실행되는 소형 AI 모델들이 이제 진지하게 고려할 만한 수준에 이르렀습니다. 그리고 멀티버스 컴퓨팅(Multiverse Computing)이 그 선두에 나서고 있습니다.
이 스페인 스타트업은 일부 경쟁사에 비해 비교적 낮은 프로필을 유지해 왔으나, AI 효율성에 대한 수요가 급증함에 따라 상황이 바뀌고 있다. OpenAI, 메타(Meta), 딥시크(DeepSeek), 미스트랄 AI(Mistral AI) 등 주요 AI 연구소의 모델을 압축한 후, 압축된 모델의 성능을 보여주는 앱과 개발자가 해당 모델에 접근하고 이를 기반으로 구축할 수 있는 관문인 API 포털, 이 두 가지 제품을 출시하여 모델의 접근성을 대폭 높였다.
멀티버스의 양자 영감 압축 기술에서 이름을 따온 '컴팩티파이(CompactifAI)' 앱은 ChatGPT나 미스트랄의 '르 챗(Le Chat)'과 유사한 AI 채팅 도구다. 사용자가 질문을 하면 모델이 응답한다. 차이점은 멀티버스가 '길다(Gilda)'를 내장했다는 점인데, 회사에 따르면 이 모델은 매우 작아서 로컬 및 오프라인 환경에서도 실행될 수 있다.

최종 사용자에게 이는 데이터가 기기를 벗어나지 않고 인터넷 연결도 필요 없는 엣지 AI를 경험할 수 있는 기회를 제공합니다. 하지만 한 가지 조건이 있습니다. 모바일 기기에 충분한 RAM과 저장 공간이 있어야 한다는 점입니다. 만약 그렇지 않다면(많은 구형 아이폰의 경우 그렇습니다), 앱은 API를 통해 클라우드 기반 모델로 전환됩니다. 로컬과 클라우드 처리 간의 라우팅은 멀티버스가 '애쉬 나즈그(Ash Nazg)'라고 부르는 시스템에 의해 자동으로 처리됩니다. 이 이름은 톨킨 팬이라면 『반지의 제왕』에 등장하는 '하나의 반지'에 새겨진 문구를 연상시킬 것입니다. 하지만 앱이 클라우드로 라우팅되면, 가장 큰 장점인 개인정보 보호 기능은 상실됩니다.
이러한 한계는 CompactifAI가 아직 대중적인 소비자 채택을 위한 준비가 되어 있지 않음을 시사하지만, 애초에 그런 의도가 아니었을 수도 있습니다. 센서 타워(Sensor Tower)에 따르면, 이 앱은 지난 한 달 동안 5,000건 미만의 다운로드 수를 기록했습니다.
진정한 초점은 기업 시장입니다. 오늘, 멀티버스는 개발자와 기업이 AWS 마켓플레이스를 거치지 않고도 압축된 모델에 직접 접근할 수 있도록 하는 셀프 서비스 API 포털을 출시합니다.
엔리케 리자소(Enrique Lizaso) CEO는 성명을 통해 “CompactifAI API 포털은 개발자들에게 압축된 모델에 대한 직접적인 접근 권한을 제공하며, 이를 실제 운영 환경에서 실행하는 데 필요한 투명성과 제어 기능을 갖추고 있다”고 밝혔다.
실시간 사용량 모니터링은 이 API의 핵심 기능이며, 이는 결코 우연이 아닙니다. 엣지 배포의 잠재적 이점과 더불어, 컴퓨팅 비용 절감은 기업들이 대규모 언어 모델(LLM)의 대안으로 소형 모델을 모색하는 주요 이유입니다.
또한 소형 모델이 과거보다 훨씬 덜 제약받는 점도 도움이 됩니다. 이번 주 초, 미스트랄(Mistral)은 일반 채팅, 코딩, 에이전트 작업 및 추론에 최적화되었다고 밝힌 '미스트랄 스몰 4(Mistral Small 4)'를 출시하며 소형 모델 라인업을 업데이트했습니다. 이 프랑스 기업은 또한 기업이 사용 사례에 가장 적합한 절충점을 선택할 수 있는 소형 모델을 포함한 맞춤형 모델을 구축할 수 있게 해주는 시스템인 '포지(Forge)'를 출시했습니다.
멀티버스(Multiverse)의 최근 성과 역시 대형 언어 모델(LLM)과의 격차가 좁혀지고 있음을 시사한다. 멀티버스의 최신 압축 모델인 '하이퍼노바 60B 2602(HyperNova 60B 2602)'는 공개된 소스 코드를 기반으로 하는 오픈AI 모델인 'gpt-oss-120b'를 기반으로 구축되었다. 이 회사는 원본 모델보다 더 낮은 비용으로 더 빠른 응답을 제공한다고 주장하는데, 이는 AI가 복잡하고 다단계인 프로그래밍 작업을 자율적으로 처리하는 에이전트 기반 코딩 워크플로우에서 특히 중요한 장점이다.
모바일 기기에서 실행할 수 있을 만큼 모델을 작게 만들면서도 유용성을 유지하는 것은 큰 과제입니다. Apple Intelligence는 온디바이스 모델과 클라우드 모델을 결합하여 이 문제를 우회했습니다. Multiverse의 CompactifAI 앱도 API를 통해 gpt-oss-120b로 요청을 전달할 수 있지만, 이 앱의 주된 목표는 Gilda 및 향후 후속 모델과 같은 로컬 모델이 비용 절감 이상의 이점을 제공한다는 점을 입증하는 것입니다.
중요 분야 종사자들에게 클라우드 연결 없이 로컬에서 실행되는 모델은 더 높은 수준의 개인정보 보호와 복원력을 제공합니다. 하지만 더 큰 가치는 이를 통해 가능해지는 비즈니스 활용 사례에 있습니다. 예를 들어, 안정적인 연결을 보장할 수 없는 드론, 위성 및 기타 환경에 AI를 내장하는 것이죠.
이 회사는 이미 캐나다 중앙은행, 보쉬, 이베르드롤라를 포함한 전 세계 100여 개 고객사에 서비스를 제공하고 있지만, 고객 기반을 확대하면 추가 자금 조달에 도움이 될 수 있습니다. 지난해 2억 1,500만 달러 규모의 시리즈 B 투자를 유치한 데 이어, 현재 기업 가치 15억 유로를 상회하는 조건으로 5억 유로 규모의 신규 자금 조달을 진행 중인 것으로 알려졌습니다.
코히어, 오픈소스 다국어 AI 모델 제품군 공개
기업용 AI 기업 코히어(Cohere)는 현재 진행 중인 인도 AI 서밋(India AI Summit)에서 ‘Tiny Aya’라는 이름의 새로운 다국어 모델 제품군을 공개했다. 이 오픈 웨이트 모델(핵심 코드를 누구나 공개적으로 이용하고 수정할 수 있음)은 70개 이상의 언어를 지원하며, 인터넷 연결 없이도 노트북과 같은 일상적인 기기에서 작동할 수 있다.
멀티버스 컴퓨팅, 무료 압축 생성형 AI 모델 출시
대규모 언어 모델은 상당한 과제에 직면해 있습니다: 바로 그 방대한 규모입니다. 스페인 스타트업 멀티버스 컴퓨팅(Multiverse Computing)은 최첨단 AI의 성능과 기업이 실질적으로 도입할 수 있는 수준 사이의 격차를 해소하기 위해 설계된 압축 모델을 개발함으로써 이 문제를 해결하고 있습니다.핵심 혁신은 양자 컴퓨팅 원리에서 영감을 받은 압축 기
구글, NotebookLM과 개인 지식 기반을 통합한 ‘제미니 노트북(Gemini Notebooks)’ 공개
구글은 최근 사용자가 맞춤형 지식 기반을 구축하여 복잡한 프로젝트를 관리할 수 있도록 돕기 위해 제미니(Gemini)용 ‘노트북(Notebooks)’ 기능을 출시했습니다. 이번 업데이트는 제미니와 AI 연구 보조 도구인 NotebookLM 간의 데이터 격차를 해소하며, 구글이 폐쇄형 AI 워크플로우를 구축하기 위한 노력의 중요한 단계가 되었습니다.노트북은





집






