알리바바 투하오 M890, 3배의 성능으로 출시되어 칩-클라우드-모델-추론을 위한 풀스택 에이전트 시대를 열다

2026년 5월 20일, 알리바바 클라우드 서밋에서 알리바바 클라우드는 에이전트 시대를 위해 설계된 풀스택 기술 시스템 업그레이드가 완료되었다고 발표했습니다. 이 변화는 기본 칩과 클라우드 플랫폼부터 모델 및 추론 솔루션에 이르기까지 전체 시스템을 재구성했습니다. 이를 통해 알리바바 클라우드는 거대한 에이전트들이 24시간 연중무휴로 작동할 수 있도록 지원하는 AI 공장으로 자리매김하게 되었으며, 이는 더 이상 인간 사용자에게 직접 서비스를 제공하는 것을 넘어서는 의미입니다.
1. 핵심 기반: 텡쉰 젠우 M890 칩과 슈퍼 노드 서버
이번 업그레이드의 핵심은 텡쉰의 차세대 AI 칩인 젠우 M890으로, 이 칩은 훈련과 추론 기능을 통합하고 있습니다.
성능 향상: M890은 144GB의 메모리를 탑재하고 있으며, 이전 모델인 젠우 810E보다 성능이 3배 향상되었습니다. 또한 FP32부터 FP4에 이르는 다양한 데이터 정밀도 수준을 기본적으로 지원하기 때문에, 고정밀도 훈련과 초저정밀도 동시 추론에 이상적입니다.
클러스터 상호 연결의 혁신: 자체 개발한 ICN 스위치 1.0 상호 연결 칩을 통합하여, 알리바바 클라우드는 젠우 M890을 기반으로 한 판지우 AL128 슈퍼 노드 서버를 출시했습니다. 이 서버는 128개의 AI 칩을 시스템 수준에서 효율적으로 관리함으로써, 나노초 단위의 통신 지연 시간을 실현하고 대규모 지능 컴퓨팅 클러스터의 효율성과 안정성을 크게 향상시켰습니다.
미래 계획: 텡쉰은 젠우 시리즈 칩의 로드맵을 공개했으며, 젠우 V900과 젠우 J900이 향후 2년 내에 출시될 것이라고 밝혔습니다. 이를 통해 데이터 센터 컴퓨팅 시장에서의 장기적인 경쟁력을 더욱 강화할 예정입니다.
2. 핵심 접근 포인트: 새롭게 디자인된 “쿤 클라우드”와 에이전트 중심의 상호작용
알리바바 클라우드는 클라우드 상호작용 논리를 근본적으로 변화시켰습니다. 기존의 클라우드 플랫폼은 인간을 위해 설계되었지만(제어판과 대시보드 등), 에이전트 시대의 클라우드는 에이전트를 위해 설계되어야 합니다.
AI 기반 웹사이트 “쿤 클라우드”: AI 기반 웹사이트인 쿤 클라우드는 기존의 복잡한 제품 카탈로그를 표준화된 스킬 설치 코드로 대체했습니다. 에이전트들은 이러한 코드 지시를 직접 해석하여 컴퓨팅, 저장, 모델 기능을 자동으로 호출할 수 있으므로, 수동적인 제어판 설정이 더 이상 필요하지 않습니다.
기능의 표준화: 알리바바 클라우드는 150개 이상의 주류 모델과 클라우드 제품 기능을 표준화된 스킬과 CLI 도구로 패키징했습니다. 단 한 줄의 명령어만으로도 클로드 코드나 주류 에이전트 프레임워크와 같은 도구들을 사용하여 알리바바 클라우드의 모든 인프라 기능을 빠르게 설치하고 이용할 수 있습니다.
3. 기술 전략: 칩, 클라우드, 모델, 추론의 풀스택 통합
이 새로운 시스템은 불규칙한 탄력성, 짧은 수명 주기, 매우 높은 순간적 동시성을 특징으로 하는 에이전트 작업 부하의 고유한 문제들을 해결하기 위해 설계되었습니다.
심층 최적화: 알리바바 클라우드는 플래그십 모델인 쿤3.7-Max와 같은 모델뿐만 아니라, 기본적인 젠우 시리즈 칩과 추론 프레임워크 간의 심층적인 통합을 통해 최적의 컴퓨팅 리소스 배분을 실현했습니다.
목표의 변화: 알리바바 클라우드의 CTO인 리페이 리와 다른 전문가들은 대규모 모델의 초점이 인간의 선호도에 맞추는 것에서 작업 목표를 달성하는 데 맞추는 것으로 변화했다고 지적했습니다. 이러한 시스템의 진화는 에이전트들이 수백만 분의 1초 내에 복잡한 엔지니어링 작업을 효율적으로 완료할 수 있도록 보장함으로써, 다양한 산업에서 AI의 활용 장벽을 낮추는 데 기여합니다.
요약:
텡쉰 칩 매트릭스와 쿤 클라우드 접근 포인트, 그리고 풀스택 모델 추론 기능을 결합함으로써, 알리바바 클라우드는 업계 최초로 컴퓨팅 파워 임대 제공업체에서 AI 공장으로 전환하는 데 성공했습니다. 이 시스템은 에이전트들의 폭발적인 성장을 지원할 인프라를 제공할 뿐만 아니라, 중국의 기술 리더들이 에이전트 시대에 하드웨어와 소프트웨어의 협력을 통해 전 세계 생산성의 문턱을 재구성하려는 야망을 보여줍니다.
관련 기사
스페이스X의 IPO 신청 자료에서 드러난 위성 인터넷 및 AI 분야 확장에 대한 야망
SpaceX가 계획 중인 IPO에 앞서 제출한 S-1 등록 서류에서, 항공우주 통신 및 인공지능 분야에서의 강력한 입지를 보여주는 여러 인상적인 재무 지표를 공개했습니다:Starlink 가입자 수 1,000만 명 돌파: 2026년 1분기 기준으로 전 세계에서 유료로 Starlink 서비스를 이용하는 가입자 수는 1,030만 명에 달했으며, 이는 지난 1년 동안 두 배로 증가한 수치입니다. 이러한 성장은 전 세계에서 가장 큰 저지구궤도 위성군을
펜티엄 4 리바이벌: 20년 된 CPU로 메타 라마 3 대형 모델을 실행하다
최근 유튜브의 기술 채널 Fully Buffered에서 인상적이고 대담한 실험을 진행했습니다. 2006년에 출시된 펜티엄 4 641 프로세서에서 메타의 최신 대형 모델인 Llama 3.2 3B를 성공적으로 실행한 것입니다.이 실험은 현대 인공지능을 20년 전의 하드웨어와 맞닿게 했으며, LLM의 기본적인 호환성 한계를 드러내는 동시에 많은 시청자들로 하여금 AI 시대에 무어의 법칙이 어떻게 이런 특이한 방식으로 세대 간의 교류를 이루었는지 생
항저우 상성구, 절강성 최초의 AIGC 시청각 ‘황금 십조치’ 도입 및 50억 원 규모 산업 펀드 조성 발표
16일, AIGC 오디오-비주얼 산업 혁신 생태계 컨퍼런스가 항저우 상성구에서 열렸습니다. 이 행사에서 해당 지방은 AIGC 오디오-비주얼 산업을 위한 첫 번째 전용 정책인 “골든 텐”을 발표했습니다. 이 정책은 기술 혁신, 비용 절감, 콘텐츠 품질 향상, 인재 양성, 글로벌 확장 등 산업 성장의 모든 측면을 다루고 있습니다.이 정책에는 강력한 인센티브가 포함되어 있습니다. 기술 혁신 분야에서는 AIGC 도구, AI 가상 촬영, AI 대화형
관련 특별 주제 추천
의견 (0)
0/500

2026년 5월 20일, 알리바바 클라우드 서밋에서 알리바바 클라우드는 에이전트 시대를 위해 설계된 풀스택 기술 시스템 업그레이드가 완료되었다고 발표했습니다. 이 변화는 기본 칩과 클라우드 플랫폼부터 모델 및 추론 솔루션에 이르기까지 전체 시스템을 재구성했습니다. 이를 통해 알리바바 클라우드는 거대한 에이전트들이 24시간 연중무휴로 작동할 수 있도록 지원하는 AI 공장으로 자리매김하게 되었으며, 이는 더 이상 인간 사용자에게 직접 서비스를 제공하는 것을 넘어서는 의미입니다.
1. 핵심 기반: 텡쉰 젠우 M890 칩과 슈퍼 노드 서버
이번 업그레이드의 핵심은 텡쉰의 차세대 AI 칩인 젠우 M890으로, 이 칩은 훈련과 추론 기능을 통합하고 있습니다.
성능 향상: M890은 144GB의 메모리를 탑재하고 있으며, 이전 모델인 젠우 810E보다 성능이 3배 향상되었습니다. 또한 FP32부터 FP4에 이르는 다양한 데이터 정밀도 수준을 기본적으로 지원하기 때문에, 고정밀도 훈련과 초저정밀도 동시 추론에 이상적입니다.
클러스터 상호 연결의 혁신: 자체 개발한 ICN 스위치 1.0 상호 연결 칩을 통합하여, 알리바바 클라우드는 젠우 M890을 기반으로 한 판지우 AL128 슈퍼 노드 서버를 출시했습니다. 이 서버는 128개의 AI 칩을 시스템 수준에서 효율적으로 관리함으로써, 나노초 단위의 통신 지연 시간을 실현하고 대규모 지능 컴퓨팅 클러스터의 효율성과 안정성을 크게 향상시켰습니다.
미래 계획: 텡쉰은 젠우 시리즈 칩의 로드맵을 공개했으며, 젠우 V900과 젠우 J900이 향후 2년 내에 출시될 것이라고 밝혔습니다. 이를 통해 데이터 센터 컴퓨팅 시장에서의 장기적인 경쟁력을 더욱 강화할 예정입니다.
2. 핵심 접근 포인트: 새롭게 디자인된 “쿤 클라우드”와 에이전트 중심의 상호작용
알리바바 클라우드는 클라우드 상호작용 논리를 근본적으로 변화시켰습니다. 기존의 클라우드 플랫폼은 인간을 위해 설계되었지만(제어판과 대시보드 등), 에이전트 시대의 클라우드는 에이전트를 위해 설계되어야 합니다.
AI 기반 웹사이트 “쿤 클라우드”: AI 기반 웹사이트인 쿤 클라우드는 기존의 복잡한 제품 카탈로그를 표준화된 스킬 설치 코드로 대체했습니다. 에이전트들은 이러한 코드 지시를 직접 해석하여 컴퓨팅, 저장, 모델 기능을 자동으로 호출할 수 있으므로, 수동적인 제어판 설정이 더 이상 필요하지 않습니다.
기능의 표준화: 알리바바 클라우드는 150개 이상의 주류 모델과 클라우드 제품 기능을 표준화된 스킬과 CLI 도구로 패키징했습니다. 단 한 줄의 명령어만으로도 클로드 코드나 주류 에이전트 프레임워크와 같은 도구들을 사용하여 알리바바 클라우드의 모든 인프라 기능을 빠르게 설치하고 이용할 수 있습니다.
3. 기술 전략: 칩, 클라우드, 모델, 추론의 풀스택 통합
이 새로운 시스템은 불규칙한 탄력성, 짧은 수명 주기, 매우 높은 순간적 동시성을 특징으로 하는 에이전트 작업 부하의 고유한 문제들을 해결하기 위해 설계되었습니다.
심층 최적화: 알리바바 클라우드는 플래그십 모델인 쿤3.7-Max와 같은 모델뿐만 아니라, 기본적인 젠우 시리즈 칩과 추론 프레임워크 간의 심층적인 통합을 통해 최적의 컴퓨팅 리소스 배분을 실현했습니다.
목표의 변화: 알리바바 클라우드의 CTO인 리페이 리와 다른 전문가들은 대규모 모델의 초점이 인간의 선호도에 맞추는 것에서 작업 목표를 달성하는 데 맞추는 것으로 변화했다고 지적했습니다. 이러한 시스템의 진화는 에이전트들이 수백만 분의 1초 내에 복잡한 엔지니어링 작업을 효율적으로 완료할 수 있도록 보장함으로써, 다양한 산업에서 AI의 활용 장벽을 낮추는 데 기여합니다.
요약:
텡쉰 칩 매트릭스와 쿤 클라우드 접근 포인트, 그리고 풀스택 모델 추론 기능을 결합함으로써, 알리바바 클라우드는 업계 최초로 컴퓨팅 파워 임대 제공업체에서 AI 공장으로 전환하는 데 성공했습니다. 이 시스템은 에이전트들의 폭발적인 성장을 지원할 인프라를 제공할 뿐만 아니라, 중국의 기술 리더들이 에이전트 시대에 하드웨어와 소프트웨어의 협력을 통해 전 세계 생산성의 문턱을 재구성하려는 야망을 보여줍니다.
스페이스X의 IPO 신청 자료에서 드러난 위성 인터넷 및 AI 분야 확장에 대한 야망
SpaceX가 계획 중인 IPO에 앞서 제출한 S-1 등록 서류에서, 항공우주 통신 및 인공지능 분야에서의 강력한 입지를 보여주는 여러 인상적인 재무 지표를 공개했습니다:Starlink 가입자 수 1,000만 명 돌파: 2026년 1분기 기준으로 전 세계에서 유료로 Starlink 서비스를 이용하는 가입자 수는 1,030만 명에 달했으며, 이는 지난 1년 동안 두 배로 증가한 수치입니다. 이러한 성장은 전 세계에서 가장 큰 저지구궤도 위성군을
펜티엄 4 리바이벌: 20년 된 CPU로 메타 라마 3 대형 모델을 실행하다
최근 유튜브의 기술 채널 Fully Buffered에서 인상적이고 대담한 실험을 진행했습니다. 2006년에 출시된 펜티엄 4 641 프로세서에서 메타의 최신 대형 모델인 Llama 3.2 3B를 성공적으로 실행한 것입니다.이 실험은 현대 인공지능을 20년 전의 하드웨어와 맞닿게 했으며, LLM의 기본적인 호환성 한계를 드러내는 동시에 많은 시청자들로 하여금 AI 시대에 무어의 법칙이 어떻게 이런 특이한 방식으로 세대 간의 교류를 이루었는지 생
항저우 상성구, 절강성 최초의 AIGC 시청각 ‘황금 십조치’ 도입 및 50억 원 규모 산업 펀드 조성 발표
16일, AIGC 오디오-비주얼 산업 혁신 생태계 컨퍼런스가 항저우 상성구에서 열렸습니다. 이 행사에서 해당 지방은 AIGC 오디오-비주얼 산업을 위한 첫 번째 전용 정책인 “골든 텐”을 발표했습니다. 이 정책은 기술 혁신, 비용 절감, 콘텐츠 품질 향상, 인재 양성, 글로벌 확장 등 산업 성장의 모든 측면을 다루고 있습니다.이 정책에는 강력한 인센티브가 포함되어 있습니다. 기술 혁신 분야에서는 AIGC 도구, AI 가상 촬영, AI 대화형





집






