추론 전쟁 속에서 70%의 마진이 면밀히 조사되면서 엔비디아의 AI 과대 광고가 현실과 만났습니다.

VB 트랜스폼 2025에서 벌어지는 AI 칩 전쟁
VB 트랜스폼 2025의 열띤 패널 토론에서 떠오르는 도전자들이 엔비디아의 지배적인 시장 지위를 직접 겨냥하면서 전선이 그려졌습니다. 핵심 질문은 눈에 띄는 모순을 드러냈습니다: 어떻게 AI 추론이 상품화된 '공장'으로 묘사되는 동시에 70%의 막대한 총 마진을 제공할 수 있을까요?
도전자들의 발언
Groq의 CEO 조나단 로스는 업계의 수사를 정면으로 비판했습니다: "'AI 공장'은 AI를 덜 위협적으로 보이게 하기 위한 마케팅 전략일 뿐입니다." Cerebras의 CTO인 Sean Lie도 신랄한 비판을 가했습니다: "엔비디아는 서비스 제공업체들이 편안한 수익 마진을 유지하면서 스크랩을 놓고 싸우는 것을 즐겁게 지켜보고 있습니다."
수조 달러의 인프라 투자가 걸려 있는 상황에서 이러한 발언은 엔터프라이즈 AI 이니셔티브가 예상치 못한 병목현상에 계속 직면하는 이유에 대한 어려운 진실을 드러냈습니다.
숨겨진 용량 위기
SemiAnalysis의 설립자 딜런 파텔은 상황의 심각성을 폭로했습니다: "주요 AI 사용자들은 더 많은 용량을 확보하기 위해 끊임없이 모델 공급업체와 협상을 벌이고, 그다음에는 하드웨어 공급업체에 추가 리소스를 요청해야 합니다." 이러한 공급망 붕괴는 공장식 AI 경제학의 근본적인 결함을 드러냅니다.
부족한 제조업의 은유
수요에 따라 확장되는 기존 제조업과 달리, AI 인프라는 엄격한 제약에 직면해 있습니다:
- GPU 조달에는 24개월의 리드 타임이 필요합니다.
- 데이터센터 건설은 인허가 및 전력 계약에 따라 달라짐
- 현재의 인프라로는 기하급수적인 성장 수요를 감당할 수 없음
시장 데이터는 지원 부족으로 인한 급격한 성장을 확인시켜 줍니다:
- 6개월 만에 ARR이 10억 달러로 급증한 Anthropic
- 0달러에서 5억 달러의 ARR로 급증한 Cursor
- 사용자들이 여전히 토큰 부족에 직면한 가운데 OpenAI, 100억 달러 돌파
'AI 팩토리' 로직의 세 가지 치명적인 결함
1. 비표준 성능
"추론 속도는 제공업체마다 천차만별입니다."라고 Patel은 지적합니다. "어떤 업체는 초당 20개에 불과한 토큰을 제공하는데, 이는 사람의 말보다 느린 속도입니다."
2. 품질 불일치
로스는 초기 석유 시장과 유사점을 찾았습니다: "원유 품질이 위험할 정도로 다양했던 것처럼, 현재의 AI 결과물은 비용 절감 기술에 따라 변동이 심합니다." 정량화 및 가지치기와 같은 일반적인 최적화는 종종 모델 성능을 저하시킵니다.
3. 역전된 경제학
"일반적으로 호스팅에 더 많은 비용을 지출한다고 해서 소프트웨어 품질이 향상되지는 않습니다. 하지만 AI에서는 예산이 결과물의 충실도에 직접적인 영향을 미칩니다." 이는 일반적인 가정과 모순되는 프리미엄 가격 책정 계층을 만들어냅니다.
메타 검증
마크 저커버그가 "완전한 품질"의 결과물을 제공하는 업체로 Groq을 선정했을 때, 이는 업계 전반의 품질 위기를 드러냈습니다. 공급업체의 비용 절감은 정교한 사용자만이 감지할 수 있는 눈에 보이지 않는 성능 저하를 야기합니다.
기업의 필수 과제
- 엄격한 품질 벤치마크 설정
- 공개되지 않은 최적화가 있는지 기존 제공업체를 감사합니다.
- 모델 충실도 보장을 위한 프리미엄 가격 수용
100만 달러의 토큰 역설
거짓말은 업계의 가격 책정 단절을 강조했습니다: "AI 토큰이 법률 업무와 같은 혁신적인 가치를 제공한다면 왜 우리는 1달러 미만의 가격으로 경쟁하고 있을까요?" 현재 1:1의 토큰 지출 대 수익 비율은 공장형 내러티브에 가려진 지속 불가능한 경제성을 드러냅니다.
성능 혁신
차세대 하드웨어는 단계적인 기능 개선을 가능하게 합니다. "저희의 웨이퍼 스케일 기술은 GPU에 비해 10~50배의 속도 향상을 제공합니다."라고 리는 말합니다. 이러한 이점을 통해 이전에는 불가능했던 실시간 에이전트 워크플로우를 밤새 일괄 처리하는 것이 아니라 실시간으로 처리할 수 있게 되었습니다.
실제 병목 현상
"위기는 칩 공급이 아니라 데이터센터 용량과 전력입니다."라고 Patel은 밝혔습니다. 전 세계적인 자원 확보 경쟁은 기업들이 중동과 같이 전력이 풍부한 지역에 솔루션을 찾기 위해 몰려드는 이유를 설명합니다.
Google의 주의 사례
로스는 구글의 "성공 재앙" 현상을 언급하며 "AI가 갑자기 인간보다 성능이 뛰어나면 인프라 용량을 넘어 수요가 폭발적으로 증가합니다."라고 말했습니다. 이러한 패턴은 이제 기업 전반에서 반복되고 있으며, 부드러운 확장 곡선이 존재하지 않습니다.
기업 전략의 변화 필요
- 선형적 예측을 동적 용량 관리로 대체하기
- 속도가 중요한 경우 성능 프리미엄을 위한 예산 확보
- 점진적 최적화보다 아키텍처의 이점을 우선시합니다.
- 몇 년 전부터 전력 용량 및 데이터센터 공간 확보
새로운 시장 현실
공장의 비유는 오늘날의 AI 인프라 환경을 위험할 정도로 잘못 표현하고 있습니다. 기업은 세 가지 냉혹한 진실을 직시해야 합니다:
- 공급자의 시장: 용량 희소성으로 인해 공급업체가 모든 협상력을 갖게 됨
- 품질 편차: 5%의 성능 차이가 애플리케이션의 성패를 좌우합니다.
- 물리적 제약: 킬로와트 및 냉각 용량은 엄격한 한계를 설정합니다.
앞으로 나아가기 위해서는 상품화에 대한 환상을 버려야 합니다. 전략적 우선순위에는 다음이 포함되어야 합니다:
- 어떤 대가를 치르더라도 프리미엄 용량 확보
- 엄격한 품질 검증 프로세스
- 장기적인 인프라 투자
- 워크로드별 하드웨어 매칭
패널의 만장일치로 내린 결론은 AI 군비 경쟁에서 품질과 성능이 프리미엄 가격을 좌우하는 반면, 공장식 사고는 곧바로 용량 제약과 타협으로 이어진다는 것이었습니다.
관련 기사
OpenAI, ChatGPT Pro를 o3로 업그레이드하고 월 구독료 $200로 가치 증대
이번 주에는 마이크로소프트, 구글, 앤트로픽을 비롯한 거대 기술 기업들의 중요한 AI 개발이 있었습니다. OpenAI는 코드명 "io"라는 야심찬 하드웨어 이니셔티브를 위해 65억 달러에 인수한 조니 아이브의 디자인 회사를 넘어서는 획기적인 업데이트를 발표하며 활발한 발표를 마무리했습니다.이 회사는 이전의 GPT-4o 프레임워크에서 고급 추론 모델인 o3로
AI 에이전트를 활용하여 자선 기금 모금 활동을 강화하는 비영리 단체
주요 기술 기업들이 AI '에이전트'를 기업의 생산성을 높여주는 도구로 홍보하는 가운데, 한 비영리 단체는 사회적 공익을 위한 AI의 잠재력을 입증하고 있습니다. 오픈 필란트로피의 지원을 받는 자선 연구 단체인 세이지 퓨처는 최근 AI 모델이 자선 기금 모금에 어떻게 협력할 수 있는지 보여주는 혁신적인 실험을 진행했습니다.이 비영리 단체는 자선 단체를
최고의 AI 연구소, 인류가 AI 시스템에 대한 이해력을 잃어가고 있다고 경고하다
전례 없는 단결력을 보여준 OpenAI, Google DeepMind, Anthropic, Meta의 연구원들은 경쟁적 차이를 제쳐두고 책임감 있는 AI 개발에 대한 공동의 경고를 발표했습니다. 일반적으로 라이벌 관계에 있는 이들 조직의 40여 명의 선도적인 과학자들은 AI 의사결정 과정의 투명성을 보장하기 위해 빠르게 닫혀가는 창을 강조하는 획기적인 연구
의견 (0)
0/200
VB 트랜스폼 2025에서 벌어지는 AI 칩 전쟁
VB 트랜스폼 2025의 열띤 패널 토론에서 떠오르는 도전자들이 엔비디아의 지배적인 시장 지위를 직접 겨냥하면서 전선이 그려졌습니다. 핵심 질문은 눈에 띄는 모순을 드러냈습니다: 어떻게 AI 추론이 상품화된 '공장'으로 묘사되는 동시에 70%의 막대한 총 마진을 제공할 수 있을까요?
도전자들의 발언
Groq의 CEO 조나단 로스는 업계의 수사를 정면으로 비판했습니다: "'AI 공장'은 AI를 덜 위협적으로 보이게 하기 위한 마케팅 전략일 뿐입니다." Cerebras의 CTO인 Sean Lie도 신랄한 비판을 가했습니다: "엔비디아는 서비스 제공업체들이 편안한 수익 마진을 유지하면서 스크랩을 놓고 싸우는 것을 즐겁게 지켜보고 있습니다."
수조 달러의 인프라 투자가 걸려 있는 상황에서 이러한 발언은 엔터프라이즈 AI 이니셔티브가 예상치 못한 병목현상에 계속 직면하는 이유에 대한 어려운 진실을 드러냈습니다.
숨겨진 용량 위기
SemiAnalysis의 설립자 딜런 파텔은 상황의 심각성을 폭로했습니다: "주요 AI 사용자들은 더 많은 용량을 확보하기 위해 끊임없이 모델 공급업체와 협상을 벌이고, 그다음에는 하드웨어 공급업체에 추가 리소스를 요청해야 합니다." 이러한 공급망 붕괴는 공장식 AI 경제학의 근본적인 결함을 드러냅니다.
부족한 제조업의 은유
수요에 따라 확장되는 기존 제조업과 달리, AI 인프라는 엄격한 제약에 직면해 있습니다:
- GPU 조달에는 24개월의 리드 타임이 필요합니다.
- 데이터센터 건설은 인허가 및 전력 계약에 따라 달라짐
- 현재의 인프라로는 기하급수적인 성장 수요를 감당할 수 없음
시장 데이터는 지원 부족으로 인한 급격한 성장을 확인시켜 줍니다:
- 6개월 만에 ARR이 10억 달러로 급증한 Anthropic
- 0달러에서 5억 달러의 ARR로 급증한 Cursor
- 사용자들이 여전히 토큰 부족에 직면한 가운데 OpenAI, 100억 달러 돌파
'AI 팩토리' 로직의 세 가지 치명적인 결함
1. 비표준 성능
"추론 속도는 제공업체마다 천차만별입니다."라고 Patel은 지적합니다. "어떤 업체는 초당 20개에 불과한 토큰을 제공하는데, 이는 사람의 말보다 느린 속도입니다."
2. 품질 불일치
로스는 초기 석유 시장과 유사점을 찾았습니다: "원유 품질이 위험할 정도로 다양했던 것처럼, 현재의 AI 결과물은 비용 절감 기술에 따라 변동이 심합니다." 정량화 및 가지치기와 같은 일반적인 최적화는 종종 모델 성능을 저하시킵니다.
3. 역전된 경제학
"일반적으로 호스팅에 더 많은 비용을 지출한다고 해서 소프트웨어 품질이 향상되지는 않습니다. 하지만 AI에서는 예산이 결과물의 충실도에 직접적인 영향을 미칩니다." 이는 일반적인 가정과 모순되는 프리미엄 가격 책정 계층을 만들어냅니다.
메타 검증
마크 저커버그가 "완전한 품질"의 결과물을 제공하는 업체로 Groq을 선정했을 때, 이는 업계 전반의 품질 위기를 드러냈습니다. 공급업체의 비용 절감은 정교한 사용자만이 감지할 수 있는 눈에 보이지 않는 성능 저하를 야기합니다.
기업의 필수 과제
- 엄격한 품질 벤치마크 설정
- 공개되지 않은 최적화가 있는지 기존 제공업체를 감사합니다.
- 모델 충실도 보장을 위한 프리미엄 가격 수용
100만 달러의 토큰 역설
거짓말은 업계의 가격 책정 단절을 강조했습니다: "AI 토큰이 법률 업무와 같은 혁신적인 가치를 제공한다면 왜 우리는 1달러 미만의 가격으로 경쟁하고 있을까요?" 현재 1:1의 토큰 지출 대 수익 비율은 공장형 내러티브에 가려진 지속 불가능한 경제성을 드러냅니다.
성능 혁신
차세대 하드웨어는 단계적인 기능 개선을 가능하게 합니다. "저희의 웨이퍼 스케일 기술은 GPU에 비해 10~50배의 속도 향상을 제공합니다."라고 리는 말합니다. 이러한 이점을 통해 이전에는 불가능했던 실시간 에이전트 워크플로우를 밤새 일괄 처리하는 것이 아니라 실시간으로 처리할 수 있게 되었습니다.
실제 병목 현상
"위기는 칩 공급이 아니라 데이터센터 용량과 전력입니다."라고 Patel은 밝혔습니다. 전 세계적인 자원 확보 경쟁은 기업들이 중동과 같이 전력이 풍부한 지역에 솔루션을 찾기 위해 몰려드는 이유를 설명합니다.
Google의 주의 사례
로스는 구글의 "성공 재앙" 현상을 언급하며 "AI가 갑자기 인간보다 성능이 뛰어나면 인프라 용량을 넘어 수요가 폭발적으로 증가합니다."라고 말했습니다. 이러한 패턴은 이제 기업 전반에서 반복되고 있으며, 부드러운 확장 곡선이 존재하지 않습니다.
기업 전략의 변화 필요
- 선형적 예측을 동적 용량 관리로 대체하기
- 속도가 중요한 경우 성능 프리미엄을 위한 예산 확보
- 점진적 최적화보다 아키텍처의 이점을 우선시합니다.
- 몇 년 전부터 전력 용량 및 데이터센터 공간 확보
새로운 시장 현실
공장의 비유는 오늘날의 AI 인프라 환경을 위험할 정도로 잘못 표현하고 있습니다. 기업은 세 가지 냉혹한 진실을 직시해야 합니다:
- 공급자의 시장: 용량 희소성으로 인해 공급업체가 모든 협상력을 갖게 됨
- 품질 편차: 5%의 성능 차이가 애플리케이션의 성패를 좌우합니다.
- 물리적 제약: 킬로와트 및 냉각 용량은 엄격한 한계를 설정합니다.
앞으로 나아가기 위해서는 상품화에 대한 환상을 버려야 합니다. 전략적 우선순위에는 다음이 포함되어야 합니다:
- 어떤 대가를 치르더라도 프리미엄 용량 확보
- 엄격한 품질 검증 프로세스
- 장기적인 인프라 투자
- 워크로드별 하드웨어 매칭
패널의 만장일치로 내린 결론은 AI 군비 경쟁에서 품질과 성능이 프리미엄 가격을 좌우하는 반면, 공장식 사고는 곧바로 용량 제약과 타협으로 이어진다는 것이었습니다.












