DeepSeek Shakes AI 산업 : 다음 AI 도약은 추론에서 증가 된 계산에 의존 할 수 있으며 더 많은 데이터가 아닙니다.
2025년 4월 17일
AlbertWalker
48

AI 산업은 지속적인 플럭스 상태에 있으며 2025 년에는 게임을 변화시키는 일부 개발을 가져오고 있습니다. 중국 AI 실험실 인 DeepSeek가 NVIDIA의 주식에 17%의 급증을 일으켜 다른 AI 데이터 센터 주식에 영향을 미쳤을 때 중국 AI 실험실이 폭탄을 떨어 뜨렸을 때 중 하나의 주요 쉐이크업이 발생했습니다. Deepseek의 모델 주변의 버즈? 그것은 다른 미국 경쟁 업체의 비용의 일부에서 최고 수준의 성능을 제공하며, 이것이 AI 데이터 센터의 미래에 대한 의미에 대해 폭풍을 일으켰습니다.
그러나 DeepSeek의 일을 실제로 얻으려면 더 큰 그림을 확대하고 살펴 봐야합니다. AI 세계는 훈련 데이터의 부족으로 인해 잡히고 있습니다. 큰 플레이어는 이미 대부분의 공개 인터넷 데이터를 씹었습니다. 즉, 우리는 사전 훈련 개선으로 벽을 때리고 있습니다. 결과적으로 업계의 변화는 "테스트 시간 컴퓨팅"(TTC)을 향한 기어를 사용합니다. OpenAi의 "O"시리즈와 같이 대답하기 전에 잠시 "생각"하는 AI 모델로 생각하십시오. TTC가 한때 사전 훈련과 동일한 종류의 스케일링 개선을 제공 할 수 있으며, 다음 큰 AI 획기적인 파도에서 잠재적으로 안내 할 수 있기를 희망합니다.
이러한 변화는 두 가지 큰 변화를 알리고 있습니다. 첫째, 작은 예산 실험실이 게임에 있으며 최첨단 모델을 배치합니다. 둘째, TTC는 AI를 추진하는 새로운 국경이되었습니다. 이러한 트렌드와 AI 풍경과 시장에 대한 의미를 분류합시다.
AI 산업에 대한 시사점
우리는 TTC로의 전환과 추론 모델 간의 경쟁에서 경쟁 업체로 인해 하드웨어, 클라우드 플랫폼, 기초 모델 및 엔터프라이즈 소프트웨어의 여러 전선에서 AI 환경을 재구성 할 수 있다고 생각합니다.
1. 하드웨어 (GPU, 전용 칩 및 계산 인프라)
TTC로의 전환은 하드웨어 AI 회사에 필요한 것과이를 관리하는 방법을 바꿀 수 있습니다. 훈련을 위해 계속해서 GPU 클러스터에 돈을 쏟는 대신, 그들은 TTC 요구를 처리하기 위해 추론 능력을 강화하는 데 더 집중하기 시작할 수 있습니다. GPU는 여전히 추론에 중요하지만 훈련과 추론 워크로드의 차이는 이러한 칩을 설정하고 사용하는 방식에 영향을 줄 수 있습니다. 추론 워크로드가 예측할 수없고 "스파이크"로 인해 용량을 계획하는 데 더 까다로울 수 있습니다.
또한 이러한 변화가 ASIC와 같은 저도의 추론을 위해 특별히 설계된 하드웨어 시장을 향상시킬 수 있다고 생각합니다. TTC가 훈련 능력보다 더 중요 해짐에 따라, 일반적인 목적 GPU의 통치가 사라지기 시작하여 특수한 추론 칩 제조업체를위한 문을여십시오.
2. 클라우드 플랫폼 : hyperscalers (AWS, Azure, GCP) 및 클라우드 컴퓨팅
비즈니스에서 AI 채택의 주요 장애물 중 하나는 정확성 문제를 제외하고 추론 API의 신뢰성입니다. 일관되지 않은 응답 시간, 요금 제한 및 동시 요청에 대한 문제와 같은 것들이 실제 두통이 될 수 있습니다. TTC는 이러한 문제를 더욱 악화시킬 수 있습니다. 이 시나리오에서는 이러한 문제를 해결하기위한 고품질 서비스 (QOS)를 보장 할 수있는 클라우드 제공 업체가 다리가 크게 증가 할 수 있습니다.
흥미롭게도 새로운 방법이 AI를보다 효율적으로 만들 수 있지만 하드웨어 수요를 줄이지 않을 수 있습니다. 더 많은 효율성이 더 많은 소비로 이어지는 Jevons 역설에 이어, 더 효율적인 추론 모델은 더 많은 개발자가 추론 모델을 사용하여 컴퓨팅 전력의 필요성을 증가시킬 수 있습니다. 최근 모델 개선이 추론과 더 작고 전문화 된 모델 교육 모두에 대한 클라우드 AI 컴퓨팅에 대한 수요가 더 많이 발생할 수 있다고 생각합니다.
3. Foundation 모델 제공 업체 (Openai, Anthropic, Cohere, Deepseek, Mistral)
DeepSeek과 같은 새로운 참가자가 비용의 일부로 큰 총으로 발끝으로 갈 수 있다면, 독점적 인 미리 훈련 된 모델의 거점이 무너지기 시작할 수 있습니다. 우리는 또한 변압기 모델을 위해 TTC의 더 많은 혁신을 기대할 수 있으며, DeepSeek가 보여 주듯이 이러한 혁신은 AI의 일반적인 용의자 외부의 예상치 못한 장소에서 나올 수 있습니다.
4. Enterprise AI 채택 및 SaaS (응용 프로그램 계층)
중국에서 Deepseek의 뿌리를 감안할 때 보안 및 개인 정보 보호 관점에서 제품에 대한 지속적인 조사가 진행될 것입니다. 그들의 중국 기반 API 및 챗봇 서비스는 미국, 캐나다 또는 기타 서방 국가의 Enterprise AI 고객을 따라 잡을 것 같지 않습니다. 많은 회사들이 이미 DeepSeek의 웹 사이트 및 앱을 차단하고 있습니다. 서부 데이터 센터에서 제 3자가 주최하더라도 DeepSeek의 모델은 조사에 직면하여 기업에서의 채택을 제한 할 수 있습니다. 연구원들은 탈옥, 편견 및 유해한 컨텐츠 생성과 같은 문제를 표시하고 있습니다. 일부 비즈니스는 DeepSeek의 모델을 실험 할 수 있지만 이러한 우려로 인해 광범위한 채택이 가능하지 않은 것 같습니다.
또 다른 메모에서, 수직 전문화가 시작되고 있습니다. 과거에는 기초 모델을 기반으로 한 수직 응용 분야가 맞춤형 워크 플로우를 만드는 것이 었습니다. RAG (Retrieval-Augmented Generation), 모델 라우팅, 기능 호출 및 가드 레일과 같은 기술은 이러한 특정 사용 사례에 대해 일반화 된 모델을 조정하는 데 핵심이었습니다. 그러나 기본 모델의 주요 개선으로 인해 이러한 응용 프로그램을 쓸모 없게 만들 수 있다는 걱정이 항상있었습니다. Sam Altman은 한때 모델 기능의 큰 도약이 이러한 혁신을 "증기"할 수 있다고 경고했습니다.
그러나 열차 시간 계산 이익에서 고원을보고 있다면 빠르게 추월하는 위협이 줄어 듭니다. TTC 최적화에서 모델 성능 향상이 나오는 세계에서는 응용 프로그램 계층 플레이어에게 새로운 기회가 나타날 수 있습니다. 구조화 된 프롬프트 최적화, 대기 시간 인식 추론 전략 및 효율적인 샘플링 기술과 같은 혁신은 특정 세로에서 큰 성능 향상을 제공 할 수 있습니다.
이러한 개선은 특히 OpenAI의 GPT-4O 및 DeepSeek-R1과 같은 추론 중심 모델과 관련이 있으며, 이는 응답하는 데 몇 초가 걸릴 수 있습니다. 실시간 응용 프로그램에서는 특정 도메인 내에서 대기 시간을 줄이고 추론 품질을 향상 시키면 경쟁 우위를 점할 수 있습니다. 결과적으로, 깊은 도메인 지식을 가진 회사는 추론 효율을 최적화하고 미세 조정 출력을 최적화하는 데 중요한 역할을 할 수 있습니다.
DeepSeek의 작업은 우리가 모델 품질을 향상시키기 위해 더 많은 사전 훈련에만 의존하지 않는다는 것을 보여줍니다. 대신, TTC는 점점 더 중요 해지고 있습니다. 조사로 인해 DeepSeek의 모델이 Enterprise Software에서 널리 채택 될지 여부는 확실하지 않지만 다른 모델 개선에 미치는 영향이 더욱 분명 해지고 있습니다.
우리는 DeepSeek의 혁신이 기존의 하드웨어 이점을 보완하여 유사한 기술을 채택하도록 설립 된 AI 실험실을 추진하고 있다고 생각합니다. 예상되는 모델 비용 감소는 Jevons 역설 패턴에 더 많은 모델 사용을 주도하고있는 것으로 보입니다.
Pashootan vaezipoor는 그루지야의 기술 책임자입니다.
관련 기사
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen
人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
DeepSeek的AIS發現了真正的人類慾望
DeepSeek在AI獎勵模型中的突破性:加強AI推理和響應中國AI初創公司DeepSeek與Tsinghua University合作,在AI研究中取得了重要的里程碑。他們對AI獎勵模型的創新方法有望徹底改變AI系統的學習方式
研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手
上週五,斯坦福大學和華盛頓大學的AI專家的一份開創性的研究論文襲擊了現場,透露,他們設法開發了一種被稱為S1的AI“推理”模型,以低於50美元的雲計算學分。 S1擁有自己的AI世界,這種啟示正在震撼AI世界
의견 (30)
0/200
JohnRoberts
2025년 4월 18일 오후 12시 9분 37초 GMT
DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻
0
WalterWhite
2025년 4월 18일 오후 12시 9분 37초 GMT
DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻
0
RogerPerez
2025년 4월 18일 오후 12시 9분 37초 GMT
DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻
0
PatrickMartinez
2025년 4월 18일 오후 12시 9분 37초 GMT
O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻
0
ScottPerez
2025년 4월 18일 오후 12시 9분 37초 GMT
El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻
0
SophiaCampbell
2025년 4월 18일 오후 5시 57분 57초 GMT
DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀
0






AI 산업은 지속적인 플럭스 상태에 있으며 2025 년에는 게임을 변화시키는 일부 개발을 가져오고 있습니다. 중국 AI 실험실 인 DeepSeek가 NVIDIA의 주식에 17%의 급증을 일으켜 다른 AI 데이터 센터 주식에 영향을 미쳤을 때 중국 AI 실험실이 폭탄을 떨어 뜨렸을 때 중 하나의 주요 쉐이크업이 발생했습니다. Deepseek의 모델 주변의 버즈? 그것은 다른 미국 경쟁 업체의 비용의 일부에서 최고 수준의 성능을 제공하며, 이것이 AI 데이터 센터의 미래에 대한 의미에 대해 폭풍을 일으켰습니다.
그러나 DeepSeek의 일을 실제로 얻으려면 더 큰 그림을 확대하고 살펴 봐야합니다. AI 세계는 훈련 데이터의 부족으로 인해 잡히고 있습니다. 큰 플레이어는 이미 대부분의 공개 인터넷 데이터를 씹었습니다. 즉, 우리는 사전 훈련 개선으로 벽을 때리고 있습니다. 결과적으로 업계의 변화는 "테스트 시간 컴퓨팅"(TTC)을 향한 기어를 사용합니다. OpenAi의 "O"시리즈와 같이 대답하기 전에 잠시 "생각"하는 AI 모델로 생각하십시오. TTC가 한때 사전 훈련과 동일한 종류의 스케일링 개선을 제공 할 수 있으며, 다음 큰 AI 획기적인 파도에서 잠재적으로 안내 할 수 있기를 희망합니다.
이러한 변화는 두 가지 큰 변화를 알리고 있습니다. 첫째, 작은 예산 실험실이 게임에 있으며 최첨단 모델을 배치합니다. 둘째, TTC는 AI를 추진하는 새로운 국경이되었습니다. 이러한 트렌드와 AI 풍경과 시장에 대한 의미를 분류합시다.
AI 산업에 대한 시사점
우리는 TTC로의 전환과 추론 모델 간의 경쟁에서 경쟁 업체로 인해 하드웨어, 클라우드 플랫폼, 기초 모델 및 엔터프라이즈 소프트웨어의 여러 전선에서 AI 환경을 재구성 할 수 있다고 생각합니다.
1. 하드웨어 (GPU, 전용 칩 및 계산 인프라)
TTC로의 전환은 하드웨어 AI 회사에 필요한 것과이를 관리하는 방법을 바꿀 수 있습니다. 훈련을 위해 계속해서 GPU 클러스터에 돈을 쏟는 대신, 그들은 TTC 요구를 처리하기 위해 추론 능력을 강화하는 데 더 집중하기 시작할 수 있습니다. GPU는 여전히 추론에 중요하지만 훈련과 추론 워크로드의 차이는 이러한 칩을 설정하고 사용하는 방식에 영향을 줄 수 있습니다. 추론 워크로드가 예측할 수없고 "스파이크"로 인해 용량을 계획하는 데 더 까다로울 수 있습니다.
또한 이러한 변화가 ASIC와 같은 저도의 추론을 위해 특별히 설계된 하드웨어 시장을 향상시킬 수 있다고 생각합니다. TTC가 훈련 능력보다 더 중요 해짐에 따라, 일반적인 목적 GPU의 통치가 사라지기 시작하여 특수한 추론 칩 제조업체를위한 문을여십시오.
2. 클라우드 플랫폼 : hyperscalers (AWS, Azure, GCP) 및 클라우드 컴퓨팅
비즈니스에서 AI 채택의 주요 장애물 중 하나는 정확성 문제를 제외하고 추론 API의 신뢰성입니다. 일관되지 않은 응답 시간, 요금 제한 및 동시 요청에 대한 문제와 같은 것들이 실제 두통이 될 수 있습니다. TTC는 이러한 문제를 더욱 악화시킬 수 있습니다. 이 시나리오에서는 이러한 문제를 해결하기위한 고품질 서비스 (QOS)를 보장 할 수있는 클라우드 제공 업체가 다리가 크게 증가 할 수 있습니다.
흥미롭게도 새로운 방법이 AI를보다 효율적으로 만들 수 있지만 하드웨어 수요를 줄이지 않을 수 있습니다. 더 많은 효율성이 더 많은 소비로 이어지는 Jevons 역설에 이어, 더 효율적인 추론 모델은 더 많은 개발자가 추론 모델을 사용하여 컴퓨팅 전력의 필요성을 증가시킬 수 있습니다. 최근 모델 개선이 추론과 더 작고 전문화 된 모델 교육 모두에 대한 클라우드 AI 컴퓨팅에 대한 수요가 더 많이 발생할 수 있다고 생각합니다.
3. Foundation 모델 제공 업체 (Openai, Anthropic, Cohere, Deepseek, Mistral)
DeepSeek과 같은 새로운 참가자가 비용의 일부로 큰 총으로 발끝으로 갈 수 있다면, 독점적 인 미리 훈련 된 모델의 거점이 무너지기 시작할 수 있습니다. 우리는 또한 변압기 모델을 위해 TTC의 더 많은 혁신을 기대할 수 있으며, DeepSeek가 보여 주듯이 이러한 혁신은 AI의 일반적인 용의자 외부의 예상치 못한 장소에서 나올 수 있습니다.
4. Enterprise AI 채택 및 SaaS (응용 프로그램 계층)
중국에서 Deepseek의 뿌리를 감안할 때 보안 및 개인 정보 보호 관점에서 제품에 대한 지속적인 조사가 진행될 것입니다. 그들의 중국 기반 API 및 챗봇 서비스는 미국, 캐나다 또는 기타 서방 국가의 Enterprise AI 고객을 따라 잡을 것 같지 않습니다. 많은 회사들이 이미 DeepSeek의 웹 사이트 및 앱을 차단하고 있습니다. 서부 데이터 센터에서 제 3자가 주최하더라도 DeepSeek의 모델은 조사에 직면하여 기업에서의 채택을 제한 할 수 있습니다. 연구원들은 탈옥, 편견 및 유해한 컨텐츠 생성과 같은 문제를 표시하고 있습니다. 일부 비즈니스는 DeepSeek의 모델을 실험 할 수 있지만 이러한 우려로 인해 광범위한 채택이 가능하지 않은 것 같습니다.
또 다른 메모에서, 수직 전문화가 시작되고 있습니다. 과거에는 기초 모델을 기반으로 한 수직 응용 분야가 맞춤형 워크 플로우를 만드는 것이 었습니다. RAG (Retrieval-Augmented Generation), 모델 라우팅, 기능 호출 및 가드 레일과 같은 기술은 이러한 특정 사용 사례에 대해 일반화 된 모델을 조정하는 데 핵심이었습니다. 그러나 기본 모델의 주요 개선으로 인해 이러한 응용 프로그램을 쓸모 없게 만들 수 있다는 걱정이 항상있었습니다. Sam Altman은 한때 모델 기능의 큰 도약이 이러한 혁신을 "증기"할 수 있다고 경고했습니다.
그러나 열차 시간 계산 이익에서 고원을보고 있다면 빠르게 추월하는 위협이 줄어 듭니다. TTC 최적화에서 모델 성능 향상이 나오는 세계에서는 응용 프로그램 계층 플레이어에게 새로운 기회가 나타날 수 있습니다. 구조화 된 프롬프트 최적화, 대기 시간 인식 추론 전략 및 효율적인 샘플링 기술과 같은 혁신은 특정 세로에서 큰 성능 향상을 제공 할 수 있습니다.
이러한 개선은 특히 OpenAI의 GPT-4O 및 DeepSeek-R1과 같은 추론 중심 모델과 관련이 있으며, 이는 응답하는 데 몇 초가 걸릴 수 있습니다. 실시간 응용 프로그램에서는 특정 도메인 내에서 대기 시간을 줄이고 추론 품질을 향상 시키면 경쟁 우위를 점할 수 있습니다. 결과적으로, 깊은 도메인 지식을 가진 회사는 추론 효율을 최적화하고 미세 조정 출력을 최적화하는 데 중요한 역할을 할 수 있습니다.
DeepSeek의 작업은 우리가 모델 품질을 향상시키기 위해 더 많은 사전 훈련에만 의존하지 않는다는 것을 보여줍니다. 대신, TTC는 점점 더 중요 해지고 있습니다. 조사로 인해 DeepSeek의 모델이 Enterprise Software에서 널리 채택 될지 여부는 확실하지 않지만 다른 모델 개선에 미치는 영향이 더욱 분명 해지고 있습니다.
우리는 DeepSeek의 혁신이 기존의 하드웨어 이점을 보완하여 유사한 기술을 채택하도록 설립 된 AI 실험실을 추진하고 있다고 생각합니다. 예상되는 모델 비용 감소는 Jevons 역설 패턴에 더 많은 모델 사용을 주도하고있는 것으로 보입니다.
Pashootan vaezipoor는 그루지야의 기술 책임자입니다.



DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻




DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻




DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻




O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻




El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻




DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀












