Deepseek Shakes AI業界:次のAIリープは、推論での計算の増加に依存する可能性があり、それ以上のデータではありません
2025年4月17日
AlbertWalker
48

AI業界は絶え間ない流動性のある状態にあり、2025年は物事を揺さぶっているゲームを変える開発をもたらしています。中国のAIラボであるDeepseekが、Nvidiaの在庫に17%のDIPを引き起こし、他のAIデータセンター在庫に影響を与えた新しいモデルで爆弾を落としたときに、1つの大きなシェイクアップが起こりました。 Deepseekのモデルの周りの話題?他の米国の競合他社のコストの数分の1で一流のパフォーマンスを提供し、これがAIデータセンターの将来にとって何を意味するかについて嵐を巻き起こしています。
しかし、DeepSeekが本当にしていることを実際に手に入れるには、ズームアウトして全体像を見る必要があります。 AIの世界は、トレーニングデータの不足に取り組んでいます。大手プレーヤーはすでにほとんどのパブリックインターネットデータを噛んでいます。つまり、トレーニング前の改善で壁にぶつかります。その結果、業界の変化するギアは「テスト時間計算」(TTC)に向けられます。 AIモデルは、Openaiの「O」シリーズのように、回答する前に「考える」ために少し時間がかかると考えてください。 TTCがトレーニング前にかつて行ったのと同じ種類のスケーリングの改善を提供し、AIブレークスルーの次の大きな波を潜在的に導くことができるという希望があります。
これらのシフトは、2つの大きな変更を示しています。最初に、より小さな予算のラボがゲームに登場し、最先端のモデルを出します。第二に、TTCはAIを前進させるための新しいフロンティアになりつつあります。これらの傾向と、AIの風景と市場にとって何を意味するのかを分解しましょう。
AI業界への影響
TTCへの移行と推論モデル間の競争におけるランプアップは、ハードウェア、クラウドプラットフォーム、ファンデーションモデル、エンタープライズソフトウェアのいくつかの面でAIランドスケープを再構築できると考えています。
1。ハードウェア(GPU、専用のチップ、およびインフラストラクチャの計算)
TTCへの移行は、ハードウェアAI企業に必要なものとそれを管理する方法を変更する可能性があります。トレーニングのために絶え間ないGPUクラスターにお金を注ぐ代わりに、彼らはTTCの要求を処理するために推論機能を強化することにもっと焦点を合わせ始めるかもしれません。 GPUは依然として推論にとって重要ですが、トレーニングと推論ワークロードの違いは、これらのチップのセットアップと使用方法に影響を与える可能性があります。推論ワークロードはより予測不可能で「スパイキー」であるため、容量の計画はよりトリックになる可能性があります。
また、このシフトは、ASICのような低遅延の推論用に特別に設計されたハードウェアの市場を後押しする可能性があると考えています。 TTCがトレーニング能力よりも重要になると、汎用GPUの治世が衰え始め、専門的な推論チップメーカーのドアを開きます。
2。クラウドプラットフォーム:ハイパースカラー(AWS、Azure、GCP)およびクラウドコンピューティング
正確性の問題は別として、企業でのAI採用の大きなハードルの1つは、推論APIの信頼性です。一貫性のない応答時間、レート制限、同時リクエストの問題などは、真の頭痛の種になる可能性があります。 TTCはこれらの問題をさらに悪化させる可能性があります。このシナリオでは、これらの問題に取り組むために高品質のサービス(QoS)を保証できるクラウドプロバイダーが大きな脚を上げる可能性があります。
興味深いことに、新しい方法はAIをより効率的にする可能性がありますが、ハードウェアの需要を減らすことはできません。より効率がより多くの消費につながるJevons Paradoxに続いて、より効率的な推論モデルは、より多くの開発者を推論モデルを使用するように駆り立て、コンピューティングパワーの必要性を高めます。最近のモデルの改善は、推論とより小規模な専門モデルトレーニングの両方に対して、クラウドAI計算の需要を高める可能性があると考えています。
3.ファンデーションモデルプロバイダー(Openai、人類、coも、Deepseek、Mistral)
Deepseekのような新規参入者が、わずかなコストで大きな銃でつま先につま先に行くことができれば、独自の事前訓練モデルの拠点が崩れ始めるかもしれません。また、トランスモデルのTTCのイノベーションが増えることも期待でき、DeepSeekが示しているように、これらの革新はAIの通常の容疑者以外の予期しない場所から来る可能性があります。
4。エンタープライズAIの採用とSaaS(アプリケーションレイヤー)
中国でのDeepseekのルーツを考えると、セキュリティとプライバシーの観点から彼らの製品を継続的に精査することができます。彼らの中国に拠点を置くAPIおよびチャットボットサービスは、米国、カナダ、またはその他の西側諸国のエンタープライズAIの顧客と対処する可能性は低いです。多くの企業はすでにDeepSeekのウェブサイトとアプリをブロックしています。西部のデータセンターの第三者がホストした場合でも、Deepseekのモデルは精査に直面する可能性があり、企業での採用を制限する可能性があります。研究者は、ジェイルブレイク、バイアス、有害なコンテンツ生成などの問題にフラグを立てています。一部の企業はDeepSeekのモデルを実験するかもしれませんが、これらの懸念のために広範な採用はありそうにないようです。
別の注意として、垂直の専門化が根拠を獲得しています。過去には、Foundationモデルに基づいて構築された垂直アプリケーションは、すべてテーラードワークフローの作成に関するものでした。検索された生成(RAG)、モデルルーティング、関数呼び出し、およびガードレールなどの手法は、これらの特定のユースケースの一般化モデルを調整する上で重要でした。しかし、基礎となるモデルの大幅な改善がこれらのアプリケーションを廃止する可能性があるという心配は常にありました。サム・アルトマンはかつて、モデル機能の大きな飛躍がこれらの革新を「蒸気抑制」できると警告しました。
ただし、列車時間の計算の向上にプラトーが見られる場合、すぐに追い越されるという脅威は減少します。 TTCの最適化からモデルのパフォーマンスの改善がもたらされる世界では、アプリケーション層プレーヤーにとって新しい機会が現れる可能性があります。構造化された迅速な最適化、潜在的な認識の推論戦略、効率的なサンプリング手法などのイノベーションは、特定の垂直で大きなパフォーマンスの向上を提供する可能性があります。
これらの改善は、OpenaiのGPT-4OやDeepSeek-R1などの推論に焦点を当てたモデルに特に関連しており、応答に数秒かかる可能性があります。リアルタイムアプリケーションでは、特定のドメイン内でレイテンシを削減し、推論の品質を向上させると、競争力が得られる可能性があります。その結果、深いドメインの知識を持つ企業は、推論効率と微調整出力を最適化する上で重要な役割を果たす可能性があります。
Deepseekの作品は、モデルの品質を向上させるために、より事前トレーニングのみに依存することから遠ざかることを示しています。代わりに、TTCはますます重要になっています。 Deepseekのモデルが精査のためにエンタープライズソフトウェアで広く採用されるかどうかは不明ですが、他のモデルの改善への影響はより明白になりつつあります。
Deepseekの革新は、確立されたAI Labsが同様の手法を採用するように促し、既存のハードウェアの利点を補完していると考えています。モデルコストの予測される低下は、より多くのモデルの使用を促進しているようで、Jevonsのパラドックスパターンに適合しています。
Pashootan Vaezipoorは、Georgianの技術的なリードです。
関連記事
前Deepseeker和合作者發布了新的培訓可靠AI代理的方法:Ragen
人工智能代理年度:仔細研究2025年的期望和現實2025年被許多專家預示為當年的AI代理商(由高級大型語言和多式聯運公司提供支持的AI代理商),來自OpenAI,Anthropic,Google和Google和Deepseek等公司,最終將帶上中心中心中心中心。
DeepSeek的AIS發現了真正的人類慾望
DeepSeek在AI獎勵模型中的突破性:加強AI推理和響應中國AI初創公司DeepSeek與Tsinghua University合作,在AI研究中取得了重要的里程碑。他們對AI獎勵模型的創新方法有望徹底改變AI系統的學習方式
研究人員以低於50美元的價格開發了OpenAI $ 50“推理”模型的開源競爭對手
上週五,斯坦福大學和華盛頓大學的AI專家的一份開創性的研究論文襲擊了現場,透露,他們設法開發了一種被稱為S1的AI“推理”模型,以低於50美元的雲計算學分。 S1擁有自己的AI世界,這種啟示正在震撼AI世界
コメント (30)
0/200
JohnRoberts
2025年4月18日 12:09:37 GMT
DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻
0
WalterWhite
2025年4月18日 12:09:37 GMT
DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻
0
RogerPerez
2025年4月18日 12:09:37 GMT
DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻
0
PatrickMartinez
2025年4月18日 12:09:37 GMT
O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻
0
ScottPerez
2025年4月18日 12:09:37 GMT
El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻
0
SophiaCampbell
2025年4月18日 17:57:57 GMT
DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀
0






AI業界は絶え間ない流動性のある状態にあり、2025年は物事を揺さぶっているゲームを変える開発をもたらしています。中国のAIラボであるDeepseekが、Nvidiaの在庫に17%のDIPを引き起こし、他のAIデータセンター在庫に影響を与えた新しいモデルで爆弾を落としたときに、1つの大きなシェイクアップが起こりました。 Deepseekのモデルの周りの話題?他の米国の競合他社のコストの数分の1で一流のパフォーマンスを提供し、これがAIデータセンターの将来にとって何を意味するかについて嵐を巻き起こしています。
しかし、DeepSeekが本当にしていることを実際に手に入れるには、ズームアウトして全体像を見る必要があります。 AIの世界は、トレーニングデータの不足に取り組んでいます。大手プレーヤーはすでにほとんどのパブリックインターネットデータを噛んでいます。つまり、トレーニング前の改善で壁にぶつかります。その結果、業界の変化するギアは「テスト時間計算」(TTC)に向けられます。 AIモデルは、Openaiの「O」シリーズのように、回答する前に「考える」ために少し時間がかかると考えてください。 TTCがトレーニング前にかつて行ったのと同じ種類のスケーリングの改善を提供し、AIブレークスルーの次の大きな波を潜在的に導くことができるという希望があります。
これらのシフトは、2つの大きな変更を示しています。最初に、より小さな予算のラボがゲームに登場し、最先端のモデルを出します。第二に、TTCはAIを前進させるための新しいフロンティアになりつつあります。これらの傾向と、AIの風景と市場にとって何を意味するのかを分解しましょう。
AI業界への影響
TTCへの移行と推論モデル間の競争におけるランプアップは、ハードウェア、クラウドプラットフォーム、ファンデーションモデル、エンタープライズソフトウェアのいくつかの面でAIランドスケープを再構築できると考えています。
1。ハードウェア(GPU、専用のチップ、およびインフラストラクチャの計算)
TTCへの移行は、ハードウェアAI企業に必要なものとそれを管理する方法を変更する可能性があります。トレーニングのために絶え間ないGPUクラスターにお金を注ぐ代わりに、彼らはTTCの要求を処理するために推論機能を強化することにもっと焦点を合わせ始めるかもしれません。 GPUは依然として推論にとって重要ですが、トレーニングと推論ワークロードの違いは、これらのチップのセットアップと使用方法に影響を与える可能性があります。推論ワークロードはより予測不可能で「スパイキー」であるため、容量の計画はよりトリックになる可能性があります。
また、このシフトは、ASICのような低遅延の推論用に特別に設計されたハードウェアの市場を後押しする可能性があると考えています。 TTCがトレーニング能力よりも重要になると、汎用GPUの治世が衰え始め、専門的な推論チップメーカーのドアを開きます。
2。クラウドプラットフォーム:ハイパースカラー(AWS、Azure、GCP)およびクラウドコンピューティング
正確性の問題は別として、企業でのAI採用の大きなハードルの1つは、推論APIの信頼性です。一貫性のない応答時間、レート制限、同時リクエストの問題などは、真の頭痛の種になる可能性があります。 TTCはこれらの問題をさらに悪化させる可能性があります。このシナリオでは、これらの問題に取り組むために高品質のサービス(QoS)を保証できるクラウドプロバイダーが大きな脚を上げる可能性があります。
興味深いことに、新しい方法はAIをより効率的にする可能性がありますが、ハードウェアの需要を減らすことはできません。より効率がより多くの消費につながるJevons Paradoxに続いて、より効率的な推論モデルは、より多くの開発者を推論モデルを使用するように駆り立て、コンピューティングパワーの必要性を高めます。最近のモデルの改善は、推論とより小規模な専門モデルトレーニングの両方に対して、クラウドAI計算の需要を高める可能性があると考えています。
3.ファンデーションモデルプロバイダー(Openai、人類、coも、Deepseek、Mistral)
Deepseekのような新規参入者が、わずかなコストで大きな銃でつま先につま先に行くことができれば、独自の事前訓練モデルの拠点が崩れ始めるかもしれません。また、トランスモデルのTTCのイノベーションが増えることも期待でき、DeepSeekが示しているように、これらの革新はAIの通常の容疑者以外の予期しない場所から来る可能性があります。
4。エンタープライズAIの採用とSaaS(アプリケーションレイヤー)
中国でのDeepseekのルーツを考えると、セキュリティとプライバシーの観点から彼らの製品を継続的に精査することができます。彼らの中国に拠点を置くAPIおよびチャットボットサービスは、米国、カナダ、またはその他の西側諸国のエンタープライズAIの顧客と対処する可能性は低いです。多くの企業はすでにDeepSeekのウェブサイトとアプリをブロックしています。西部のデータセンターの第三者がホストした場合でも、Deepseekのモデルは精査に直面する可能性があり、企業での採用を制限する可能性があります。研究者は、ジェイルブレイク、バイアス、有害なコンテンツ生成などの問題にフラグを立てています。一部の企業はDeepSeekのモデルを実験するかもしれませんが、これらの懸念のために広範な採用はありそうにないようです。
別の注意として、垂直の専門化が根拠を獲得しています。過去には、Foundationモデルに基づいて構築された垂直アプリケーションは、すべてテーラードワークフローの作成に関するものでした。検索された生成(RAG)、モデルルーティング、関数呼び出し、およびガードレールなどの手法は、これらの特定のユースケースの一般化モデルを調整する上で重要でした。しかし、基礎となるモデルの大幅な改善がこれらのアプリケーションを廃止する可能性があるという心配は常にありました。サム・アルトマンはかつて、モデル機能の大きな飛躍がこれらの革新を「蒸気抑制」できると警告しました。
ただし、列車時間の計算の向上にプラトーが見られる場合、すぐに追い越されるという脅威は減少します。 TTCの最適化からモデルのパフォーマンスの改善がもたらされる世界では、アプリケーション層プレーヤーにとって新しい機会が現れる可能性があります。構造化された迅速な最適化、潜在的な認識の推論戦略、効率的なサンプリング手法などのイノベーションは、特定の垂直で大きなパフォーマンスの向上を提供する可能性があります。
これらの改善は、OpenaiのGPT-4OやDeepSeek-R1などの推論に焦点を当てたモデルに特に関連しており、応答に数秒かかる可能性があります。リアルタイムアプリケーションでは、特定のドメイン内でレイテンシを削減し、推論の品質を向上させると、競争力が得られる可能性があります。その結果、深いドメインの知識を持つ企業は、推論効率と微調整出力を最適化する上で重要な役割を果たす可能性があります。
Deepseekの作品は、モデルの品質を向上させるために、より事前トレーニングのみに依存することから遠ざかることを示しています。代わりに、TTCはますます重要になっています。 Deepseekのモデルが精査のためにエンタープライズソフトウェアで広く採用されるかどうかは不明ですが、他のモデルの改善への影響はより明白になりつつあります。
Deepseekの革新は、確立されたAI Labsが同様の手法を採用するように促し、既存のハードウェアの利点を補完していると考えています。モデルコストの予測される低下は、より多くのモデルの使用を促進しているようで、Jevonsのパラドックスパターンに適合しています。
Pashootan Vaezipoorは、Georgianの技術的なリードです。



DeepSeek's new model is shaking things up, but I'm not sure if it's all that. It's interesting how they're focusing on compute at inference, but I'm still waiting to see real-world results. 🤔💻




DeepSeekの新しいモデルは話題になっていますが、正直よくわかりません。推論時の計算に焦点を当てているのは面白いですが、実際の結果を見るまで待ちます。🤔💻




DeepSeek의 새로운 모델이 화제가 되고 있지만, 솔직히 잘 모르겠어요. 추론 시의 계산에 집중하는 건 흥미롭지만, 실제 결과를 보기 전까지는 기다려야 할 것 같아요. 🤔💻




O novo modelo da DeepSeek está causando um impacto, mas não tenho certeza se é tudo isso. É interessante focar no cálculo durante a inferência, mas ainda estou esperando pelos resultados reais. 🤔💻




El nuevo modelo de DeepSeek está dando que hablar, pero no estoy seguro de que sea para tanto. Es interesante que se enfoquen en el cálculo durante la inferencia, pero aún espero ver resultados reales. 🤔💻




DeepSeek really shook the AI world with their new model! Nvidia's stock took a hit, but honestly, it's exciting to see such big moves. It's like watching a sci-fi movie unfold in real-time. Can't wait to see where this leads, but more compute at inference? Sounds pricey! 🚀












