Googleは新しいチップを発表して主要な隠しaiコストを削減します

Google Cloud Next 25イベントで、Googleは最新のTensor Processing Unit(TPU)であるIronwoodを発表しました。この新チップは、Googleの焦点がトレーニングから推論へと大きくシフトしたことを示しています。従来、TPUはAI専門家やデータサイエンティストが主導するニューラルネットワークのトレーニングに使用されてきました。しかし、Ironwoodでは、Googleは数百万、場合によっては数十億のユーザーのリアルタイム予測ニーズをターゲットにしています。
Ironwood TPU
Ironwood TPUの発売は、AI業界において実験的プロジェクトからビジネスによるAIモデルの実際の応用へと焦点が移っている重要な時期に起こりました。GoogleのGeminiのような高度なAIモデルが推論能力を向上させる中、推論時の計算需要が急増しています。このシフトはコストを押し上げており、GoogleはIronwoodの説明で次のように述べています:「推論と多段階推論が、計算の増分需要——したがってコスト——をトレーニングから推論時間(テスト時間スケーリング)に移しています。」Ironwoodは、特にコストが増大する推論の領域での性能と効率の最適化に対するGoogleのコミットメントを表しています。
推論チップ
GoogleのTPUの歴史は10年以上にわたり、Ironwood以前に6世代が存在しました。トレーニングチップは少量生産ですが、推論チップは訓練済みモデルから日常的な予測を必要とする幅広いユーザーを対象とし、高量市場です。以前、Googleの6世代目TPUであるTrilliumは、トレーニングと推論の両方に対応可能とされていました。しかし、Ironwoodが主に推論に焦点を当てていることは、この二目的アプローチからの顕著な変化を示しています。
必要な投資
この焦点の変化は、GoogleがIntel、AMD、Nvidiaなどの外部チップメーカーに依存する姿勢の変化を示す可能性があります。歴史的に、これらのベンダーはKeyBanc Capital Marketsによると、Googleのクラウドコンピューティング運用で使用されるプロセッサの99%を占めていました。独自のTPUに投資することで、Googleはこれらのサプライヤーへの依存を減らし、AIインフラのコスト上昇を抑えることを目指している可能性があります。DA DavidsonのGil Luriaなどの株アナリストは、GoogleがTPUをNvidiaの顧客に直接販売した場合、昨年最大240億ドルの収益を上げていた可能性があると推定しています。
Ironwood vs. Trillium
Googleはイベントで、IronwoodがTrilliumに対する技術的優位性を示しました。Ironwoodはワットあたり2倍の性能を誇り、毎秒29.3兆の浮動小数点演算を達成します。また、192GBの高帯域幅メモリ(HBM)を搭載し、これはTrilliumの6倍、メモリ帯域幅は毎秒7.2テラビットで、4.5倍高いです。これらの強化は、Googleが述べたように、「Ironwoodは、大量のテンソル操作を実行しながら、チップ上のデータ移動とレイテンシを最小限に抑えるように設計されています。」テンソル操作中のデータ移動を促進し、レイテンシを削減することを目的としています。
AIインフラのスケーリング
メモリと帯域幅の進歩は、GoogleのAIインフラをスケーリングする戦略の中心です。スケーリングは、グループ化されたチップを効率的に活用して並列に問題を解決し、性能と利用率を向上させることを含みます。これは経済的な理由から重要であり、利用率が高いほど高コストなリソースの無駄が減ります。Googleは以前、Trilliumが数十万のチップにスケールする能力を強調しましたが、同様に、Ironwoodが「数十万のIronwoodチップを組み合わせてGenAI計算のフロンティアを急速に進める」能力を強調しました。
ハードウェアの発表と同時に、GoogleはPathways on Cloudも紹介しました。これは、AIコンピューティングタスクを異なるマシンに分散するソフトウェアソリューションです。以前は内部で使用されていたこのソフトウェアは、現在一般公開されており、GoogleのAIインフラの能力をさらに強化しています。
関連記事
OpenAIのCEOアルトマン氏、パニックに駆られたマーケティング戦略を展開するAnthropicを痛烈に批判
AI業界のリーダーであるOpenAIとAnthropicの間で続いている公開の論争が激化している。OpenAIのCEOであるサム・アルトマン氏は先日、ポッドキャストの中で、競合他社の最新の安全モデルに異議を唱えた。アルトマン氏は、Anthropicがテクノロジーに対する世間の不安を利用し、自社製品の実際の能力を過大評価していると主張している。彼はこのアプローチを、真の安全対策というよりはマーケティ
カーソルAIコーディングスタートアップ、スペースXからの多額の投資を受け、アジア太平洋地域で200人を採用へ
AIコーディングスタートアップのCursorは、大規模なグローバル展開を発表し、今後6か月間でアジア太平洋地域全体で200名の従業員を採用する計画だ。主な職種には、マーケティングエンジニア、フィールドエンジニア、AI導入エンジニアなどが含まれる。この動きは、サンフランシスコを拠点とするこのユニコーン企業が、自社の基盤技術を国際市場に展開しようとする取り組みを裏付けるものである。現在、Cursor
Claudeがマルウェア入りnpmパッケージの作成に悪用される:670件以上が侵害され、オープンソースが脅威にさらされる
最近のサイバーセキュリティインシデントにより、大規模言語モデル(LLM)が悪意のあるソフトウェア開発のために悪用されている実態が明らかになった。セキュリティ研究者のSibi Moosa氏は、「mousie-5212-super-formatter」という別名を使用する攻撃者が、Anthropic社のAI「Claude」を利用して有害なコードを生成し、npmパッケージエコシステムを汚染していることを
関連特集おすすめ
コメント (18)
0/500
Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎
Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔
Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.
Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞

Google Cloud Next 25イベントで、Googleは最新のTensor Processing Unit(TPU)であるIronwoodを発表しました。この新チップは、Googleの焦点がトレーニングから推論へと大きくシフトしたことを示しています。従来、TPUはAI専門家やデータサイエンティストが主導するニューラルネットワークのトレーニングに使用されてきました。しかし、Ironwoodでは、Googleは数百万、場合によっては数十億のユーザーのリアルタイム予測ニーズをターゲットにしています。
Ironwood TPU
Ironwood TPUの発売は、AI業界において実験的プロジェクトからビジネスによるAIモデルの実際の応用へと焦点が移っている重要な時期に起こりました。GoogleのGeminiのような高度なAIモデルが推論能力を向上させる中、推論時の計算需要が急増しています。このシフトはコストを押し上げており、GoogleはIronwoodの説明で次のように述べています:「推論と多段階推論が、計算の増分需要——したがってコスト——をトレーニングから推論時間(テスト時間スケーリング)に移しています。」Ironwoodは、特にコストが増大する推論の領域での性能と効率の最適化に対するGoogleのコミットメントを表しています。
推論チップ
GoogleのTPUの歴史は10年以上にわたり、Ironwood以前に6世代が存在しました。トレーニングチップは少量生産ですが、推論チップは訓練済みモデルから日常的な予測を必要とする幅広いユーザーを対象とし、高量市場です。以前、Googleの6世代目TPUであるTrilliumは、トレーニングと推論の両方に対応可能とされていました。しかし、Ironwoodが主に推論に焦点を当てていることは、この二目的アプローチからの顕著な変化を示しています。
必要な投資
この焦点の変化は、GoogleがIntel、AMD、Nvidiaなどの外部チップメーカーに依存する姿勢の変化を示す可能性があります。歴史的に、これらのベンダーはKeyBanc Capital Marketsによると、Googleのクラウドコンピューティング運用で使用されるプロセッサの99%を占めていました。独自のTPUに投資することで、Googleはこれらのサプライヤーへの依存を減らし、AIインフラのコスト上昇を抑えることを目指している可能性があります。DA DavidsonのGil Luriaなどの株アナリストは、GoogleがTPUをNvidiaの顧客に直接販売した場合、昨年最大240億ドルの収益を上げていた可能性があると推定しています。
Ironwood vs. Trillium
Googleはイベントで、IronwoodがTrilliumに対する技術的優位性を示しました。Ironwoodはワットあたり2倍の性能を誇り、毎秒29.3兆の浮動小数点演算を達成します。また、192GBの高帯域幅メモリ(HBM)を搭載し、これはTrilliumの6倍、メモリ帯域幅は毎秒7.2テラビットで、4.5倍高いです。これらの強化は、Googleが述べたように、「Ironwoodは、大量のテンソル操作を実行しながら、チップ上のデータ移動とレイテンシを最小限に抑えるように設計されています。」テンソル操作中のデータ移動を促進し、レイテンシを削減することを目的としています。
AIインフラのスケーリング
メモリと帯域幅の進歩は、GoogleのAIインフラをスケーリングする戦略の中心です。スケーリングは、グループ化されたチップを効率的に活用して並列に問題を解決し、性能と利用率を向上させることを含みます。これは経済的な理由から重要であり、利用率が高いほど高コストなリソースの無駄が減ります。Googleは以前、Trilliumが数十万のチップにスケールする能力を強調しましたが、同様に、Ironwoodが「数十万のIronwoodチップを組み合わせてGenAI計算のフロンティアを急速に進める」能力を強調しました。
ハードウェアの発表と同時に、GoogleはPathways on Cloudも紹介しました。これは、AIコンピューティングタスクを異なるマシンに分散するソフトウェアソリューションです。以前は内部で使用されていたこのソフトウェアは、現在一般公開されており、GoogleのAIインフラの能力をさらに強化しています。
OpenAIのCEOアルトマン氏、パニックに駆られたマーケティング戦略を展開するAnthropicを痛烈に批判
AI業界のリーダーであるOpenAIとAnthropicの間で続いている公開の論争が激化している。OpenAIのCEOであるサム・アルトマン氏は先日、ポッドキャストの中で、競合他社の最新の安全モデルに異議を唱えた。アルトマン氏は、Anthropicがテクノロジーに対する世間の不安を利用し、自社製品の実際の能力を過大評価していると主張している。彼はこのアプローチを、真の安全対策というよりはマーケティ
カーソルAIコーディングスタートアップ、スペースXからの多額の投資を受け、アジア太平洋地域で200人を採用へ
AIコーディングスタートアップのCursorは、大規模なグローバル展開を発表し、今後6か月間でアジア太平洋地域全体で200名の従業員を採用する計画だ。主な職種には、マーケティングエンジニア、フィールドエンジニア、AI導入エンジニアなどが含まれる。この動きは、サンフランシスコを拠点とするこのユニコーン企業が、自社の基盤技術を国際市場に展開しようとする取り組みを裏付けるものである。現在、Cursor
Claudeがマルウェア入りnpmパッケージの作成に悪用される:670件以上が侵害され、オープンソースが脅威にさらされる
最近のサイバーセキュリティインシデントにより、大規模言語モデル(LLM)が悪意のあるソフトウェア開発のために悪用されている実態が明らかになった。セキュリティ研究者のSibi Moosa氏は、「mousie-5212-super-formatter」という別名を使用する攻撃者が、Anthropic社のAI「Claude」を利用して有害なコードを生成し、npmパッケージエコシステムを汚染していることを
Wow, Google's Ironwood TPU sounds like a game-changer for AI inference! Focusing on efficiency could really shake up the cost dynamics. Curious how this stacks against NVIDIA’s offerings—any bets on who’ll dominate the market? 😎
Whoa, Google's Ironwood TPU sounds like a game-changer for AI inference! Cutting costs like that could really shake up the cloud market. Anyone else curious how this stacks up against Nvidia’s gear? 🤔
Google's new Ironwood chip sounds like a game-changer for AI inference! 🚀 Excited to see how it cuts costs and boosts efficiency.
Googleの新しいIronwood TPUはAIコストを変えるものですね!今は推論に重点を置いているのがかっこいいけど、トレーニングの側面も気になります。でも、隠れたコストを削減できるなら賛成です。トレーニング部分も改善し続けてほしいですね!🤞





家






