Googleは、高度なAI推論モデルファミリーを立ち上げます

火曜日に、GoogleはGemini 2.5を展開しました。これは、回答を出す前に一瞬「考える」新しいAIモデルのセットです。まるで人間の私たちを真似しようとしているみたいですよね?
先頭に立つのはGemini 2.5 Pro Experimentalで、Googleがこれまでで最も賢いモデルと宣伝しています。このすごい奴はマルチモーダルで、推論タスクをバッチリこなせます。火曜日からGoogle AI Studioで試すことができますし、Gemini Advancedに月額20ドルを払っているなら、Geminiアプリを通じてアクセス可能です。
Googleは推論に関する取り組みにかなり本気で、将来のすべてのAIモデルにこれを組み込む予定です。
2024年9月にOpenAIが最初のAI推論モデルo1を発表して以来、テック業界は追いつくために大忙しです。今、Anthropic、DeepSeek、Google、xAIがそれぞれ独自の推論モデルで競争に参加しています。これらのモデルは、事実を再確認し、問題をじっくり考えるために少し時間と計算能力を必要とします。
推論技術は、AIにとって特に数学やコーディングにおいて革新的な変化をもたらしました。テック業界の多くの人々は、これらの推論モデルがAIエージェント—人間が常に見守らなくても動作できる自律システム—にとって重要になると考えています。ただ、コストも高めですけどね。
Googleはこの分野に慣れ親しんでいます。以前にも、12月にリリースした「考える」バージョンのGeminiのような推論モデルを試してきました。でも、Gemini 2.5? これはOpenAIの「o」シリーズを超えるための大きな一撃です。
Googleは、Gemini 2.5 Proがこれまでのモデルや競合のトップモデルを多くのベンチマークで上回っていると主張しています。彼らは、Gemini 2.5を、視覚的に魅力的なウェブアプリや独自に動作するコーディングプロジェクトで圧倒的な成果を上げるように調整しました。
コード編集のAider Polyglotテストでは、Gemini 2.5 Proは68.6%の堅実なスコアを獲得し、OpenAI、Anthropic、DeepSeekの最高モデルを上回りました。しかし、ソフトウェア開発のSWE-bench Verifiedテストでは63.8%を記録—OpenAIのo3-miniやDeepSeekのR1を上回るには十分でしたが、AnthropicのClaude 3.7 Sonnetの70.3%には及ばなかったです。
そして、数学、人文、科学に関する何千もの質問を含む厳しいマルチモーダルテスト、Humanity's Last Examでは、Gemini 2.5 Proは18.8%を達成し、他のビッグネームのほとんどのモデルを上回りました。
Gemini 2.5 Proは、最初から100万トークンのコンテキストウィンドウを備えています—まるで「ロード・オブ・ザ・リング」シリーズ全体を一気に読むようなものです。そして、近いうちにこれを200万トークンに倍増する予定です。
GoogleはAPIの価格についてはまだ明らかにしていませんが、数週間以内には詳細を公開すると約束しています。
関連記事
グーグルの最新AIモデル「ジェミニ」、テストで安全性スコアが低下
グーグルの内部テストにより、最新AIモデルの安全性プロトコルのパフォーマンスが、以前のバージョンと比較して低下していることが明らかになった。新たに公表されたベンチマークによると、Gemini 2.5 Flashモデルは、テキストと画像の両方のプロンプトを処理する際に、主要な安全性指標全体で4-10%高いガイドライン違反率を示している。テクノロジージャイアントの自動化された評価は、憂慮すべき傾向を浮
GoogleのStitch AIがアプリのデザインプロセスを簡素化
グーグル、I/O 2025でAIデザインツール「Stitch」を発表グーグルは、Google I/O 2025の基調講演で、AIを活用した画期的なインターフェイスデザインツールStitchを発表した。この革新的なソリューションは、自然言語によるプロンプトや参照画像を、制作可能なHTMLとCSSコードを含む完全に機能的なUIデザインに変換します。Stitchのデュアルモデルアーキテクチャは、異なるデ
グーグル、Gmail、Docs、VidsにAI搭載ツールを導入
グーグル、I/O 2025でAIを活用したワークスペースのアップデートを発表グーグルは、年次開発者会議において、Workspaceスイートに導入される革新的なAI機能強化を発表した。このアップデートは、生産性アプリケーション全体のインテリジェントな自動化と合理化されたワークフローに焦点を当てている。画像クレジットグーグルGmailのスマートな生産性機能メールサービスには2つの画期的な機能が追加され
コメント (37)
0/200
JasonRamirez
2025年8月24日 22:01:19 JST
Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.
0
EricMiller
2025年8月10日 18:01:00 JST
Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.
0
RonaldMartinez
2025年4月24日 13:43:27 JST
Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔
0
RalphHill
2025年4月22日 23:53:21 JST
O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭
0
HenryJackson
2025年4月20日 15:08:13 JST
ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭
0
JerryGonzález
2025年4月19日 21:28:17 JST
ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔
0
火曜日に、GoogleはGemini 2.5を展開しました。これは、回答を出す前に一瞬「考える」新しいAIモデルのセットです。まるで人間の私たちを真似しようとしているみたいですよね?
先頭に立つのはGemini 2.5 Pro Experimentalで、Googleがこれまでで最も賢いモデルと宣伝しています。このすごい奴はマルチモーダルで、推論タスクをバッチリこなせます。火曜日からGoogle AI Studioで試すことができますし、Gemini Advancedに月額20ドルを払っているなら、Geminiアプリを通じてアクセス可能です。
Googleは推論に関する取り組みにかなり本気で、将来のすべてのAIモデルにこれを組み込む予定です。
2024年9月にOpenAIが最初のAI推論モデルo1を発表して以来、テック業界は追いつくために大忙しです。今、Anthropic、DeepSeek、Google、xAIがそれぞれ独自の推論モデルで競争に参加しています。これらのモデルは、事実を再確認し、問題をじっくり考えるために少し時間と計算能力を必要とします。
推論技術は、AIにとって特に数学やコーディングにおいて革新的な変化をもたらしました。テック業界の多くの人々は、これらの推論モデルがAIエージェント—人間が常に見守らなくても動作できる自律システム—にとって重要になると考えています。ただ、コストも高めですけどね。
Googleはこの分野に慣れ親しんでいます。以前にも、12月にリリースした「考える」バージョンのGeminiのような推論モデルを試してきました。でも、Gemini 2.5? これはOpenAIの「o」シリーズを超えるための大きな一撃です。
Googleは、Gemini 2.5 Proがこれまでのモデルや競合のトップモデルを多くのベンチマークで上回っていると主張しています。彼らは、Gemini 2.5を、視覚的に魅力的なウェブアプリや独自に動作するコーディングプロジェクトで圧倒的な成果を上げるように調整しました。
コード編集のAider Polyglotテストでは、Gemini 2.5 Proは68.6%の堅実なスコアを獲得し、OpenAI、Anthropic、DeepSeekの最高モデルを上回りました。しかし、ソフトウェア開発のSWE-bench Verifiedテストでは63.8%を記録—OpenAIのo3-miniやDeepSeekのR1を上回るには十分でしたが、AnthropicのClaude 3.7 Sonnetの70.3%には及ばなかったです。
そして、数学、人文、科学に関する何千もの質問を含む厳しいマルチモーダルテスト、Humanity's Last Examでは、Gemini 2.5 Proは18.8%を達成し、他のビッグネームのほとんどのモデルを上回りました。
Gemini 2.5 Proは、最初から100万トークンのコンテキストウィンドウを備えています—まるで「ロード・オブ・ザ・リング」シリーズ全体を一気に読むようなものです。そして、近いうちにこれを200万トークンに倍増する予定です。
GoogleはAPIの価格についてはまだ明らかにしていませんが、数週間以内には詳細を公開すると約束しています。



Whoa, Google’s Gemini 2.5 sounds like it’s got a brain of its own, pausing to ‘think’ before answering! 😮 Makes me wonder if it’ll outsmart us at pub quizzes soon. Cool tech, but I hope it doesn’t start overanalyzing my bad jokes.




Google's Gemini 2.5 sounds like a brainy upgrade! I wonder if it’ll outsmart my math homework. 🤓 Excited to see how it stacks up against other AI models.




Gemini 2.5 is pretty cool! It's like it pauses to think before answering, which is kinda human-like. I tried it out and it's definitely smarter than the last version. Only thing is, sometimes it takes too long to respond, but hey, I guess that's the price of deep thinking! 🤔




O Gemini 2.5 é bem legal, mas às vezes demora muito para 'pensar'. Entendo que está tentando ser mais humano, mas quando preciso de respostas rápidas, é um pouco frustrante. Ainda assim, é mais inteligente que a maioria dos AIs por aí! 🤖💭




ジェミニ2.5は結構クールだけど、時々「考える」のに時間がかかりすぎる。もっと人間っぽくなるのは分かるけど、早く答えが欲しい時はちょっとイライラする。でも、他のAIより賢いからね!🤖💭




ジェミニ2.5、面白いですね!回答前に少し考えるのが人間っぽくて好きです。試してみたら前より賢くなってるのがわかりました。ただ、時々レスポンスが遅いのが気になりますが、深く考えるための代償だと思えば許せますね!🤔












