オプション
ニュース
Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表

Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表

2025年10月24日
1

グーグルは、3月に発表され5月に機能強化されたフラッグシップモデルGemini 2.5 Proのプレビュー版を発表した。同社がこれまでで「最もインテリジェントな」AIと説明するこの反復は、現在プレビュー中で、数週間以内に一般提供が開始される予定だ。

企業は現在、Gemini 2.5 Proの更新された「I/O版」を使用して、新しいアプリケーションの開発や既存の実装のアップグレードを試すことができる。Googleの公式発表によると、このバージョンは、以前のバージョンと比較して、より想像力豊かな反応を実現し、プログラミングと論理的推論において優れた能力を発揮する。

最新のGemini 2.5 Proアップデートがプレビューになりました。

コーディング、推論、科学+数学に優れ、主要なベンチマーク(AIDER Polyglot、GPQA、HLEなど)でパフォーマンスの向上を示し、@lmarena_aiをリードして、前バージョンから24ptもEloスコアが跳ね上がりました。

また... pic.twitter.com/SVjdQ2k1tJ

- スンダー・ピチャイ (@sundarpichai) 2025年6月5日

グーグルは5月の開発者会議で、Gemini 2.5 Proの、以前のサイレントリリースを上回る機能強化を明らかにした。Google DeepMindのCEOであるデミス・ハサビスは、I/O版を同社がこれまでで最も先進的なコーディングモデルであると強調した。

Gemini 2.5 Pro Preview 06-05 Thinkingと名付けられたこの最新のプレビューは、I/O版の機能を超えて進化している。近日公開予定のリリースは、エンタープライズグレードのパフォーマンスとスケーラビリティを約束するものである。

オリジナルのI/O版(gemini-2.5-pro-preview-05-06)は、5月にGoogle AI StudioとVertex AIを通じて開発者と企業がアクセスできるようになった。強化されたGemini 2.5 Pro Preview 06-05 Thinkingは、これらの同じチャネルを通じて入手可能である。

パフォーマンス指標

このアップグレードされたGemini 2.5 Proは、前モデルと比較して測定可能な改善を示している。

Googleは、LMArenaで24ポイント、WebDevArenaで35ポイントの向上を報告し、競合他社のランキングをリードしている。比較テストでは、OpenAIのo3、o3-mini、およびo4-mini、AnthropicのClaude 4 Opus、xAIのGrok 3 Beta、およびDeepSeek R1を含むモデルに対する優れたパフォーマンスが明らかになりました。

「また、以前の2.5 Proリリースからのフィードバックに対応し、スタイルと構造を改善しました。

企業が期待すること

Googleの迅速なGemini 2.5 Proの機能強化は複雑に見えるかもしれないが、同社はそれらをユーザーの入力に対する直接的な反応と位置付けている。新バージョンの価格体系は、入力トークン100万個あたり125ドル(キャッシュなし)、出力トークン100万個あたり10ドルである。

Gemini 2.5 Proが3月にデビューしたとき、業界関係者はGemini 2.5 Proが十分に活用されていない先進モデルであると認識した。それ以来グーグルは、回答を生成する前に複数の仮説を評価する "Deep Think "機能など、数多くのアプリケーションにこの技術を組み込んでいる。

Gemini 2.5 Proのリリースとその後のアップグレードは、競争力のある大規模言語モデルの状況におけるグーグルの地位を強化し、DeepSeekとOpenAIによるライバルの推論モデルから注目を取り戻した。

発表から数時間以内に、開発者はアップデートされたGemini 2.5 Proのテストを開始した。初期の印象では、Googleの主張するパフォーマンスの加速が確認されたが、強化された機能の包括的な評価はまだ継続中である。

Gemini 2.5 Pro Preview 06-05 "の最初の1時間

良い点

- より速くなった
- より多くの出力が得られる
- マクロプレイがより良くなった(複数ファイルの編集、より良い概要)
- 出力構造が改善された(読みやすい)
- より簡潔で、謝罪が少ない!

以前は"あなたは絶対に...

- Patrick Bade (@nishffx) 2025年6月5日

アプリビルダーを本当に楽しんでいる。

ゲームを作ってテストしてみたんだけど、imagenを使ってその場でアセットを作ることができたよ。本当に最高のコード不要のアプリビルダーだ。

バイブアプリマーケットプレイスを構築し続けよう。

- bone (@boneGPT) 2025年6月5日

Gemini 2.5 Pro Previewはかなり良い。昨日、深いリサーチのために使ったが、結果はいくつかの大手よりも良い。

- ヤナック (@janaks09) 2025年6月5日

関連記事
Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表 Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表 グーグルは、3月に発表され5月に機能強化されたフラッグシップモデルGemini 2.5 Proのプレビュー版を発表した。同社がこれまでで「最もインテリジェントな」AIと説明するこの反復は、現在プレビュー中で、数週間以内に一般提供が開始される予定だ。企業は現在、Gemini 2.5 Proの更新された「I/O版」を使用して、新しいアプリケーションの開発や既存の実装のアップグレードを試すことができる。
グーグル、ホームアプリのソフトローンチで9つのエキサイティングな新機能を紹介 グーグル、ホームアプリのソフトローンチで9つのエキサイティングな新機能を紹介 Google Homeアプリ、2025年プレビュー版で大幅なアップデートを公開グーグルは、現在公開中のプレビュー版で利用可能ないくつかの画期的な機能により、Homeアプリを大幅に強化した。スマートホームの愛好家は、Google TVデバイスでNest Camのピクチャー・イン・ピクチャー機能を楽しめるようになり、テレビ画面で直接セキュリティ・フィードを便利に監視できるようになった。この待望の機能は
Google Geminiチャットボット、GitHubプロジェクト分析機能を強化 Google Geminiチャットボット、GitHubプロジェクト分析機能を強化 Gemini AdvancedがGitHubとの連携を統合GoogleのプレミアムGemini Advanced契約者(月額20ドル)は、水曜日からGitHubのリポジトリをAIアシスタントに直接リンクできるようになった。この統合により、ユーザーは新しい関数の生成から問題のある部分のトラブルシューティングまで、コードベース全体でGeminiの機能を活用することができる。接続プロセスは合理化されてい
コメント (0)
0/200
トップに戻ります
OR