オプション
ニュース
Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表

Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表

2025年10月24日
110

グーグルは、3月に発表され5月に機能強化されたフラッグシップモデルGemini 2.5 Proのプレビュー版を発表した。同社がこれまでで「最もインテリジェントな」AIと説明するこの反復は、現在プレビュー中で、数週間以内に一般提供が開始される予定だ。

企業は現在、Gemini 2.5 Proの更新された「I/O版」を使用して、新しいアプリケーションの開発や既存の実装のアップグレードを試すことができる。Googleの公式発表によると、このバージョンは、以前のバージョンと比較して、より想像力豊かな反応を実現し、プログラミングと論理的推論において優れた能力を発揮する。

最新のGemini 2.5 Proアップデートがプレビューになりました。

コーディング、推論、科学+数学に優れ、主要なベンチマーク(AIDER Polyglot、GPQA、HLEなど)でパフォーマンスの向上を示し、@lmarena_aiをリードして、前バージョンから24ptもEloスコアが跳ね上がりました。

また... pic.twitter.com/SVjdQ2k1tJ

- スンダー・ピチャイ (@sundarpichai) 2025年6月5日

グーグルは5月の開発者会議で、Gemini 2.5 Proの、以前のサイレントリリースを上回る機能強化を明らかにした。Google DeepMindのCEOであるデミス・ハサビスは、I/O版を同社がこれまでで最も先進的なコーディングモデルであると強調した。

Gemini 2.5 Pro Preview 06-05 Thinkingと名付けられたこの最新のプレビューは、I/O版の機能を超えて進化している。近日公開予定のリリースは、エンタープライズグレードのパフォーマンスとスケーラビリティを約束するものである。

オリジナルのI/O版(gemini-2.5-pro-preview-05-06)は、5月にGoogle AI StudioとVertex AIを通じて開発者と企業がアクセスできるようになった。強化されたGemini 2.5 Pro Preview 06-05 Thinkingは、これらの同じチャネルを通じて入手可能である。

パフォーマンス指標

このアップグレードされたGemini 2.5 Proは、前モデルと比較して測定可能な改善を示している。

Googleは、LMArenaで24ポイント、WebDevArenaで35ポイントの向上を報告し、競合他社のランキングをリードしている。比較テストでは、OpenAIのo3、o3-mini、およびo4-mini、AnthropicのClaude 4 Opus、xAIのGrok 3 Beta、およびDeepSeek R1を含むモデルに対する優れたパフォーマンスが明らかになりました。

「また、以前の2.5 Proリリースからのフィードバックに対応し、スタイルと構造を改善しました。

企業が期待すること

Googleの迅速なGemini 2.5 Proの機能強化は複雑に見えるかもしれないが、同社はそれらをユーザーの入力に対する直接的な反応と位置付けている。新バージョンの価格体系は、入力トークン100万個あたり125ドル(キャッシュなし)、出力トークン100万個あたり10ドルである。

Gemini 2.5 Proが3月にデビューしたとき、業界関係者はGemini 2.5 Proが十分に活用されていない先進モデルであると認識した。それ以来グーグルは、回答を生成する前に複数の仮説を評価する "Deep Think "機能など、数多くのアプリケーションにこの技術を組み込んでいる。

Gemini 2.5 Proのリリースとその後のアップグレードは、競争力のある大規模言語モデルの状況におけるグーグルの地位を強化し、DeepSeekとOpenAIによるライバルの推論モデルから注目を取り戻した。

発表から数時間以内に、開発者はアップデートされたGemini 2.5 Proのテストを開始した。初期の印象では、Googleの主張するパフォーマンスの加速が確認されたが、強化された機能の包括的な評価はまだ継続中である。

Gemini 2.5 Pro Preview 06-05 "の最初の1時間

良い点

- より速くなった
- より多くの出力が得られる
- マクロプレイがより良くなった(複数ファイルの編集、より良い概要)
- 出力構造が改善された(読みやすい)
- より簡潔で、謝罪が少ない!

以前は"あなたは絶対に...

- Patrick Bade (@nishffx) 2025年6月5日

アプリビルダーを本当に楽しんでいる。

ゲームを作ってテストしてみたんだけど、imagenを使ってその場でアセットを作ることができたよ。本当に最高のコード不要のアプリビルダーだ。

バイブアプリマーケットプレイスを構築し続けよう。

- bone (@boneGPT) 2025年6月5日

Gemini 2.5 Pro Previewはかなり良い。昨日、深いリサーチのために使ったが、結果はいくつかの大手よりも良い。

- ヤナック (@janaks09) 2025年6月5日

関連記事
Google、インドでChrome向け「Gemini」の提供を開始 Google、インドでChrome向け「Gemini」の提供を開始 水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大 YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大 火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
YouTube、AIを活用した検索機能のテストを開始――ガイド付き回答機能を搭載 YouTube、AIを活用した検索機能のテストを開始――ガイド付き回答機能を搭載 多くのユーザーは、レシピや旅行プランを探す際、関連する動画を探そうとYouTubeを利用しています。今回、YouTubeはテキストと動画コンテンツを融合させた、ステップバイステップの検索結果を表示するAI搭載の対話型検索ツールを導入しました。新しい「Ask YouTube」機能を使えば、ユーザーは「サンフランシスコからサンタバーバラまでの3日間のロードトリップを計画して」といった質問を投げかけ、動
関連特集おすすめ
漫画制作 少年漫画向けトップAIジェネレーター:迫力満点のアクションシーンやエネルギーエフェクトを作成
少年漫画向けトップAIジェネレーター:迫力満点のアクションシーンやエネルギーエフェクトを作成

XIX.AIで、2026年のおすすめ少年漫画向けAIジェネレーターをご紹介します。厳選されたトップクラスのリストには、迫力満点のアクションシーンや躍動感あふれるエフェクトを作成できる強力なツールが揃っています。実際のテスト結果をもとに、無料版と有料版の比較も可能です。あなたの創造力を解き放ち、今日から壮大な漫画の制作を始めましょう!

15 ツール
xix.ai
仕事 おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類
おすすめのAI経費管理ツール:レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール:レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール
xix.ai
仕事 おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化
おすすめのAI採用ツール:履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう!

10 ツール
xix.ai
生産性 AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上
AIパーソナルウェルネス&集中力コーチ:バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス&集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール
xix.ai
チャットボット 高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く
高評価のAI恋愛チャットボット:一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール
xix.ai
教育と学習 最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう
最高のAIデータサイエンスメンター:SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール
xix.ai
コメント (1)
0/500
JohnYoung
JohnYoung 2026年5月17日 9:00:11 JST

Interesting to see Google claiming coding benchmark wins, but I'm curious about real-world dev experience. Does it handle messy legacy codebases as well as it does clean competition problems? The 'most intelligent' tag feels a bit marketing-heavy until we see more hands-on results. 🤔

OR