Google、コーディングベンチマークでGemini 2.5 ProがDeepSeek R1とGrok 3 Betaを上回ると発表
グーグルは、3月に発表され5月に機能強化されたフラッグシップモデルGemini 2.5 Proのプレビュー版を発表した。同社がこれまでで「最もインテリジェントな」AIと説明するこの反復は、現在プレビュー中で、数週間以内に一般提供が開始される予定だ。
企業は現在、Gemini 2.5 Proの更新された「I/O版」を使用して、新しいアプリケーションの開発や既存の実装のアップグレードを試すことができる。Googleの公式発表によると、このバージョンは、以前のバージョンと比較して、より想像力豊かな反応を実現し、プログラミングと論理的推論において優れた能力を発揮する。
最新のGemini 2.5 Proアップデートがプレビューになりました。
コーディング、推論、科学+数学に優れ、主要なベンチマーク(AIDER Polyglot、GPQA、HLEなど)でパフォーマンスの向上を示し、@lmarena_aiをリードして、前バージョンから24ptもEloスコアが跳ね上がりました。
また... pic.twitter.com/SVjdQ2k1tJ
- スンダー・ピチャイ (@sundarpichai) 2025年6月5日
グーグルは5月の開発者会議で、Gemini 2.5 Proの、以前のサイレントリリースを上回る機能強化を明らかにした。Google DeepMindのCEOであるデミス・ハサビスは、I/O版を同社がこれまでで最も先進的なコーディングモデルであると強調した。
Gemini 2.5 Pro Preview 06-05 Thinkingと名付けられたこの最新のプレビューは、I/O版の機能を超えて進化している。近日公開予定のリリースは、エンタープライズグレードのパフォーマンスとスケーラビリティを約束するものである。
オリジナルのI/O版(gemini-2.5-pro-preview-05-06)は、5月にGoogle AI StudioとVertex AIを通じて開発者と企業がアクセスできるようになった。強化されたGemini 2.5 Pro Preview 06-05 Thinkingは、これらの同じチャネルを通じて入手可能である。
パフォーマンス指標
このアップグレードされたGemini 2.5 Proは、前モデルと比較して測定可能な改善を示している。
Googleは、LMArenaで24ポイント、WebDevArenaで35ポイントの向上を報告し、競合他社のランキングをリードしている。比較テストでは、OpenAIのo3、o3-mini、およびo4-mini、AnthropicのClaude 4 Opus、xAIのGrok 3 Beta、およびDeepSeek R1を含むモデルに対する優れたパフォーマンスが明らかになりました。
「また、以前の2.5 Proリリースからのフィードバックに対応し、スタイルと構造を改善しました。

企業が期待すること
Googleの迅速なGemini 2.5 Proの機能強化は複雑に見えるかもしれないが、同社はそれらをユーザーの入力に対する直接的な反応と位置付けている。新バージョンの価格体系は、入力トークン100万個あたり125ドル(キャッシュなし)、出力トークン100万個あたり10ドルである。
Gemini 2.5 Proが3月にデビューしたとき、業界関係者はGemini 2.5 Proが十分に活用されていない先進モデルであると認識した。それ以来グーグルは、回答を生成する前に複数の仮説を評価する "Deep Think "機能など、数多くのアプリケーションにこの技術を組み込んでいる。
Gemini 2.5 Proのリリースとその後のアップグレードは、競争力のある大規模言語モデルの状況におけるグーグルの地位を強化し、DeepSeekとOpenAIによるライバルの推論モデルから注目を取り戻した。
発表から数時間以内に、開発者はアップデートされたGemini 2.5 Proのテストを開始した。初期の印象では、Googleの主張するパフォーマンスの加速が確認されたが、強化された機能の包括的な評価はまだ継続中である。
Gemini 2.5 Pro Preview 06-05 "の最初の1時間
良い点
- より速くなった
- より多くの出力が得られる
- マクロプレイがより良くなった(複数ファイルの編集、より良い概要)
- 出力構造が改善された(読みやすい)
- より簡潔で、謝罪が少ない!
以前は"あなたは絶対に...
- Patrick Bade (@nishffx) 2025年6月5日
アプリビルダーを本当に楽しんでいる。
ゲームを作ってテストしてみたんだけど、imagenを使ってその場でアセットを作ることができたよ。本当に最高のコード不要のアプリビルダーだ。
バイブアプリマーケットプレイスを構築し続けよう。
- bone (@boneGPT) 2025年6月5日
Gemini 2.5 Pro Previewはかなり良い。昨日、深いリサーチのために使ったが、結果はいくつかの大手よりも良い。
- ヤナック (@janaks09) 2025年6月5日
関連記事
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
YouTube、AIを活用した検索機能のテストを開始――ガイド付き回答機能を搭載
多くのユーザーは、レシピや旅行プランを探す際、関連する動画を探そうとYouTubeを利用しています。今回、YouTubeはテキストと動画コンテンツを融合させた、ステップバイステップの検索結果を表示するAI搭載の対話型検索ツールを導入しました。新しい「Ask YouTube」機能を使えば、ユーザーは「サンフランシスコからサンタバーバラまでの3日間のロードトリップを計画して」といった質問を投げかけ、動
関連特集おすすめ
コメント (1)
0/500
グーグルは、3月に発表され5月に機能強化されたフラッグシップモデルGemini 2.5 Proのプレビュー版を発表した。同社がこれまでで「最もインテリジェントな」AIと説明するこの反復は、現在プレビュー中で、数週間以内に一般提供が開始される予定だ。
企業は現在、Gemini 2.5 Proの更新された「I/O版」を使用して、新しいアプリケーションの開発や既存の実装のアップグレードを試すことができる。Googleの公式発表によると、このバージョンは、以前のバージョンと比較して、より想像力豊かな反応を実現し、プログラミングと論理的推論において優れた能力を発揮する。
最新のGemini 2.5 Proアップデートがプレビューになりました。
コーディング、推論、科学+数学に優れ、主要なベンチマーク(AIDER Polyglot、GPQA、HLEなど)でパフォーマンスの向上を示し、@lmarena_aiをリードして、前バージョンから24ptもEloスコアが跳ね上がりました。
また... pic.twitter.com/SVjdQ2k1tJ
- スンダー・ピチャイ (@sundarpichai) 2025年6月5日
グーグルは5月の開発者会議で、Gemini 2.5 Proの、以前のサイレントリリースを上回る機能強化を明らかにした。Google DeepMindのCEOであるデミス・ハサビスは、I/O版を同社がこれまでで最も先進的なコーディングモデルであると強調した。
Gemini 2.5 Pro Preview 06-05 Thinkingと名付けられたこの最新のプレビューは、I/O版の機能を超えて進化している。近日公開予定のリリースは、エンタープライズグレードのパフォーマンスとスケーラビリティを約束するものである。
オリジナルのI/O版(gemini-2.5-pro-preview-05-06)は、5月にGoogle AI StudioとVertex AIを通じて開発者と企業がアクセスできるようになった。強化されたGemini 2.5 Pro Preview 06-05 Thinkingは、これらの同じチャネルを通じて入手可能である。
パフォーマンス指標
このアップグレードされたGemini 2.5 Proは、前モデルと比較して測定可能な改善を示している。
Googleは、LMArenaで24ポイント、WebDevArenaで35ポイントの向上を報告し、競合他社のランキングをリードしている。比較テストでは、OpenAIのo3、o3-mini、およびo4-mini、AnthropicのClaude 4 Opus、xAIのGrok 3 Beta、およびDeepSeek R1を含むモデルに対する優れたパフォーマンスが明らかになりました。
「また、以前の2.5 Proリリースからのフィードバックに対応し、スタイルと構造を改善しました。

企業が期待すること
Googleの迅速なGemini 2.5 Proの機能強化は複雑に見えるかもしれないが、同社はそれらをユーザーの入力に対する直接的な反応と位置付けている。新バージョンの価格体系は、入力トークン100万個あたり125ドル(キャッシュなし)、出力トークン100万個あたり10ドルである。
Gemini 2.5 Proが3月にデビューしたとき、業界関係者はGemini 2.5 Proが十分に活用されていない先進モデルであると認識した。それ以来グーグルは、回答を生成する前に複数の仮説を評価する "Deep Think "機能など、数多くのアプリケーションにこの技術を組み込んでいる。
Gemini 2.5 Proのリリースとその後のアップグレードは、競争力のある大規模言語モデルの状況におけるグーグルの地位を強化し、DeepSeekとOpenAIによるライバルの推論モデルから注目を取り戻した。
発表から数時間以内に、開発者はアップデートされたGemini 2.5 Proのテストを開始した。初期の印象では、Googleの主張するパフォーマンスの加速が確認されたが、強化された機能の包括的な評価はまだ継続中である。
Gemini 2.5 Pro Preview 06-05 "の最初の1時間
良い点
- より速くなった
- より多くの出力が得られる
- マクロプレイがより良くなった(複数ファイルの編集、より良い概要)
- 出力構造が改善された(読みやすい)
- より簡潔で、謝罪が少ない!以前は"あなたは絶対に...
- Patrick Bade (@nishffx) 2025年6月5日
アプリビルダーを本当に楽しんでいる。
ゲームを作ってテストしてみたんだけど、imagenを使ってその場でアセットを作ることができたよ。本当に最高のコード不要のアプリビルダーだ。
バイブアプリマーケットプレイスを構築し続けよう。
- bone (@boneGPT) 2025年6月5日
Gemini 2.5 Pro Previewはかなり良い。昨日、深いリサーチのために使ったが、結果はいくつかの大手よりも良い。
- ヤナック (@janaks09) 2025年6月5日
Google、インドでChrome向け「Gemini」の提供を開始
水曜日、GoogleはChrome向けGeminiの統合機能を、インド、カナダ、ニュージーランドを含む新たな地域へ拡大すると発表した。この展開により、デスクトップユーザーはサイドバーからGeminiにアクセスできるようになり、画面上のコンテンツについてGoogleのAIチャットボットに質問したり、Gmail、Keep、Drive、YouTubeから情報を取得したり、タブの内容を比較したりすることが
YouTube、政治家、政府関係者、ジャーナリストを対象にAIによるディープフェイク検出機能を拡大
火曜日、YouTubeは、ディープフェイク検出技術を、特定の政府関係者、政治家候補者、ジャーナリストを対象に拡大すると発表した。このツールはAIによって生成された肖像を識別し、パイロットプログラムの参加者は、YouTubeのポリシーに違反していると判断した無断コンテンツの削除をリクエストできるようになる。この検出システムは、先行するテスト段階を経て、昨年、YouTubeパートナープログラムに参加す
YouTube、AIを活用した検索機能のテストを開始――ガイド付き回答機能を搭載
多くのユーザーは、レシピや旅行プランを探す際、関連する動画を探そうとYouTubeを利用しています。今回、YouTubeはテキストと動画コンテンツを融合させた、ステップバイステップの検索結果を表示するAI搭載の対話型検索ツールを導入しました。新しい「Ask YouTube」機能を使えば、ユーザーは「サンフランシスコからサンタバーバラまでの3日間のロードトリップを計画して」といった質問を投げかけ、動





家






