Geminiは、強化されたモデル、拡張コンテキスト、AIエージェントを発表します

家

ニュース

2025年4月10日

DavidThomas

149

# ai

昨年12月に、初のネイティブマルチモーダルモデルであるGemini 1.0を、Ultra、Pro、Nanoの3つのサイズでリリースしました。それから数ヶ月後、1.5 Proを導入し、強化された性能と画期的な100万トークンの長コンテキストウィンドウを備えました。

開発者や企業顧客は、1.5 Proを非常に素晴らしい方法で活用しており、その長コンテキストウィンドウ、堅牢なマルチモーダル推論、そして全体的に優れた性能を高く評価しています。

ユーザーからのフィードバックでは、遅延とコストが低いモデルが求められていることが強調され、さらなる進化を促すきっかけとなりました。そのため、今日、Gemini 1.5 Flashを紹介します。このモデルは1.5 Proよりも軽量で、迅速かつ効率的に設計されており、スケールアップに最適です。

1.5 Proと1.5 Flashは現在、パブリックプレビュー中で、100万トークンのコンテキストウィンドウを備え、Google AI StudioおよびVertex AIを通じて利用可能です。さらに必要な方のために、1.5 ProはAPIを使用する開発者やGoogle Cloudの顧客向けに、ウェイトリストを通じて200万トークンのコンテキストウィンドウを提供します。

それだけではありません。Geminiファミリー全体にわたるアップデートを展開し、次世代のオープンなモデルであるGemma 2を公開し、Project AstraによるAIアシスタントの未来に進展を遂げています。

主要な基盤モデルのコンテキスト長とGemini 1.5の200万トークンの能力を比較

Geminiモデルファミリーのアップデート

新1.5 Flash、速度と効率に最適化

1.5 Flashを紹介します。これはGeminiファミリーの最新かつ最速のメンバーであり、当社のAPIを通じて提供されます。高頻度で大量のタスク向けにカスタマイズされており、コスト効率の高いスケーラビリティを提供しつつ、画期的な長コンテキストウィンドウを維持します。

1.5 Proよりも軽量ですが、1.5 Flashは決して劣っていません。膨大なデータセットにわたるマルチモーダル推論に優れ、そのサイズに対して印象的な品質を提供します。

新しいGemini 1.5 Flashモデルは、速度と効率に最適化され、マルチモーダル推論に非常に優れ、画期的な長コンテキストウィンドウを備えています。

1.5 Flashは、要約、チャットアプリケーション、画像やビデオのキャプション作成などのタスクで輝きます。長編ドキュメントや表からのデータ抽出にも優れています。この多様性は、1.5 Proから「蒸留」によってトレーニングされ、大きなモデルの核となる知識とスキルが、より効率的で小さなモデルに受け継がれた結果です。

1.5 Flashの詳細については、更新されたGemini 1.5技術レポート、Gemini技術ページを参照し、その利用可能性と価格について学んでください。

1.5 Proの大幅な改善

過去数ヶ月間、幅広いタスクでトップパフォーマーである1.5 Proを大幅に強化してきました。

コンテキストウィンドウを200万トークンに拡張し、コード生成、論理的推論、計画、複数ターン会話、オーディオや画像の理解における能力を向上させました。これらの強化は、データとアルゴリズムの進歩に裏打ちされ、公開および内部ベンチマークで顕著な改善を示しています。

1.5 Proは、役割、フォーマット、スタイルといった製品レベルの動作を定義する、ますます複雑で微妙な指示を処理できるようになりました。特定のユースケースに対するモデルの応答制御を改良し、チャットエージェントのペルソナのカスタマイズや複数の関数呼び出しによるワークフローの自動化などが可能です。ユーザーはシステム指示を通じてモデルの動作を操縦できます。

また、Gemini APIおよびGoogle AI Studioにオーディオ理解を追加し、1.5 ProがGoogle AI Studioにアップロードされたビデオの画像とオーディオの両方を処理できるようにしました。1.5 ProをGemini AdvancedやWorkspaceアプリなどのGoogle製品に統合しています。

1.5 Proの詳細については、更新されたGemini 1.5技術レポートおよびGemini技術ページをご覧ください。

Gemini Nanoがマルチモーダル入力を理解

Gemini Nanoは、テキストのみの入力から進化し、画像を含むようになりました。Pixelから始まり、マルチモーダル性を備えたGemini Nanoを使用するアプリは、テキスト、ビジュアル、サウンド、音声言語を通じて、より人間らしい方法で世界を解釈できるようになります。

AndroidでのGemini 1.0 Nanoの詳細をご覧ください。

次世代のオープンなモデル

今日、Geminiモデルと同じ研究と技術に基づいて構築されたオープンなモデルファミリーであるGemmaもアップデートしています。

責任あるAIイノベーションのための次世代オープンなモデル、Gemma 2をリリースします。Gemma 2は、優れた性能と効率のための新しいアーキテクチャを備え、新しいサイズで提供されます。

Gemmaファミリーは、PaLI-3にインスパイアされた初のビジョン言語モデルであるPaliGemmaとともに成長しています。また、モデル応答品質を評価するためのLLM Comparatorを備えたResponsible Generative AI Toolkitもアップグレードしました。

詳細については、Developerブログをご覧ください。

ユニバーサルAIエージェントの開発の進展

Google DeepMindでは、責任あるAIを構築し、人類に利益をもたらすことを使命としています。私たちは常に、日常生活を支援できるユニバーサルAIエージェントの作成を目指してきました。そのため、Project Astra（高度な視覚と会話対応エージェント）によるAIアシスタントの未来に関する進捗を共有します。

AIエージェントが真に役立つためには、人間のように世界を理解し反応し、見たものや聞いたものを記憶してコンテキストを把握し、それに応じて行動する必要があります。また、プロアクティブで、学習可能で、パーソナルであり、自然でラグのない会話を可能にする必要があります。

マルチモーダル情報の処理で大きな進歩を遂げましたが、会話応答時間を達成することは難しいエンジニアリング課題です。長年にわたり、モデルが知覚し、推論し、会話する方法を改良し、対話がより自然に感じられるようにしてきました。

Geminiを基盤に、ビデオフレームを継続的にエンコードし、ビデオと音声入力をイベントのタイムラインに統合し、このデータを迅速に呼び出せるようにキャッシュすることで、情報をより速く処理するプロトタイプエージェントを開発しました。

トップレベルの音声モデルを使用することで、エージェントの音声も改善し、より幅広いイントネーションを提供します。彼らは置かれたコンテキストをよりよく理解し、会話で迅速に応答できます。

この技術により、誰もが電話やメガネを通じて専門のAIアシスタントを持つ未来を想像するのは簡単です。これらの機能の一部は、今年後半にGeminiアプリやウェブ体験などのGoogle製品に導入されます。

継続的な探求

Geminiモデルファミリーで大きな進歩を遂げましたが、さらに限界を押し広げることに取り組んでいます。絶え間ないイノベーションを通じて、新しいフロンティアを探求し、Geminiのエキサイティングな新しいユースケースを解放しています。

Geminiとその能力について詳しく知りたい場合は、リソースをご覧ください。

Googleからのさらなるストーリーをあなたの受信トレイで。Googleからのさらなるストーリーをあなたの受信トレイで。

メールアドレスあなたの情報はGoogleのプライバシーポリシーに従って使用されます。

購読完了。あと一歩です。

受信トレイを確認して購読を確定してください。

あなたはすでにニュースレターに登録されています。

別のメールアドレスでも購読できます。

WordPress.comでは、AIエージェントによる投稿の作成や公開が可能になりました。その他にもさまざまな機能が追加されています。人気のウェブホスティング・パブリッシングプラットフォームであるWordPress.comが、AIエージェントの導入に乗り出した。この動きは、ウェブのあり方を一変させる可能性がある。同社は金曜日、AIエージェントが顧客のウェブサイト上でコンテンツの下書き作成、編集、公開を行うほか、コメントの管理、メタデータの更新・修正、タグやカテゴリを用いたコンテンツの整理も可能になると発表した。これらすべての操作

カカオ・モビリティ、物理AIに向けたレベル4自動運転のロードマップを提示カカオ・モビリティは、フィジカルAI戦略の一環として、レベル4の自動運転技術を自社開発する計画だ。ソウルCOEXで開催された「2026ワールドITショー」のカンファレンスにおいて、カカオモビリティのフィジカルAI部門長兼副社長であるキム・ジンギュ氏がロードマップを発表した。同氏の講演は、フィジカルAI時代におけるモビリティプラットフォームを軸とした自動運転サービスに焦点を当てたものだった。聯合

バリー・ディラー：AGIの実現が近づく中、サム・アルトマンへの信頼は重要ではない億万長者のメディア界の巨頭であるバリー・ディラー氏は、最近の報道でそのように示唆されているにもかかわらず、OpenAIのCEOサム・アルトマン氏が信頼できない人物だとは考えていない。今週開催されたウォール・ストリート・ジャーナル紙主催の「Future of Everything」カンファレンスで講演したディラー氏は、一部の元同僚や取締役から、時折人を利用したり欺いたりする傾向があるとの非難を受けて

関連特集おすすめ

仕事

おすすめのAI経費管理ツール：レシートをスキャンして、業務経費を自動分類

2026年最新・最高のAI経費管理ツール：レシートをスキャンし、法人経費を自動分類する高評価ツールをご紹介。手間いらずの経費管理、正確な財務追跡、コンプライアンス対応の効率化を実現する、画期的なソリューションをご覧ください。無料版と有料版の比較表は厳選され、毎週更新されるため、最適なツール選びにお役立ていただけます。XIX.AIの専門家が厳選したツールで、AIの力を最大限に活用しましょう。

10 ツール

xix.ai

仕事

おすすめのAI採用ツール：履歴書の選考と候補者の面接スケジュール管理を自動化

XIX.AIで、2026年最新の評価の高いAI採用ツールをチェックしましょう。厳選されたリストには、履歴書のスクリーニングや候補者の面接スケジュール管理を自動化する、強力で画期的なソリューションが揃っています。実際のテスト結果や毎週更新されるランキングを参考に、無料版と有料版の比較が可能です。最適な採用アシスタントを見つけて、今すぐ採用業務を効率化しましょう！

10 ツール

xix.ai

生産性

AIパーソナルウェルネス＆集中力コーチ：バーンアウトの予防とメンタルエネルギーの向上

XIX.AIで、2026年最高のAIパーソナルウェルネス＆集中力向上ツールをご紹介。厳選されたランキングでは、バーンアウトの解消やメンタルエネルギーの向上に役立つ、高評価で画期的なツールを取り上げています。実際のユーザーの声をもとに、無料版と有料版の比較も可能です。今すぐ、最高の生産性とウェルビーイングへの道を開きましょう。

10 ツール

xix.ai

チャットボット

高評価のAI恋愛チャットボット：一貫した個性で長期的な関係を築く

2026年版、本物の長期的なつながりを築くための、高評価のAI恋愛チャットボットをご紹介します。厳選されたリストには、魅力的で一貫性のあるキャラクター、無料版と有料版の比較、そして実地テストの結果が掲載されています。あなたにぴったりのパートナーを見つけて、今すぐXIX.AIで関係を築き始めましょう。

10 ツール

xix.ai

教育と学習

最高のAIデータサイエンスメンター：SQL、Pandas、および機械学習ワークフローをマスターしましょう

2026年に最も優れたAIデータサイエンスのメンターを探して、SQL、Pandas、およびMLワークフローをマスターしましょう。XIX.AIで評価の高い厳選されたメンターたちの指導を受けて、力強く、革新的なアドバイスを得てください。無料オプションと有料オプションを実世界の視点から比較しましょう。今日すぐにデータサイエンスのスキルを向上させましょう。

10 ツール

xix.ai

チャットボット

最高のAIを使ったナンパ＆会話トレーニング：社交的な魅力と自信をリアルタイムで高める

XIX.AIで、2026年最高のAIを使った口説き術・会話トレーニングツールを発見しましょう。厳選された高評価のツールが、リアルタイムで社交的な魅力と自信を築くお手伝いをします。無料版と有料版の比較や毎週更新されるランキングを参考に、ぜひ試すべき画期的なツールを探してみてください。今すぐ、あなたの社交力を引き出しましょう。

10 ツール

xix.ai

コメント (26)

0/500

最初にログインしてください

GregoryWilson

2026年4月28日 5:00:25 JST

Geminiの進化がすごいですね！長いコンテキストウィンドウは実用的なAIエージェント開発に革命をもたらしそう。でも、競争激化で倫理的なガイドラインが追いついてるか少し心配。🤔 個人的には、もっと小さなプロジェクトでも使える軽量版が早く出てくると嬉しいな。

LucasWalker

2025年4月19日 6:37:58 JST

ジェミニの新しいモデルが100万トークンのコンテキストを持つとは信じられない！🤯 まるで何でも扱える超賢いAIを持っているようです。AIエージェントもゲームチェンジャーです。次に何を出すのか楽しみです！🚀

FrankSmith

2025年4月16日 9:37:56 JST

젬니니의 새로운 모델 정말 멋지네요! 100만 토큰의 컨텍스트 윈도우는 정말 놀랍습니다. 마치 모든 대화를 기억하는 똑똑한 친구가 있는 것 같아요! 조금 더 빨랐으면 좋겠지만, 뭐 다 가질 수는 없죠? 🤓

JamesMiller

2025年4月16日 2:53:33 JST

O novo modelo do Gemini é bem legal! A janela de contexto de 1 milhão de tokens é louca, é como ter um amigo superinteligente que lembra de tudo o que você já disse! Só queria que fosse um pouco mais rápido, mas, ei, não dá pra ter tudo, né? 🤓

MarkRoberts

2025年4月15日 10:25:31 JST

El nuevo modelo Gemini es impresionante, especialmente la ventana de contexto larga. Es genial para desarrolladores, pero puede ser un poco abrumador para principiantes. Los agentes de IA son geniales, pero desearía que hubiera más documentación sobre cómo usarlos de manera efectiva.

BillyGarcia

2025年4月15日 4:20:08 JST

O novo modelo do Gemini com um contexto de um milhão de tokens é loucura! 🤯 É como ter uma IA super inteligente que pode lidar com qualquer coisa. Os agentes de IA também são um divisor de águas. Mal posso esperar para ver o que eles vão lançar a seguir! 🚀

トップニュース

AI BuilderとPower Automateがドキュメントの要約を革新 AIホストのNotebooklm Podcastのホストは、インタビューに利用できるようになりました中国、国家ヒューマノイドロボット及び具現化された知能の基準を発表企業のAI導入は頭打ち、ランプのデータで明らかに Bing Image Creator チュートリアル: AIアート生成ガイドあなたの声を使用してAIミュージックを作成することを学ぶ：ステップバイステップSunoチュートリアル iMyFone MagicMic：リアルタイムAIボイスチェンジャーのレビューとチュートリアル 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 DeepSeek V4、マルチモーダルAIのゲームチェンジャーとして登場エンボディッド・インテリジェンス、無秩序な拡大を抑制するための初の業界標準を発表

もっと

特集