I/O 2024からのトップ100の発表が明らかになりました

ワオ、I/O 2024は興奮するアップデートでいっぱいでした!最新のGeminiアプリの強化に興味がある方、新しい開発者ツールに熱心な方、最新の生成AI機能を試したい方、誰にとっても何かがありました。私たちの言葉を信じないで?過去数日間で発表した100のことをチェックしてください。
AIの瞬間とモデルの勢い
- 私たちはGemini 1.5 Flashを導入しました。これは、スピードと効率のために設計された軽量モデルです。APIを通じて利用可能な最速のGeminiモデルです。
- 1.5 Pro、私たちの汎用性能向けトップモデルに大幅な改良を加えました。
- 1.5 Proと1.5 Flashは現在、Google AI StudioおよびVertex AIで100万トークンのコンテキストウィンドウとともに公開プレビュー中です。
- 1.5 Proは、Google AI StudioおよびVertex AIで待機リストを通じて開発者向けに200万トークンのコンテキストウィンドウでも利用可能です。
主要な基盤モデルのコンテキスト長をGemini 1.5の200万トークンの能力と比較。
- 私たちはAIアシスタントの未来のビジョンであるProject Astraを共有しました。
- 私たちのカスタムAIアクセラレータの6世代目であるTrillium、Tensor Processing Unit(TPU)を発表しました。これはこれまでで最も高性能なTPUです。
- TPU v5eと比較して、Trillium TPUはチップごとのピーク計算性能を4.7倍向上させます。
- これらはまた、これまでで最も持続可能な世代です:Trillium TPUはTPU v5eより67%以上エネルギー効率が高いです。
- NotebookLMのAudio Overviewsの初期プロトタイプをデモしました。これは、アップロードされた資料を使用してパーソナライズされた音声ディスカッションを作成します。
- Google SearchとのGroundingを発表しました。これはGeminiモデルを世界の知識や最新のインターネット情報と接続し、Vertex AIで一般に利用可能になりました。
- Gemini APIとAI Studioに音声理解を追加し、AI Studioにアップロードされたビデオに対してGemini 1.5 Proが画像と音声を処理できるようにしました。
- Pixelから始まり、Gemini Nano with Multimodalityを使用するアプリケーションは、テキスト、視覚、音声、話し言葉を通じて人間のよう世界を理解します。
生成メディアモデルとLabsの実験
- これまでで最高品質の画像生成モデルであるImagen 3を発表しました。
- Imagen 3は自然言語とプロンプトの背後にある意図を理解し、長いプロンプトからの細かい詳細を取り入れて、驚くほど詳細でフォトリアリスティックな画像を生成し、以前のモデルよりも視覚的アーティファクトが少なくなります。
- Imagen 3は、画像生成モデルにとって課題であるテキストレンダリングにおいてもこれまでで最高のモデルです。
- Imagen 3をImageFXのTrusted Testersに展開し、待機リストに登録できます。
- Imagen 3は今夏、Vertex AIで利用可能になります。
- これまでで最も高性能なビデオ生成モデルであるVeoを発表しました。これは、1080p解像度の高质量なビデオをさまざまな映画的および視覚的スタイルで1分以上生成できます。
- Veoの機能の一部をYouTube Shortsや他の製品に将来的に導入します。
- Veoがアーティストのために何ができるかを、Donald Gloverを含む映画製作者とのコラボレーションを通じて紹介しました。彼はVeoを映画プロジェクトに使用しました。
- Music AI Sandboxをハイライトしました。これは、音楽AIツールのスイートで、人々が新しいインストゥルメンタルセクションを作成したり、トラック間でスタイルを転送したりできます。Wyclef JeanやMarc Rebilletとのコラボレーションによる新しい曲をYouTubeで見つけられます。
- Infinite Wonderlandをチェックしてください。アーティストとGoogleクリエイティブがAIモデルを微調整し、「Alice's Adventures in Wonderland」の視覚世界を無限に再構築しました。読者は本の1200の文ごとにアーティストのスタイルに基づいて無限の画像を生成できます。
- Google DeepMindの生成ビデオモデルVeoを使用してアイデアをビデオクリップに変える最新の実験ツールVideoFXを発表しました。
- VideoFXには、シーンごとに反復し、最終ビデオに音楽を追加できるStoryboardモードも含まれています。
25. ImageFXにさらに多くの編集コントロールを追加しました。これはコミュニティからのトップリクエストで、画像上をブラシでなぞるだけで要素を追加、削除、変更できます。
26. ImageFXはImagen 3を使用して、より豊かな詳細、視覚的アーティファクトの減少、より正確なテキストレンダリングでフォトリアリスティックさを解放します。
27. MusicFXには「DJ Mode」が追加され、ジャンルや楽器を組み合わせてビートをミックスし、生成AIを使用して音楽ストーリーを生き生きとさせます。
28. 今週から、ImageFXとMusicFXはLabsを通じて100以上の国で利用可能です。
Geminiアプリでより多くのことを行う新しい方法
- Gemini 1.5 ProをGemini Advanced加入者に提供し、100万トークンのコンテキストウィンドウと1500ページのPDFを処理する能力を提供します。
- これにより、Gemini Advancedは商用チャットボットの中で最大のコンテキストウィンドウを持つことになります。
- Google Driveまたはデバイスから直接ファイルをアップロードする機能をGemini Advancedに追加しました。
- まもなく、Gemini Advancedはアップロードされたデータファイル(スプレッドシートなど)からデータを分析し、洞察を見つけ出し、チャートを作成するのに役立ちます。
- 旅行者に朗報:Gemini Advancedには、提案されたアクティビティのリストを超えて、あなた専用のカスタム旅程を作成する計画機能が追加されました。
34. そして、Gemini Advanced加入者向けのGemini Liveがあります。これは、最先端の音声技術を使用して、より自然で直感的な音声会話を実現する新しいモバイル優先の会話体験です。
35. Gemini Liveでは、10の自然な音声から選択でき、自分のペースで話したり、途中で質問を割り込んで明確にすることができます。
36. Google MessagesのGeminiでは、友達とメッセージをやり取りする同じアプリ内でGeminiとチャットできます。
37. Gemini Advanced加入者は、まもなくGemsを作成できるようになります。これは、あなたが夢見るどんな用途にもカスタマイズされたGeminiのバージョンです。Gemが何をすべきか、どのように応答すべきかを説明するだけで、Geminiはあなたの特定のニーズに合ったGemを作成します。
38. Google Calendar、Tasks、Keep、Clockなど、さらなるGoogleツールがGeminiに接続される予定です。
Searchがあなたのために作業を行うアップデート
- Google Search向けにカスタマイズされた新しいGeminiモデルを使用して、Geminiの高度な機能(多段階推論、計画、マルチモーダリティなど)を最高クラスのSearchシステムと組み合わせています。
- SearchのAI Overviewsは今週、米国の全員に展開され、近日中にもっと多くの国に展開されます。
41. 多段階推論機能が、米国の英語クエリ向けにSearch LabsのAI Overviewsに近日登場し、「ボストンで最高のヨガまたはピラティススタジオを見つけ、ビーコンヒルからの徒歩時間とイントロオファーの詳細を表示する」などの複雑な質問が可能です。
42. まもなく、AI Overviewを調整して、言語を簡素化したり、トピックに慣れていない場合や主題の核心に迫りたい場合に詳細に分解したりできるオプションが追加されます。
43. Searchには新しい計画機能も追加されます。たとえば、食事や旅行の計画にカスタマイズが加わり、今年後半にSearch Labsで開始され、パーティーやフィットネスなどのカテゴリが続きます。
44. ビデオ理解の進歩により、ビデオを使った質問が可能になりました。Searchは複雑な視覚的質問を理解し、次のステップを説明し、AI Overviewでリソースを提供します。
45. Searchの生成AIは、近日中に新しいアイデアを検索する際にAIで整理された結果ページを作成します。これらのAIで整理された検索結果ページは、ダイニング、レシピ、映画、音楽、本、ホテル、ショッピングなどのカテゴリで利用可能です。
WorkspaceおよびPhotosでのGeminiモデルの支援
- Gemini 1.5 Proは、Workspace Labsを通じてGmail、Docs、Drive、Slides、Sheetsのサイドパネルで利用可能になり、来月にはGemini for Workspaceの顧客およびGoogle One AI Premium加入者に展開されます。
- Gmailのサイドパネルを使用して、メールを要約し、最も重要な詳細やアクションアイテムを取得できます。
- 要約に加えて、Gmailのモバイルアプリは近日中にGeminiを使用して、コンテキストスマートリプライとGmail Q&Aの2つの新機能を追加します。
- 今後数週間で、GmailおよびDocsの「Help me write」がスペイン語とポルトガル語をサポートします。
- 今年後半のLabsでは、Geminiにメールの添付ファイルをDriveに自動的に整理させ、データをシートに生成し、Data Q&Aで分析できます。
- Google Photosの新しい実験的機能Ask Photosは、Geminiモデルを使用して、ギャラリー内の特定の思い出を探したり、情報を思い出すのを容易にします。この機能は今後数か月で展開されます。
52. Ask Photosを使用して、最近の旅行からハイライトギャラリーを作成でき、ソーシャルメディアで共有するためのパーソナライズされたキャプションも書きます。
Androidの進化
- 今年後半のPixelから始まり、Androidの組み込みオンデバイス基盤モデルであるGemini Nanoがマルチモーダル機能を備えます。Pixel電話は、視覚、音声、話し言葉などのコンテキストでより多くの情報を理解します。
- Androidデバイスのアクセシビリティ機能であるTalkbackは、視覚障害者や弱視者がタッチや音声フィードバックを使用するのを助け、Gemini Nano with Multimodalityにより改良されています。
- 新しいオプトイン詐欺保護機能は、Gemini NanoのオンデバイスAIを使用して、プライバシーを保護しながら詐欺電話を検出します。詳細は今年後半に公開されます。
- Circle to Searchは現在、1億以上のAndroidデバイスで利用可能で、年末までにその数を2倍にする予定です。
- まもなく、AndroidのGeminiを使用して、生成された画像を作成してGmail、Google Messagesなどにドラッグアンドドロップしたり、視聴中のYouTubeビデオについて質問したりできます。
- Gemini Advancedをお持ちの場合、「このPDFに質問する」オプションを使用して、複数のページをスクロールせずに迅速に回答を得られます。
- 学生は、選択したAndroidの電話やタブレットから直接宿題のヘルプにCircle to Searchを使用できます。この機能は、Geminiを基盤とした新しいモデルファミリーLearnLMによって強化されています。
- 今年後半、Circle to Searchは、記号式、図、グラフなどを含むさらに複雑な問題を解決できるようになります。
61. ああ、そしてAndroid 15の2番目のベータ版を導入しました。
62. Theft Detection Lockは、強力なGoogle AIを使用して、デバイスが奪われた場合に感知し、電話の情報を迅速にロックします。
63. Android 15にはプライベートスペースが登場し、アプリを別のスペース内に安全に保管し、追加の認証層を開く必要があります。
64. 別々のロック画面がプライベートスペースに十分でない場合、その存在を完全に隠すことができます。
65. 今年後半、Google Play ProtectはオンデバイスAIを使用して、詐欺やフィッシングに従事しようとするアプリを検出します。
66. 日本にRCSを使用した更新されたメッセージング体験をGoogle Messagesで提供します。
67. まもなく米国で、テキストのみを含むパスのデジタルバージョンを作成できます。保険カードやイベントチケットなどのパスの写真を撮り、Google Walletに簡単に追加して素早くアクセスできます。
68. Google Mapsで直接拡張現実(AR)コンテンツが利用可能になり、SamsungやQualcommと協力してAndroidエコシステム向けの拡張現実(XR)プラットフォームの基盤を築きます。
69. MaxやPeacockでお気に入りの番組を視聴したり、Googleビルトインの選択された車でAngry Birdsのゲームを開始したりできます。
70. Google CastをAndroid Automotive OSの車に導入し、Rivianから数か月後に開始し、電話から車にビデオコンテンツを簡単にキャストできます。
71. 今年後半、Wear OS 5の時計にバッテリー寿命の最適化が施されます。たとえば、屋外マラソンはWear OS 4の時計と比較して最大20%少ない電力消費になります。
72. Wear OS 5は、フィットネスアプリに接地時間、ストライド長、垂直振動などのデータタイプをサポートするオプションを提供します。
73. Google TVやその他のAndroid TV OSデバイスで、GeminiモデルによるパーソナライズされたAI生成の説明により、見たいものを選びやすくなりました。
74. これらのAI生成の説明は、映画や番組の欠落または翻訳されていない説明も補完します。
75. 楽しい統計:発売以来、人々は10億以上のFast Pair接続を行いました。
76. 今月末から、ChipoloやPebbleBee(さらにパートナーが追加予定)のBluetoothトラッカータグを使用して、Find My Deviceアプリで鍵、財布、荷物などのアイテムを接続および検索できます。
開発者向けの進展
- Gemini API Developer Competitionに参加して、最も役立つ画期的なAIアプリを発見する一部になれます。賞品は?1981年式DeLoreanのカスタム電気改装車です。
- 視覚的Q&Aと画像キャプションに最適化された最初のビジョン言語オープンモデルPaliGemmaを導入しました。
- Gemmaの次バージョン、Gemma 2をプレビューしました。これはまったく新しいアーキテクチャに基づいて構築され、27Bパラメータのより大きなインスタンスを含み、単一のTPUホストで動作し、2倍のサイズのモデルを上回ります。
80. Geminiモデルは、Android Studio、IDX、Firebase、Colab、VSCode、Cloud、IntelliJで開発者の生産性を高めるために利用可能です。
81. Gemini 1.5 Proは、今年後半にAndroid Studioに登場します。大きなコンテキストウィンドウを備え、このモデルは高品質な応答を提供し、マルチモーダル入力などのユースケースを解放します。
82. Google AI Studioは、英国やEUを含む200以上の国で利用可能です。
83. Gemini APIで並列関数呼び出しとビデオフレーム抽出がサポートされるようになりました。
84. 来月登場するGemini APIの新しいコンテキストキャッシュ機能により、頻繁に使用されるコンテキストファイルを低コストでキャッシュすることで、大きなプロンプトのワークフローを効率化できます。
85. Androidは、Kotlinマルチプラットフォームに対するファーストクラスのサポートを提供し、開発者がアプリのビジネスロジックをプラットフォーム間で共有するのを助けます。
86. Resizable Emulator、Compose UI check Mode、FirebaseによるAndroid Device Streamingは、すべてのフォームファクター向けに構築する開発者を支援する新製品です。
87. Chrome 126から、Gemini NanoがChromeデスクトップクライアントに組み込まれます。
88. マルチページアプリのView Transitions APIは、サイトアーキテクチャに関係なく、スムーズで流動的なアプリのようなナビゲーションを簡単に構築できるように、非常に要望の多かった機能として利用可能です。
89. フルスタック、マルチプラットフォームアプリ向けの新しい統合開発者体験であるProject IDXは、誰でも試せるように公開されています。
90. Firebaseは、ベータ版でFirebase Genkitをリリースしました。これにより、開発者がアプリに生成AI体験を構築するのがさらに簡単になります。
91. Firebaseは、Firebase Data Connectもリリースしました。これは、Google Cloud SQLを介してFirebaseでSQLを使用する新しい方法です。これにより、SQLワークフローがFirebaseに導入されるだけでなく、開発者が書く必要のあるアプリコードの量も削減されます。
92. James Manyika、Jeff Dean、Koray Kavukcuogluとの深い対話で、AIを支える技術と研究について開発者を案内しました。
責任あるAIの進展
- 私たちは、システムの弱点を積極的にテストし、壊そうとする実証済みのプラクティスであるレッドチームを強化しています。これは、「AI-Assisted Red Teaming」と呼ばれる新しい技術を通じて行われます。
- SynthIDをテキストとビデオの2つの新しいモダリティに拡張しています。
- SynthIDテキスト透かしは、更新されたResponsible Generative AIツールキットを通じて今後数か月でオープンソース化されます。
- LearnLMを発表しました。これは、Geminiを基盤とし、学習向けに微調整された新しいモデルファミリーです。LearnLMは、Gemini、Search、YouTube、Google Classroomなど、すでにさまざまな製品の機能を強化しています。
97. Columbia Teachers College、Arizona State University、NYU Tisch、Khan Academyなどの機関の専門家と協力して、LearnLMを製品を超えて改良および拡張します。
98. MIT RAISEと協力して、教室で生成AIを効果的に使用するためのオンラインコースを開発しました。
99. 知識をよりアクセスしやすく、消化しやすくするための新しい実験ツールIlluminateを構築しました。
100. Illuminateは、研究論文の主要な洞察の概要を提供する2つのAI生成音声による会話を作成できます。今日、labs.googleで試すために登録できます。
関連記事
SalesforceがSlackでAIデジタルチームメイトを公開、Microsoft Copilotに対抗
Salesforceは新しい職場AI戦略を発表し、月曜日にSlackの会話に統合された専門の「デジタルチームメイト」を導入した。新ツール「SlackのAgentforce」は、企業が職場チャットを検索し、会社データにアクセスし、従業員が日常的に働くメッセージングプラットフォーム内でアクションを実行するタスク特化型AIエージェントを作成・展開できる。「専門の従業員が協力して問題を解決するように、クラ
Oracleの40億ドルNvidiaチップ投資がテキサスAIデータセンターを強化
Oracleは、Financial Timesが報じたところによると、OpenAIが開発するテキサスの主要な新データセンターを動かすために、約40億ドルのNvidiaチップに投資する予定です。この取引は、これまでで最大規模のチップ取得の一つであり、AIコンピューティングリソースに対する急増する需要を強調しています。テキサス州アビリーンに位置するこの施設は、米国初の「Stargate」データセンター
Meta AIアプリがプレミアム層と広告を導入
MetaのAIアプリは、OpenAI、Google、Microsoftなどの競合他社と同様に、有料サブスクリプションを近日中に導入する可能性があります。2025年第1四半期の決算発表で、MetaのCEOマーク・ザッカーバーグは、プレミアムサービス計画を発表し、ユーザーがMeta AIで強化された計算能力や追加機能にアクセスできるようにすると述べました。ChatGPTに対抗するため、Metaは今週、
コメント (52)
0/200
DennisMitchell
2025年8月18日 4:01:00 JST
The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?
0
FredGreen
2025年8月10日 14:00:59 JST
I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?
0
CharlesHernández
2025年4月20日 14:00:11 JST
I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀
0
HaroldMoore
2025年4月20日 13:28:30 JST
I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀
0
RalphSanchez
2025年4月20日 4:31:49 JST
I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀
0
ThomasLewis
2025年4月19日 15:38:18 JST
I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!
0
ワオ、I/O 2024は興奮するアップデートでいっぱいでした!最新のGeminiアプリの強化に興味がある方、新しい開発者ツールに熱心な方、最新の生成AI機能を試したい方、誰にとっても何かがありました。私たちの言葉を信じないで?過去数日間で発表した100のことをチェックしてください。
AIの瞬間とモデルの勢い
- 私たちはGemini 1.5 Flashを導入しました。これは、スピードと効率のために設計された軽量モデルです。APIを通じて利用可能な最速のGeminiモデルです。
- 1.5 Pro、私たちの汎用性能向けトップモデルに大幅な改良を加えました。
- 1.5 Proと1.5 Flashは現在、Google AI StudioおよびVertex AIで100万トークンのコンテキストウィンドウとともに公開プレビュー中です。
- 1.5 Proは、Google AI StudioおよびVertex AIで待機リストを通じて開発者向けに200万トークンのコンテキストウィンドウでも利用可能です。
- 私たちはAIアシスタントの未来のビジョンであるProject Astraを共有しました。
- 私たちのカスタムAIアクセラレータの6世代目であるTrillium、Tensor Processing Unit(TPU)を発表しました。これはこれまでで最も高性能なTPUです。
- TPU v5eと比較して、Trillium TPUはチップごとのピーク計算性能を4.7倍向上させます。
- これらはまた、これまでで最も持続可能な世代です:Trillium TPUはTPU v5eより67%以上エネルギー効率が高いです。
- NotebookLMのAudio Overviewsの初期プロトタイプをデモしました。これは、アップロードされた資料を使用してパーソナライズされた音声ディスカッションを作成します。
- Google SearchとのGroundingを発表しました。これはGeminiモデルを世界の知識や最新のインターネット情報と接続し、Vertex AIで一般に利用可能になりました。
- Gemini APIとAI Studioに音声理解を追加し、AI Studioにアップロードされたビデオに対してGemini 1.5 Proが画像と音声を処理できるようにしました。
- Pixelから始まり、Gemini Nano with Multimodalityを使用するアプリケーションは、テキスト、視覚、音声、話し言葉を通じて人間のよう世界を理解します。
生成メディアモデルとLabsの実験
- これまでで最高品質の画像生成モデルであるImagen 3を発表しました。
- Imagen 3は自然言語とプロンプトの背後にある意図を理解し、長いプロンプトからの細かい詳細を取り入れて、驚くほど詳細でフォトリアリスティックな画像を生成し、以前のモデルよりも視覚的アーティファクトが少なくなります。
- Imagen 3は、画像生成モデルにとって課題であるテキストレンダリングにおいてもこれまでで最高のモデルです。
- Imagen 3をImageFXのTrusted Testersに展開し、待機リストに登録できます。
- Imagen 3は今夏、Vertex AIで利用可能になります。
- これまでで最も高性能なビデオ生成モデルであるVeoを発表しました。これは、1080p解像度の高质量なビデオをさまざまな映画的および視覚的スタイルで1分以上生成できます。
- Veoの機能の一部をYouTube Shortsや他の製品に将来的に導入します。
- Veoがアーティストのために何ができるかを、Donald Gloverを含む映画製作者とのコラボレーションを通じて紹介しました。彼はVeoを映画プロジェクトに使用しました。
- Music AI Sandboxをハイライトしました。これは、音楽AIツールのスイートで、人々が新しいインストゥルメンタルセクションを作成したり、トラック間でスタイルを転送したりできます。Wyclef JeanやMarc Rebilletとのコラボレーションによる新しい曲をYouTubeで見つけられます。
- Infinite Wonderlandをチェックしてください。アーティストとGoogleクリエイティブがAIモデルを微調整し、「Alice's Adventures in Wonderland」の視覚世界を無限に再構築しました。読者は本の1200の文ごとにアーティストのスタイルに基づいて無限の画像を生成できます。
- Google DeepMindの生成ビデオモデルVeoを使用してアイデアをビデオクリップに変える最新の実験ツールVideoFXを発表しました。
- VideoFXには、シーンごとに反復し、最終ビデオに音楽を追加できるStoryboardモードも含まれています。
Geminiアプリでより多くのことを行う新しい方法
- Gemini 1.5 ProをGemini Advanced加入者に提供し、100万トークンのコンテキストウィンドウと1500ページのPDFを処理する能力を提供します。
- これにより、Gemini Advancedは商用チャットボットの中で最大のコンテキストウィンドウを持つことになります。
- Google Driveまたはデバイスから直接ファイルをアップロードする機能をGemini Advancedに追加しました。
- まもなく、Gemini Advancedはアップロードされたデータファイル(スプレッドシートなど)からデータを分析し、洞察を見つけ出し、チャートを作成するのに役立ちます。
- 旅行者に朗報:Gemini Advancedには、提案されたアクティビティのリストを超えて、あなた専用のカスタム旅程を作成する計画機能が追加されました。
Searchがあなたのために作業を行うアップデート
- Google Search向けにカスタマイズされた新しいGeminiモデルを使用して、Geminiの高度な機能(多段階推論、計画、マルチモーダリティなど)を最高クラスのSearchシステムと組み合わせています。
- SearchのAI Overviewsは今週、米国の全員に展開され、近日中にもっと多くの国に展開されます。
WorkspaceおよびPhotosでのGeminiモデルの支援
- Gemini 1.5 Proは、Workspace Labsを通じてGmail、Docs、Drive、Slides、Sheetsのサイドパネルで利用可能になり、来月にはGemini for Workspaceの顧客およびGoogle One AI Premium加入者に展開されます。
- Gmailのサイドパネルを使用して、メールを要約し、最も重要な詳細やアクションアイテムを取得できます。
- 要約に加えて、Gmailのモバイルアプリは近日中にGeminiを使用して、コンテキストスマートリプライとGmail Q&Aの2つの新機能を追加します。
- 今後数週間で、GmailおよびDocsの「Help me write」がスペイン語とポルトガル語をサポートします。
- 今年後半のLabsでは、Geminiにメールの添付ファイルをDriveに自動的に整理させ、データをシートに生成し、Data Q&Aで分析できます。
- Google Photosの新しい実験的機能Ask Photosは、Geminiモデルを使用して、ギャラリー内の特定の思い出を探したり、情報を思い出すのを容易にします。この機能は今後数か月で展開されます。
Androidの進化
- 今年後半のPixelから始まり、Androidの組み込みオンデバイス基盤モデルであるGemini Nanoがマルチモーダル機能を備えます。Pixel電話は、視覚、音声、話し言葉などのコンテキストでより多くの情報を理解します。
- Androidデバイスのアクセシビリティ機能であるTalkbackは、視覚障害者や弱視者がタッチや音声フィードバックを使用するのを助け、Gemini Nano with Multimodalityにより改良されています。
- 新しいオプトイン詐欺保護機能は、Gemini NanoのオンデバイスAIを使用して、プライバシーを保護しながら詐欺電話を検出します。詳細は今年後半に公開されます。
- Circle to Searchは現在、1億以上のAndroidデバイスで利用可能で、年末までにその数を2倍にする予定です。
- まもなく、AndroidのGeminiを使用して、生成された画像を作成してGmail、Google Messagesなどにドラッグアンドドロップしたり、視聴中のYouTubeビデオについて質問したりできます。
- Gemini Advancedをお持ちの場合、「このPDFに質問する」オプションを使用して、複数のページをスクロールせずに迅速に回答を得られます。
- 学生は、選択したAndroidの電話やタブレットから直接宿題のヘルプにCircle to Searchを使用できます。この機能は、Geminiを基盤とした新しいモデルファミリーLearnLMによって強化されています。
- 今年後半、Circle to Searchは、記号式、図、グラフなどを含むさらに複雑な問題を解決できるようになります。
開発者向けの進展
- Gemini API Developer Competitionに参加して、最も役立つ画期的なAIアプリを発見する一部になれます。賞品は?1981年式DeLoreanのカスタム電気改装車です。
- 視覚的Q&Aと画像キャプションに最適化された最初のビジョン言語オープンモデルPaliGemmaを導入しました。
- Gemmaの次バージョン、Gemma 2をプレビューしました。これはまったく新しいアーキテクチャに基づいて構築され、27Bパラメータのより大きなインスタンスを含み、単一のTPUホストで動作し、2倍のサイズのモデルを上回ります。
責任あるAIの進展
- 私たちは、システムの弱点を積極的にテストし、壊そうとする実証済みのプラクティスであるレッドチームを強化しています。これは、「AI-Assisted Red Teaming」と呼ばれる新しい技術を通じて行われます。
- SynthIDをテキストとビデオの2つの新しいモダリティに拡張しています。
- SynthIDテキスト透かしは、更新されたResponsible Generative AIツールキットを通じて今後数か月でオープンソース化されます。
- LearnLMを発表しました。これは、Geminiを基盤とし、学習向けに微調整された新しいモデルファミリーです。LearnLMは、Gemini、Search、YouTube、Google Classroomなど、すでにさまざまな製品の機能を強化しています。



The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?




I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?




I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀




I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀




I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀




I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!












