I/O 2024的前100個公告揭示了

哇,I/O 2024 充滿了令人興奮的更新!無論您是熱衷於最新的 Gemini 應用程式增強功能、渴望體驗新的開發者工具,還是迫不及待想試玩最新的生成式 AI 功能,每個人都能找到適合自己的內容。不相信我們的話?看看我們在過去幾天宣布的100件事項。
AI 時刻與模型動能
- 我們推出了 Gemini 1.5 Flash,一款為速度和效率設計的輕量級模型。這是透過 API 提供的最快 Gemini 模型。
- 我們對 1.5 Pro 進行了顯著改進,這是我們在各種任務中表現最佳的頂級模型。
- 1.5 Pro 和 1.5 Flash 現已在 Google AI Studio 和 Vertex AI 上公開預覽,擁有100萬 token 的上下文窗口。
- 1.5 Pro 還可透過 Google AI Studio 和 Vertex AI 的候選名單為開發者提供200萬 token 的上下文窗口。
與 Gemini 1.5 的200萬 token 能力相比,領先基礎模型的上下文長度。
- 我們分享了 Project Astra,我們對未來 AI 助理的願景。
- 我們宣布了 Trillium,這是我們第六代自定義 AI 加速器——張量處理單元(TPU)。這是迄今為止性能最佳的 TPU。
- 與 TPU v5e 相比,Trillium TPU 在每塊晶片的峰值計算性能提高了4.7倍。
- 它們也是我們最具永續性的世代:Trillium TPU 的能源效率比 TPU v5e 高出67%以上。
- 我們展示了 NotebookLM 的 Audio Overviews 早期原型,該功能使用上傳的材料創建個性化的口頭討論。
- 我們宣布 Grounding with Google Search 已於 Vertex AI 上正式推出,將 Gemini 模型與全球知識和最新的網路資訊連繫起來。
- 我們為 Gemini API 和 AI Studio 增加了音頻理解功能,使 Gemini 1.5 Pro 能處理 AI Studio 中上傳的影片的圖像和音頻。
- 從 Pixel 開始,使用 Gemini Nano with Multimodality 的應用程式將像人類一樣理解世界——透過文字、視覺、聲音和口語。
生成式媒體模型與實驗室實驗
- 我們宣布了 Imagen 3,這是我們迄今為止最高品質的圖像生成模型。
- Imagen 3 能理解自然語言和您提示背後的意圖,納入較長提示中的細小細節,生成極其詳細、逼真的圖像,與我們之前的模型相比,視覺偽影更少。
- Imagen 3 也是我們在渲染文字方面最好的模型,這對圖像生成模型來說是一大挑戰。
- 我們在 ImageFX 中向可信測試者推出了 Imagen 3,您可以註冊加入候選名單。
- Imagen 3 將於今年夏天在 Vertex AI 上推出。
- 我們宣布了 Veo,這是我們迄今為止最具能力的影片生成模型,能生成高品質的1080p解析度影片,時長可超過一分鐘,涵蓋多種電影和視覺風格。
- 未來我們將把 Veo 的部分功能引入 YouTube Shorts 和其他產品。
- 我們展示了 Veo 為藝術家帶來的可能性,與包括唐納德·葛洛佛在內的電影製作人合作,使用 Veo 進行電影項目。
- 我們展示了 Music AI Sandbox,這是一套音樂 AI 工具,讓人們可以創建新的器樂部分、在不同曲目之間轉換風格等。您可以在 YouTube 上找到與 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
- 看看 無限仙境,藝術家和 Google 創意人員微調了一個 AI 模型,無限重新想像《愛麗絲夢遊仙境》的視覺世界。讀者可以根據每位藝術家的風格,為書中1,200句話生成無限圖像。
- 我們宣布了 VideoFX,這是我們最新的實驗工具,使用 Google DeepMind 的生成式影片模型 Veo,將創意轉化為影片片段。
- VideoFX 還包括一個 Storyboard 模式,讓您可以逐場景迭代並為最終影片添加音樂。
25. 我們為 ImageFX 增加了更多編輯控制——這是社群最熱門的要求之一——讓您可以透過簡單地在圖像上刷動來添加、移除或更改元素。
26. ImageFX 將使用 Imagen 3 解鎖更多逼真效果,帶來更豐富的細節、更少的視覺偽影和更精確的文字渲染。
27. MusicFX 現在有了“DJ 模式”,可幫助您透過結合不同流派和樂器來混音節拍,使用生成式 AI 將音樂故事變為現實。
28. 從本週起,ImageFX 和 MusicFX 已透過 Labs 在超過100個國家推出。
使用 Gemini 應用程式完成更多任務的新方式
- 我們將 Gemini 1.5 Pro 引入 Gemini Advanced 訂閱者,為他們提供100萬 token 的上下文窗口,並能處理1,500頁的 PDF。
- 這也意味著 Gemini Advanced 現在擁有任何商業化聊天機器人中最大的上下文窗口。
- 我們新增了透過 Google Drive 或直接從您的設備上傳檔案到 Gemini Advanced 的功能。
- 不久後,Gemini Advanced 將幫助您分析數據,挖掘洞察並從上傳的數據檔案(如試算表)中建立圖表。
- 對旅行者來說是個好消息:Gemini Advanced 現在有一個計劃功能,不僅僅是提供建議活動清單,還能為您創建客製化的行程。
34. 還有 Gemini Advanced 訂閱者的 Gemini Live,這是一個全新的、以行動裝置為優先的對話體驗,使用最先進的語音技術,讓與 Gemini 的口頭對話更自然、直觀。
35. Gemini Live 讓您可以從10種自然聲音中選擇,並能以自己的節奏說話或在回應中途打斷以提出澄清問題。
36. Google Messages 中的 Gemini 現在讓您可以在與朋友聊天的同一應用程式中與 Gemini 對話。
37. Gemini Advanced 訂閱者很快就能創建 Gems,這是為您夢想中的任何用途設計的客製化 Gemini 版本。只需描述您希望您的 Gem 做什麼以及如何回應,Gemini 將為您的特定需求創建一個 Gem。
38. 請留意更多與 Gemini 連繫的 Google 工具,包括 Google Calendar、Tasks、Keep 和 Clock。
讓搜尋為您完成工作的更新
- 我們使用為 Google Search 客製化的新 Gemini 模型,將 Gemini 的進階功能(如多步驟推理、計劃和多模態)與我們最佳的搜尋系統結合在一起。
- 搜尋中的 AI 概覽本週將在美國對所有人推出,更多國家即將推出。
41. 多步驟推理能力即將在美國的英文查詢中推出至搜尋實驗室的 AI 概覽,讓您可以提出複雜問題,例如“找到波士頓最好的瑜伽或皮拉提斯工作室,並顯示它們的入門優惠詳情以及從 Beacon Hill 步行所需的時間。”
42. 不久後,您將能調整 AI 概覽,選擇簡化語言或更詳細地分解內容,特別是當您對某個主題不熟悉或試圖深入了解某個主題時。
43. 搜尋還將獲得新的計劃功能。例如,餐點和旅行計劃的客製化將於今年晚些時候在搜尋實驗室推出,隨後還有更多類別,如派對和健身。
44. 由於影片理解的進展,您現在可以用影片提出問題。搜尋可以處理複雜的視覺問題,為您解答,然後以 AI 概覽提供下一步和資源。
45. 搜尋中的生成式 AI 即將為您尋找新靈感時創建 AI 組織的結果頁面。這些 AI 組織的搜尋結果頁面將適用於餐飲、食譜、電影、音樂、書籍、酒店、購物等類別。
工作空間和照片中的 Gemini 模型協助
- Gemini 1.5 Pro 現已在 Gmail、Docs、Drive、Slides 和 Sheets 的側邊欄中透過 Workspace Labs 提供,並將於下個月對我們的 Gemini for Workspace 客戶和 Google One AI Premium 訂閱者推出。
- 您將能使用 Gmail 的側邊欄來總結電子郵件並獲取最重要的細節和行動項目。
- 除了總結外,Gmail 的行動應用程式很快將使用 Gemini 提供兩項新功能:Contextual Smart Reply 和 Gmail Q&A。
- 在未來幾週內,Gmail 和 Docs 的“幫我寫”功能將支援西班牙語和葡萄牙語。
- 今年晚些時候在實驗室中,您可以要求 Gemini 自動在 Drive 中組織電子郵件附件,生成包含數據的試算表,然後使用 Data Q&A 進行分析。
- Google Photos 中的一項新實驗功能 Ask Photos 讓您更容易在圖庫中尋找特定記憶或回憶資訊。此功能使用 Gemini 模型,將在未來幾個月推出。
52. 您還可以使用 Ask Photos 從最近的旅行中創建一個亮點圖庫,它甚至會為您撰寫個性化的標題,以便在社交媒體上分享。
Android 進展
- 從今年晚些時候的 Pixel 開始,Gemini Nano——Android 的內建設備端基礎模型——將具有多模態能力。您的 Pixel 手機將在上下文中理解更多資訊,如視覺、聲音和口語。
- Talkback 是 Android 設備的無障礙功能,幫助盲人和低視力人士使用觸控和語音反饋,現因 Gemini Nano with Multimodality 而得到改進。
- 一項新的選擇性詐騙保護功能將使用 Gemini Nano 的設備端 AI,以保護隱私的方式幫助檢測詐騙電話。更多詳情將於今年晚些時候公布。
- 我們宣布 Circle to Search 目前已在超過1億台 Android 設備上可用,我們計劃在年底前將其翻倍。
- 不久後,您將能使用 Android 上的 Gemini 創建並拖放生成的圖像到 Gmail、Google Messages 等,或詢問您正在觀看的 YouTube 影片。
- 如果您有 Gemini Advanced,您還將能選擇“問這個 PDF”以快速獲得答案,而無需翻閱多頁。
- 學生現在可以直接從選定的 Android 手機和平板電腦使用 Circle to Search 來獲得作業幫助。此功能由 LearnLM 提供支持,這是我們基於 Gemini 並為學習進行微調的新模型系列。
- 今年晚些時候,Circle to Search 將能解決涉及符號公式、圖表、圖形等的更複雜問題。
61. 哦,我們還推出了 Android 15 的第二個測試版。
62. 盜竊檢測鎖使用強大的 Google AI 來感知您的設備是否被搶奪,並快速鎖定您手機上的資訊。
63. 私人空間即將在 Android 15 中推出,讓您可以選擇將應用程式保持在需要額外驗證才能開啟的獨立空間中。
64. 如果單獨的鎖定螢幕不足以保護您的私人空間,您可以完全隱藏其存在。
65. 今年晚些時候,Google Play Protect 將使用設備端 AI 來幫助發現試圖隱藏其行為以進行詐騙或網路釣魚的應用程式。
66. 我們為日本帶來了 Google Messages 中的 RCS,更新了訊息體驗。
67. 不久後在美國,您將能創建僅包含文字的數位通行證。只需拍攝一張通行證(如保險卡或活動門票)的照片,即可輕鬆將其添加到 Google Wallet 以便快速存取。
68. 我們展示了如何直接在 Google 地圖中提供擴增實境內容,為我們與三星和 Qualcomm 合作為 Android 生態系統構建的擴展實境(XR)平台奠定基礎。
69. 您現在可以在搭載 Google 內建的選定汽車上追看 Max 和 Peacock 的您喜愛的節目,或玩 Angry Birds。
70. 我們還將 Google Cast 引入搭載 Android Automotive OS 的汽車,從 Rivian 開始,在未來幾個月內,您可以輕鬆將手機的影片內容投射到汽車上。
71. 今年晚些時候,Wear OS 5 的手錶將迎來電池續航優化。例如,與 Wear OS 4 的手錶相比,戶外馬拉松的耗電量將減少高達20%。
72. Wear OS 5 還將為健身應用程式提供支援更多數據類型的選項,如地面接觸時間、步伐長度和垂直振盪。
73. 現在在 Google TV 和其他 Android TV OS 設備上,透過我們 Gemini 模型的個人化 AI 生成描述,選擇觀看內容變得更容易。
74. 這些 AI 生成的描述還將填補電影和節目缺少或未翻譯的描述。
75. 這是一個有趣的數據:自推出以來,人們已透過 Fast Pair 建立了超過10億次連線。
76. 本月晚些時候,您將能使用 Fast Pair 連線並在 Find My Device 應用程式中透過 Chipolo 和 PebbleBee 的藍牙追蹤標籤找到您的鑰匙、錢包或行李等物品(未來將有更多合作夥伴)。
開發者進展
- 您可以參加 Gemini API 開發者競賽,參與發現最有幫助且突破性的 AI 應用程式。獎品?一台電氣改造的1981年 DeLorean。
- 我們推出了 PaliGemma,我們首個為視覺問答和圖像標題優化的視覺語言開放模型。
- 我們預覽了 Gemma 的下一個版本,Gemma 2。它基於全新的架構,將包括一個更大的27B參數實例,性能超越兩倍於其大小的模型,並在單個 TPU 主機上運行。
80. Gemini 模型現已可用於幫助開發者在 Android Studio、IDX、Firebase、Colab、VSCode、Cloud 和 IntelliJ 中提高生產力。
81. Gemini 1.5 Pro 將於今年晚些時候在 Android Studio 中推出。憑藉大上下文窗口,此模型可提供更高品質的回應,並解鎖多模態輸入等使用場景。
82. Google AI Studio 現已在包括英國和歐盟在內的200多個國家推出。
83. Gemini API 現在支援平行函數調用和影片幀提取。
84. 透過 Gemini API 中的新上下文快取功能,將於下個月推出,您將能以較低的成本快取常用上下文檔案,簡化大型提示的工作流程。
85. Android 現在為 Kotlin 多平台提供一流支援,幫助開發者在不同平台間分享應用程式的業務邏輯。
86. 可調整大小的模擬器、Compose UI 檢查模式和由 Firebase 提供支持的 Android 設備串流是新產品,可幫助開發者為所有外形尺寸構建應用程式。
87. 從 Chrome 126 開始,Gemini Nano 將內建於 Chrome 桌面客戶端中。
88. 多頁應用程式的 View Transitions API,這是一個備受期待的功能,現已可用,讓開發者無論網站架構如何,都能輕鬆構建平滑、流暢的應用程式式導航。
89. Project IDX,我們為全端、多平台應用程式的新整合開發者體驗,現已開放給所有人試用。
90. Firebase 發佈了 beta 版的 Firebase Genkit,這將使開發者更容易將生成式 AI 體驗融入其應用程式。
91. Firebase 還發佈了 Firebase Data Connect,這是開發者使用 SQL 與 Firebase(透過 Google Cloud SQL)的新方式。這不僅將 SQL 工作流程引入 Firebase,還將減少開發者需要編寫的應用程式代碼量。
92. 我們與 James Manyika、Jeff Dean 和 Koray Kavukcuoglu 進行了一場深入對話,探討了驅動我們 AI 的技術和研究。
負責任的 AI 進展
- 我們正在增強紅隊測試——一種經過驗證的做法,我們主動測試自己的系統弱點並試圖破解它們——透過一種我們稱為“AI 輔助紅隊測試”的新技術。
- 我們還將 SynthID 擴展到兩種新模態:文字和影片。
- SynthID 文字水印也將在未來幾個月透過我們更新的負責任生成式 AI 工具包開源。
- 我們宣布了 LearnLM,這是基於 Gemini 並為學習進行微調的新模型系列。LearnLM 已為我們的產品(包括 Gemini、Search、YouTube 和 Google Classroom)中的一系列功能提供動力。
97. 我們將與哥倫比亞教師學院、亞利桑那州立大學、紐約大學 Tisch 和 Khan Academy 等機構的專家合作,進一步完善並擴展 LearnLM,超越我們的產品。
98. 我們還與 MIT RAISE 合作開發了一門線上課程,幫助教育工作者在課堂上有效使用生成式 AI。
99. 我們建立了一個名為 Illuminate 的新實驗工具,使知識更易於獲取和消化。
100. Illuminate 可生成由兩個 AI 生成的聲音組成的對話,提供研究論文關鍵洞察的概覽。您今天可以在 labs.google 註冊試用。
相關文章
Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot
Salesforce 推出全新工作場所 AI 策略,於週一宣布在 Slack 對話中引入專屬的「數位隊友」。全新工具 Agentforce in Slack 讓企業能夠創建並部署針對特定任務的 AI 代理,這些代理可搜尋工作場所聊天記錄、存取公司資料,並在員工日常工作的訊息平台內執行操作。「正如專業員工協作解決問題,我們的客戶需要 AI 代理共同合作,為客戶和員工解決問題,」Salesforce
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心
據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
Meta AI應用程式將推出高級訂閱與廣告
Meta的AI應用程式即將推出付費訂閱服務,類似於OpenAI、Google和Microsoft等競爭對手的產品。在2025年第一季財報電話會議中,Meta首席執行官馬克·祖克柏格概述了高級服務的計劃,讓用戶能夠使用更強大的運算能力或Meta AI的額外功能。為了與ChatGPT競爭,Meta本週推出了一款獨立的AI應用程式,允許用戶直接與聊天機器人互動並進行圖像生成。該聊天機器人目前擁有近10億
評論 (52)
0/200
DennisMitchell
2025-08-18 03:01:00
The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?
0
FredGreen
2025-08-10 13:00:59
I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?
0
CharlesHernández
2025-04-20 13:00:11
I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀
0
HaroldMoore
2025-04-20 12:28:30
I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀
0
RalphSanchez
2025-04-20 03:31:49
I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀
0
ThomasLewis
2025-04-19 14:38:18
I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!
0
哇,I/O 2024 充滿了令人興奮的更新!無論您是熱衷於最新的 Gemini 應用程式增強功能、渴望體驗新的開發者工具,還是迫不及待想試玩最新的生成式 AI 功能,每個人都能找到適合自己的內容。不相信我們的話?看看我們在過去幾天宣布的100件事項。
AI 時刻與模型動能
- 我們推出了 Gemini 1.5 Flash,一款為速度和效率設計的輕量級模型。這是透過 API 提供的最快 Gemini 模型。
- 我們對 1.5 Pro 進行了顯著改進,這是我們在各種任務中表現最佳的頂級模型。
- 1.5 Pro 和 1.5 Flash 現已在 Google AI Studio 和 Vertex AI 上公開預覽,擁有100萬 token 的上下文窗口。
- 1.5 Pro 還可透過 Google AI Studio 和 Vertex AI 的候選名單為開發者提供200萬 token 的上下文窗口。
- 我們分享了 Project Astra,我們對未來 AI 助理的願景。
- 我們宣布了 Trillium,這是我們第六代自定義 AI 加速器——張量處理單元(TPU)。這是迄今為止性能最佳的 TPU。
- 與 TPU v5e 相比,Trillium TPU 在每塊晶片的峰值計算性能提高了4.7倍。
- 它們也是我們最具永續性的世代:Trillium TPU 的能源效率比 TPU v5e 高出67%以上。
- 我們展示了 NotebookLM 的 Audio Overviews 早期原型,該功能使用上傳的材料創建個性化的口頭討論。
- 我們宣布 Grounding with Google Search 已於 Vertex AI 上正式推出,將 Gemini 模型與全球知識和最新的網路資訊連繫起來。
- 我們為 Gemini API 和 AI Studio 增加了音頻理解功能,使 Gemini 1.5 Pro 能處理 AI Studio 中上傳的影片的圖像和音頻。
- 從 Pixel 開始,使用 Gemini Nano with Multimodality 的應用程式將像人類一樣理解世界——透過文字、視覺、聲音和口語。
生成式媒體模型與實驗室實驗
- 我們宣布了 Imagen 3,這是我們迄今為止最高品質的圖像生成模型。
- Imagen 3 能理解自然語言和您提示背後的意圖,納入較長提示中的細小細節,生成極其詳細、逼真的圖像,與我們之前的模型相比,視覺偽影更少。
- Imagen 3 也是我們在渲染文字方面最好的模型,這對圖像生成模型來說是一大挑戰。
- 我們在 ImageFX 中向可信測試者推出了 Imagen 3,您可以註冊加入候選名單。
- Imagen 3 將於今年夏天在 Vertex AI 上推出。
- 我們宣布了 Veo,這是我們迄今為止最具能力的影片生成模型,能生成高品質的1080p解析度影片,時長可超過一分鐘,涵蓋多種電影和視覺風格。
- 未來我們將把 Veo 的部分功能引入 YouTube Shorts 和其他產品。
- 我們展示了 Veo 為藝術家帶來的可能性,與包括唐納德·葛洛佛在內的電影製作人合作,使用 Veo 進行電影項目。
- 我們展示了 Music AI Sandbox,這是一套音樂 AI 工具,讓人們可以創建新的器樂部分、在不同曲目之間轉換風格等。您可以在 YouTube 上找到與 Wyclef Jean 和 Marc Rebillet 合作的新歌曲。
- 看看 無限仙境,藝術家和 Google 創意人員微調了一個 AI 模型,無限重新想像《愛麗絲夢遊仙境》的視覺世界。讀者可以根據每位藝術家的風格,為書中1,200句話生成無限圖像。
- 我們宣布了 VideoFX,這是我們最新的實驗工具,使用 Google DeepMind 的生成式影片模型 Veo,將創意轉化為影片片段。
- VideoFX 還包括一個 Storyboard 模式,讓您可以逐場景迭代並為最終影片添加音樂。
使用 Gemini 應用程式完成更多任務的新方式
- 我們將 Gemini 1.5 Pro 引入 Gemini Advanced 訂閱者,為他們提供100萬 token 的上下文窗口,並能處理1,500頁的 PDF。
- 這也意味著 Gemini Advanced 現在擁有任何商業化聊天機器人中最大的上下文窗口。
- 我們新增了透過 Google Drive 或直接從您的設備上傳檔案到 Gemini Advanced 的功能。
- 不久後,Gemini Advanced 將幫助您分析數據,挖掘洞察並從上傳的數據檔案(如試算表)中建立圖表。
- 對旅行者來說是個好消息:Gemini Advanced 現在有一個計劃功能,不僅僅是提供建議活動清單,還能為您創建客製化的行程。
讓搜尋為您完成工作的更新
- 我們使用為 Google Search 客製化的新 Gemini 模型,將 Gemini 的進階功能(如多步驟推理、計劃和多模態)與我們最佳的搜尋系統結合在一起。
- 搜尋中的 AI 概覽本週將在美國對所有人推出,更多國家即將推出。
工作空間和照片中的 Gemini 模型協助
- Gemini 1.5 Pro 現已在 Gmail、Docs、Drive、Slides 和 Sheets 的側邊欄中透過 Workspace Labs 提供,並將於下個月對我們的 Gemini for Workspace 客戶和 Google One AI Premium 訂閱者推出。
- 您將能使用 Gmail 的側邊欄來總結電子郵件並獲取最重要的細節和行動項目。
- 除了總結外,Gmail 的行動應用程式很快將使用 Gemini 提供兩項新功能:Contextual Smart Reply 和 Gmail Q&A。
- 在未來幾週內,Gmail 和 Docs 的“幫我寫”功能將支援西班牙語和葡萄牙語。
- 今年晚些時候在實驗室中,您可以要求 Gemini 自動在 Drive 中組織電子郵件附件,生成包含數據的試算表,然後使用 Data Q&A 進行分析。
- Google Photos 中的一項新實驗功能 Ask Photos 讓您更容易在圖庫中尋找特定記憶或回憶資訊。此功能使用 Gemini 模型,將在未來幾個月推出。
Android 進展
- 從今年晚些時候的 Pixel 開始,Gemini Nano——Android 的內建設備端基礎模型——將具有多模態能力。您的 Pixel 手機將在上下文中理解更多資訊,如視覺、聲音和口語。
- Talkback 是 Android 設備的無障礙功能,幫助盲人和低視力人士使用觸控和語音反饋,現因 Gemini Nano with Multimodality 而得到改進。
- 一項新的選擇性詐騙保護功能將使用 Gemini Nano 的設備端 AI,以保護隱私的方式幫助檢測詐騙電話。更多詳情將於今年晚些時候公布。
- 我們宣布 Circle to Search 目前已在超過1億台 Android 設備上可用,我們計劃在年底前將其翻倍。
- 不久後,您將能使用 Android 上的 Gemini 創建並拖放生成的圖像到 Gmail、Google Messages 等,或詢問您正在觀看的 YouTube 影片。
- 如果您有 Gemini Advanced,您還將能選擇“問這個 PDF”以快速獲得答案,而無需翻閱多頁。
- 學生現在可以直接從選定的 Android 手機和平板電腦使用 Circle to Search 來獲得作業幫助。此功能由 LearnLM 提供支持,這是我們基於 Gemini 並為學習進行微調的新模型系列。
- 今年晚些時候,Circle to Search 將能解決涉及符號公式、圖表、圖形等的更複雜問題。
開發者進展
- 您可以參加 Gemini API 開發者競賽,參與發現最有幫助且突破性的 AI 應用程式。獎品?一台電氣改造的1981年 DeLorean。
- 我們推出了 PaliGemma,我們首個為視覺問答和圖像標題優化的視覺語言開放模型。
- 我們預覽了 Gemma 的下一個版本,Gemma 2。它基於全新的架構,將包括一個更大的27B參數實例,性能超越兩倍於其大小的模型,並在單個 TPU 主機上運行。
負責任的 AI 進展
- 我們正在增強紅隊測試——一種經過驗證的做法,我們主動測試自己的系統弱點並試圖破解它們——透過一種我們稱為“AI 輔助紅隊測試”的新技術。
- 我們還將 SynthID 擴展到兩種新模態:文字和影片。
- SynthID 文字水印也將在未來幾個月透過我們更新的負責任生成式 AI 工具包開源。
- 我們宣布了 LearnLM,這是基於 Gemini 並為學習進行微調的新模型系列。LearnLM 已為我們的產品(包括 Gemini、Search、YouTube 和 Google Classroom)中的一系列功能提供動力。



The I/O 2024 updates blew my mind! 😍 Those new Gemini app features are slick, but I'm really curious how devs will use those generative AI tools. Anyone else hyped to see what apps come out of this?




I/O 2024 was a blast! The Gemini app upgrades sound slick, but I'm curious if the new AI features will actually make my life easier or just add more buzzwords to my inbox. 😎 Anyone tried them yet?




I/O 2024 was insane! So many cool updates, especially the Gemini app enhancements. I'm super excited to try out the new generative AI features. The list of 100 announcements is a bit overwhelming, but in a good way! Can't wait to dive in! 🚀




I/O 2024は最高でした!Geminiアプリの強化が特に気に入りました。新しい生成AIの機能も楽しみですが、開発者ツールについてもう少し詳しく知りたかったです。全部試すのが待ちきれません!😊🚀




I/O 2024 정말 대단했어! 특히 제미니 앱의 강화가 최고야. 새로운 생성 AI 기능을 시도하는 게 너무 기대돼. 100개의 발표 목록은 조금 압도적이지만, 좋은 의미에서 그래! 빨리 써보고 싶어! 🚀




I/O 2024は最高でした!ジェミニアプリの更新が特に気に入りました。新しい生成AI機能も試してみたいです。100の発表リストは圧倒的ですが、良い意味で!😅 早く詳しく見てみたいですね!












