Google I/O 2024:揭開下一代的創新
Google 正全面迎接我們所稱的 Gemini 時代。
在深入細節之前,讓我先一刻反思我們目前的處境。我們在過去十多年來持續投入資源於 AI,推動研究、產品開發和基礎設施的極限。今天,我們將涵蓋所有這些內容以及更多。
我們仍處於這場 AI 平台轉變的開端,潛力無窮——對創作者、開發者、新創公司以及所有人來說皆是如此。這就是 Gemini 時代的意義:推動這些機會向前發展。所以,讓我們直接開始吧。
Gemini 時代
去年在 I/O 大會上,我們揭示了 Gemini 的願景:一款從一開始就設計為原生多模態的尖端模型,能夠處理文字、圖像、影片、程式碼等。這是朝向將任何輸入轉化為任何輸出的重大飛躍——下一世代的“I/O”。
自那以來,我們推出了首批 Gemini 模型,這些模型在多模態性能上設定了新標準。僅兩個月後,我們介紹了 Gemini 1.5 Pro,這款模型在處理長上下文方面取得了重大突破。它能在生產環境中處理 100 萬個 token,超越了迄今任何其他大規模基礎模型。
我們致力於確保每個人都能從 Gemini 的能力中受益。我們迅速採取行動與您分享這些進展。今天,超過 150 萬名開發者在我們的工具中使用 Gemini 模型,從除錯程式碼到獲得新洞察,並打造下一波 AI 應用程式。
我們也以有意義的方式將 Gemini 的強大功能整合到我們的產品中。今天您將在搜尋、照片、工作空間、Android 等領域看到範例。
產品進展
目前,我們所有擁有 20 億用戶的產品都由 Gemini 驅動。
我們還推出了新體驗,包括一款您可以直接與 Gemini 互動的行動應用程式,適用於 Android 和 iOS。透過 Gemini Advanced,您可以體驗我們最先進的模型。僅三個月內,就有超過 100 萬人註冊試用,勢頭持續增強。
擴展搜尋中的 AI 總覽
Gemini 在 Google 搜尋中的發展是最令人振奮的進展之一。
在過去一年中,我們透過搜尋生成體驗處理了數十億次查詢。用戶以全新方式探索搜尋,提出更長且更複雜的問題,甚至使用照片進行搜尋,並獲得網路上最佳的結果。

我們已將此體驗從實驗室擴展到更廣泛的測試,我們很高興看到搜尋使用量不僅增加,用戶滿意度也更高。
我很高興宣佈,我們將於本週在美國向所有人推出這個全面改進的體驗——AI 總覽,更多國家也將很快跟進。
感謝 Gemini,我們正在推動搜尋可能性的邊界,包括我們自己的產品內部。
介紹問照片
以 Google 照片為例,我們在近九年前推出了這款產品。它已成為組織生活中最珍貴記憶的首選,每天上傳超過 60 億張照片和影片。
人們喜歡使用照片來搜尋他們的生活。有了 Gemini,這變得更加輕鬆。
想像您在停車場,卻記不起車牌號碼。以前,您需要用關鍵字搜尋照片,翻閱多年來的照片來尋找。現在,您只需問照片。它能辨識您常使用的車輛,找出您的車,並給您車牌號碼。
問照片還能幫您深入挖掘記憶。例如,您在回想女兒 Lucia 的早期里程碑。您可以問照片:“Lucia 什麼時候學會游泳?”
接著您可以提出更複雜的問題,例如:“展示 Lucia 的游泳進展如何。”

在這裡,Gemini 超越簡單搜尋,理解不同情境——從泳池划水到海洋浮潛,再到游泳證書上的文字和日期。照片隨後將所有內容彙編成摘要,讓您重溫那些美好的記憶。我們將於今年夏天推出問照片,更多功能即將推出。
以多模態和長上下文解鎖更多知識
Gemini 的多模態設計旨在解鎖各種格式的知識。這是一個能理解並連接不同輸入類型的模型。
這種方法擴展了我們可以提出的問題類型以及獲得的答案。長上下文進一步推進了這一點,使我們能夠處理大量資訊:數百頁文字、數小時音訊、一小時影片、整個程式碼儲存庫,甚至 96 份 Cheesecake Factory 菜單。
對於如此多的菜單,您需要一個 100 萬 token 的上下文窗口,這在 Gemini 1.5 Pro 中已成為可能。開發者正以非常酷的方式使用它。

過去幾個月,我們已逐步推出長上下文的 Gemini 1.5 Pro 預覽版,並在翻譯、程式設計和推理方面進行了品質改進。這些更新現已反映在模型中。
我很高興宣佈,我們將使這個改進版本的 Gemini 1.5 Pro 對全球所有開發者開放。此外,Gemini 1.5 Pro 與 100 萬上下文現已直接在 Gemini Advanced 中供消費者使用,支持 35 種語言。
在私人預覽中擴展至 200 萬 token
100 萬 token 已開啟新可能性,但我們不會止步於此。
今天,我們將上下文窗口擴展至 200 萬 token,供開發者在私人預覽中使用。
在短短幾個月內,我們的進展令人難以置信。這是朝向我們最終目標——無限上下文的又一步。
將 Gemini 1.5 Pro 引入工作空間
我們討論了兩個關鍵技術進展:多模態和長上下文。各自都強大無比,但結合起來,它們解鎖了更深層次的能力和智慧。
這在 Google 工作空間中尤為明顯。
人們常在 Gmail 中搜尋他們的電子郵件。有了 Gemini,這變得更加強大。例如,作為家長,您想隨時了解孩子的學校活動。Gemini 能幫您追蹤。
您可以要求 Gemini 總結最近來自學校的電子郵件。在幕後,它會辨識相關郵件,甚至分析 PDF 等附件。您會得到關鍵要點和行動項目的摘要。如果您因出差錯過了家長會,而錄影長達一小時,Gemini 可以從 Google Meet 的錄影中突出重要部分。如果有志願者需求而您有空,Gemini 還能為您起草回覆。
這能以無數方式簡化您的生活。Gemini 1.5 Pro 現已在工作空間實驗室中可用。Aparna 將分享更多細節。
NotebookLM 中的音訊輸出
我們已經看到文字輸出的例子,但有了多模態模型,我們可以做到更多。
我們在這方面取得了進展,還有更多即將推出。NotebookLM 中的音訊總覽展示了這一點。它使用 Gemini 1.5 Pro 從您的來源資料生成個性化且互動的音訊對話。
這就是多模態的潛力。很快,您將能混合搭配輸入和輸出。這就是我們所說的新一代“I/O”。但如果我們能走得更遠呢?
用 AI 代理進一步前進
我們看到的一個令人振奮的機會是 AI 代理。這些是能夠推理、計劃和記憶的智能系統。它們能提前思考數步,並跨軟體和系統工作,代表您完成任務,始終在您的監督下。
我們仍處於早期階段,但讓我為您展示我們正在研究的用例類型。
以購物為例。買鞋很有趣,但如果不合腳,退貨就不那麼有趣了。
想像 Gemini 能為您處理所有步驟:
- 搜尋您的收件匣找收據...
- 從您的電子郵件中找到訂單號...
- 填寫退貨表單...
- 甚至安排 UPS 取件。
這樣是不是簡單多了?
讓我們考慮一個更複雜的場景。假設您剛搬到芝加哥。Gemini 和 Chrome 可以一起幫您安頓下來——為您組織、推理和綜合資訊。
您會想探索城市並找到當地服務,從乾洗店到遛狗服務。您還需要更新眾多網站上的新地址。
Gemini 可以管理這些任務,並在需要時詢問更多資訊,確保您始終掌控全局。
這至關重要——隨著我們開發這些體驗,我們專注於隱私、安全,並使其對所有人可及。
這些是簡單的例子,但它們展示了我們旨在通過構建智能系統解決的問題類型,這些系統能提前思考、推理並為您計劃。
對我們使命的意義
Gemini 的力量——其多模態、長上下文和代理——讓我們更接近我們的終極目標:讓 AI 對每個人都更有幫助。
這是我們實現使命的最大進展:組織全球資訊,涵蓋每一種輸入,通過任何輸出使其可及,並以真正有用的方式將全球資訊與您的世界資訊結合。
開拓新領域
要充分實現 AI 的潛力,我們需要突破界限。Google DeepMind 團隊一直在努力實現這一點。
我們看到對 1.5 Pro 及其長上下文窗口的極大熱情。但開發者也想要更快、更具成本效益的東西。因此,明天我們將推出 Gemini 1.5 Flash,一款為規模化設計的輕量級模型。它針對低延遲和成本至關重要的任務進行了最佳化。1.5 Flash 將於週二在 AI Studio 和 Vertex AI 上提供。
展望未來,我們一直希望打造一個對日常生活有用的通用代理。Project Astra 展示了多模態理解和即時對話能力。

我們在影片和圖像生成方面也取得了進展,推出了 Veo 和 Imagen 3,並介紹了 Gemma 2.0,我們的下一代開放模型,促進負責任的 AI 創新。您可以從 Demis Hassabis 了解更多。
AI 時代的基礎設施:介紹 Trillium
訓練最先進的模型需要大量運算能力。過去六年,機器學習運算需求增長了 100 萬倍,每年增長十倍。
Google 為此而生。25 年來,我們投資於世界級技術基礎設施,從支持搜尋的尖端硬體到推動我們 AI 進展的定制張量處理單元。
Gemini 完全在我們的第四和第五代 TPU 上訓練和運行。其他領先的 AI 公司,包括 Anthropic,也在我們的 TPU 上訓練了他們的模型。
今天,我們很高興宣佈我們的第六代 TPU,名為 Trillium。Trillium 是我們迄今最具性能和效率的 TPU,與上一代 TPU v5e 相比,每晶片運算性能提高了 4.7 倍。
我們將於 2024 年末向我們的雲客戶提供 Trillium。
除了我們的 TPU,我們還為任何工作負載提供 CPU 和 GPU。這包括我們上個月宣佈的 Axion 處理器,這是我們首款基於 Arm 的定制 CPU,提供業界領先的性能和能源效率。
我們也是首批提供 NVIDIA 尖端 Blackwell GPU 的雲提供商之一,將於 2025 年初提供。我們與 NVIDIA 的長期合作夥伴關係使我們能夠將 Blackwell 的突破性能力帶給我們的客戶。
晶片是我們端到端整合系統的基礎部分,從性能最佳化的硬體和開放軟體到靈活的消費模型。這一切在我們的 AI 超級電腦中匯聚,這是一個突破性的超級電腦架構。
企業和開發者正使用它來應對更複雜的挑戰,效率比僅購買原始硬體和晶片高出兩倍以上。我們的 AI 超級電腦進展部分得益於我們在資料中心採用的液冷方式。
我們近十年來一直在這樣做,遠早於這成為業界最先進的技術。今天,我們部署的液冷系統總容量接近 1 吉瓦並持續增長——這是其他任何艦隊容量的近 70 倍。
這一切的基礎是我們全球網絡的規模,連接我們的基礎設施。我們的網絡跨越超過 200 萬英里的陸地和海底光纖:比下一個領先的雲提供商覆蓋範圍大 10 倍以上。
我們將繼續進行必要的投資,以推進 AI 創新並提供最先進的能力。

搜尋最激動人心的篇章
我們最大的投資和創新領域之一是我們的創始產品——搜尋。25 年前,我們創建了搜尋,幫助人們在線上資訊洪流中導航。
隨著每個平台轉變,我們實現了突破,以更好地回答您的問題。在行動裝置上,我們解鎖了新型的問題和答案——使用更好的情境、位置感知和即時資訊。隨著自然語言理解和電腦視覺的進展,我們啟用了新的搜尋方式,例如使用您的聲音或哼唱來尋找您的新最愛歌曲,或使用您散步時看到的花朵圖像搜尋。現在您甚至可以圈選搜尋您想買的那些酷新鞋。去試試吧,您隨時可以退貨!
當然,Gemini 時代的搜尋將把這一切提升到全新層次,結合我們的基礎設施優勢、最新 AI 能力、對資訊品質的高標準,以及我們數十年來將您連接到網路豐富內容的經驗。結果是一個為您完成工作的產品。
Google 搜尋是人類好奇心規模上的生成 AI。這是我們搜尋中最激動人心的篇章。從 Liz Reid 了解更多關於 Gemini 時代搜尋的資訊。
更智能的 Gemini 體驗
Gemini 不僅僅是聊天機器人;它被設計為您的個人、實用的助手,能處理複雜任務並代表您採取行動。
與 Gemini 的互動應感覺像對話且直觀。因此,我們宣佈了一個新的 Gemini 體驗,名為 Live,讓您可以使用語音與 Gemini 進行深入對話。我們也將在今年晚些時候將 200 萬 token 帶到 Gemini Advanced,使上傳和分析超大檔案如影片和長程式碼成為可能。Sissie Hsiao 分享更多細節。
Android 上的 Gemini
全球有數十億 Android 使用者,我們很高興將 Gemini 更深入整合到用戶體驗中。作為您的新 AI 助手,Gemini 隨時隨地為您提供幫助。我們已將 Gemini 模型整合到 Android 中,包括我們最新的設備上模型:Gemini Nano with Multimodality,它處理文字、圖像、音訊和語音,以解鎖新體驗,同時保持您的設備上的資訊隱私。Sameer Samat 在此分享 Android 新聞。
我們對 AI 的負責任方法
我們繼續以大膽和興奮的態度迎接 AI 機會。我們也確保以負責任的方式進行。我們正在開發一種尖端的技術,稱為 AI 輔助紅隊測試,該技術借鑒 Google DeepMind 的遊戲突破,如 AlphaGo,以改進我們的模型。此外,我們已將 SynthID,我們的浮水印工具,擴展到兩個新模態:文字和影片,使 AI 生成的內容更容易識別。James Manyika 分享更多。
一起創造未來
所有這些顯示了我們在採取大膽且負責任的方式使 AI 對每個人都更有幫助的重大進展。
我們長期以來以 AI 為優先。我們數十年的研究領導地位開創了許多現代突破,推動了我們和整個行業的 AI 進展。此外,我們擁有:
- 為 AI 時代打造的世界領先基礎設施
- 搜尋的尖端創新,現由 Gemini 驅動
- 以非凡規模提供幫助的產品——包括 15 種擁有 5 億用戶的產品
- 以及使每個人——合作夥伴、客戶、創作者和您們所有人——能夠創造未來的平台。
這些進展只有在我們出色的開發者社群支持下才有可能。你們每天通過構建的體驗和應用程式讓這一切成為現實。因此,對在 Shoreline 的每個人以及全球數百萬觀眾,致敬未來的可能性,並一起創造它們。

從 Google 獲取更多故事到您的收件匣。
電子郵件地址您的資訊將根據 Google 的隱私政策使用。
訂閱完成。還差一步。
檢查您的收件匣以確認您的訂閱。
您已訂閱我們的通訊。
您也可以使用不同的電子郵件地址訂閱。
相關文章
Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot
Salesforce 推出全新工作場所 AI 策略,於週一宣布在 Slack 對話中引入專屬的「數位隊友」。全新工具 Agentforce in Slack 讓企業能夠創建並部署針對特定任務的 AI 代理,這些代理可搜尋工作場所聊天記錄、存取公司資料,並在員工日常工作的訊息平台內執行操作。「正如專業員工協作解決問題,我們的客戶需要 AI 代理共同合作,為客戶和員工解決問題,」Salesforce
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心
據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
Meta AI應用程式將推出高級訂閱與廣告
Meta的AI應用程式即將推出付費訂閱服務,類似於OpenAI、Google和Microsoft等競爭對手的產品。在2025年第一季財報電話會議中,Meta首席執行官馬克·祖克柏格概述了高級服務的計劃,讓用戶能夠使用更強大的運算能力或Meta AI的額外功能。為了與ChatGPT競爭,Meta本週推出了一款獨立的AI應用程式,允許用戶直接與聊天機器人互動並進行圖像生成。該聊天機器人目前擁有近10億
評論 (27)
0/200
FredGreen
2025-08-21 15:01:19
Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎
0
TimothyHernández
2025-08-08 21:00:59
Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎
0
AlbertRodriguez
2025-04-25 06:33:43
Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀
0
StevenNelson
2025-04-24 14:18:04
Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀
0
MatthewGonzalez
2025-04-24 00:59:25
O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀
0
ScottWalker
2025-04-22 20:54:29
Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀
0
Google 正全面迎接我們所稱的 Gemini 時代。
在深入細節之前,讓我先一刻反思我們目前的處境。我們在過去十多年來持續投入資源於 AI,推動研究、產品開發和基礎設施的極限。今天,我們將涵蓋所有這些內容以及更多。
我們仍處於這場 AI 平台轉變的開端,潛力無窮——對創作者、開發者、新創公司以及所有人來說皆是如此。這就是 Gemini 時代的意義:推動這些機會向前發展。所以,讓我們直接開始吧。
Gemini 時代
去年在 I/O 大會上,我們揭示了 Gemini 的願景:一款從一開始就設計為原生多模態的尖端模型,能夠處理文字、圖像、影片、程式碼等。這是朝向將任何輸入轉化為任何輸出的重大飛躍——下一世代的“I/O”。
自那以來,我們推出了首批 Gemini 模型,這些模型在多模態性能上設定了新標準。僅兩個月後,我們介紹了 Gemini 1.5 Pro,這款模型在處理長上下文方面取得了重大突破。它能在生產環境中處理 100 萬個 token,超越了迄今任何其他大規模基礎模型。
我們致力於確保每個人都能從 Gemini 的能力中受益。我們迅速採取行動與您分享這些進展。今天,超過 150 萬名開發者在我們的工具中使用 Gemini 模型,從除錯程式碼到獲得新洞察,並打造下一波 AI 應用程式。
我們也以有意義的方式將 Gemini 的強大功能整合到我們的產品中。今天您將在搜尋、照片、工作空間、Android 等領域看到範例。
產品進展
目前,我們所有擁有 20 億用戶的產品都由 Gemini 驅動。
我們還推出了新體驗,包括一款您可以直接與 Gemini 互動的行動應用程式,適用於 Android 和 iOS。透過 Gemini Advanced,您可以體驗我們最先進的模型。僅三個月內,就有超過 100 萬人註冊試用,勢頭持續增強。
擴展搜尋中的 AI 總覽
Gemini 在 Google 搜尋中的發展是最令人振奮的進展之一。
在過去一年中,我們透過搜尋生成體驗處理了數十億次查詢。用戶以全新方式探索搜尋,提出更長且更複雜的問題,甚至使用照片進行搜尋,並獲得網路上最佳的結果。
我們已將此體驗從實驗室擴展到更廣泛的測試,我們很高興看到搜尋使用量不僅增加,用戶滿意度也更高。
我很高興宣佈,我們將於本週在美國向所有人推出這個全面改進的體驗——AI 總覽,更多國家也將很快跟進。
感謝 Gemini,我們正在推動搜尋可能性的邊界,包括我們自己的產品內部。
介紹問照片
以 Google 照片為例,我們在近九年前推出了這款產品。它已成為組織生活中最珍貴記憶的首選,每天上傳超過 60 億張照片和影片。
人們喜歡使用照片來搜尋他們的生活。有了 Gemini,這變得更加輕鬆。
想像您在停車場,卻記不起車牌號碼。以前,您需要用關鍵字搜尋照片,翻閱多年來的照片來尋找。現在,您只需問照片。它能辨識您常使用的車輛,找出您的車,並給您車牌號碼。
問照片還能幫您深入挖掘記憶。例如,您在回想女兒 Lucia 的早期里程碑。您可以問照片:“Lucia 什麼時候學會游泳?”
接著您可以提出更複雜的問題,例如:“展示 Lucia 的游泳進展如何。”
在這裡,Gemini 超越簡單搜尋,理解不同情境——從泳池划水到海洋浮潛,再到游泳證書上的文字和日期。照片隨後將所有內容彙編成摘要,讓您重溫那些美好的記憶。我們將於今年夏天推出問照片,更多功能即將推出。
以多模態和長上下文解鎖更多知識
Gemini 的多模態設計旨在解鎖各種格式的知識。這是一個能理解並連接不同輸入類型的模型。
這種方法擴展了我們可以提出的問題類型以及獲得的答案。長上下文進一步推進了這一點,使我們能夠處理大量資訊:數百頁文字、數小時音訊、一小時影片、整個程式碼儲存庫,甚至 96 份 Cheesecake Factory 菜單。
對於如此多的菜單,您需要一個 100 萬 token 的上下文窗口,這在 Gemini 1.5 Pro 中已成為可能。開發者正以非常酷的方式使用它。
過去幾個月,我們已逐步推出長上下文的 Gemini 1.5 Pro 預覽版,並在翻譯、程式設計和推理方面進行了品質改進。這些更新現已反映在模型中。
我很高興宣佈,我們將使這個改進版本的 Gemini 1.5 Pro 對全球所有開發者開放。此外,Gemini 1.5 Pro 與 100 萬上下文現已直接在 Gemini Advanced 中供消費者使用,支持 35 種語言。
在私人預覽中擴展至 200 萬 token
100 萬 token 已開啟新可能性,但我們不會止步於此。
今天,我們將上下文窗口擴展至 200 萬 token,供開發者在私人預覽中使用。
在短短幾個月內,我們的進展令人難以置信。這是朝向我們最終目標——無限上下文的又一步。
將 Gemini 1.5 Pro 引入工作空間
我們討論了兩個關鍵技術進展:多模態和長上下文。各自都強大無比,但結合起來,它們解鎖了更深層次的能力和智慧。
這在 Google 工作空間中尤為明顯。
人們常在 Gmail 中搜尋他們的電子郵件。有了 Gemini,這變得更加強大。例如,作為家長,您想隨時了解孩子的學校活動。Gemini 能幫您追蹤。
您可以要求 Gemini 總結最近來自學校的電子郵件。在幕後,它會辨識相關郵件,甚至分析 PDF 等附件。您會得到關鍵要點和行動項目的摘要。如果您因出差錯過了家長會,而錄影長達一小時,Gemini 可以從 Google Meet 的錄影中突出重要部分。如果有志願者需求而您有空,Gemini 還能為您起草回覆。
這能以無數方式簡化您的生活。Gemini 1.5 Pro 現已在工作空間實驗室中可用。Aparna 將分享更多細節。
NotebookLM 中的音訊輸出
我們已經看到文字輸出的例子,但有了多模態模型,我們可以做到更多。
我們在這方面取得了進展,還有更多即將推出。NotebookLM 中的音訊總覽展示了這一點。它使用 Gemini 1.5 Pro 從您的來源資料生成個性化且互動的音訊對話。
這就是多模態的潛力。很快,您將能混合搭配輸入和輸出。這就是我們所說的新一代“I/O”。但如果我們能走得更遠呢?
用 AI 代理進一步前進
我們看到的一個令人振奮的機會是 AI 代理。這些是能夠推理、計劃和記憶的智能系統。它們能提前思考數步,並跨軟體和系統工作,代表您完成任務,始終在您的監督下。
我們仍處於早期階段,但讓我為您展示我們正在研究的用例類型。
以購物為例。買鞋很有趣,但如果不合腳,退貨就不那麼有趣了。
想像 Gemini 能為您處理所有步驟:
- 搜尋您的收件匣找收據...
- 從您的電子郵件中找到訂單號...
- 填寫退貨表單...
- 甚至安排 UPS 取件。
這樣是不是簡單多了?
讓我們考慮一個更複雜的場景。假設您剛搬到芝加哥。Gemini 和 Chrome 可以一起幫您安頓下來——為您組織、推理和綜合資訊。
您會想探索城市並找到當地服務,從乾洗店到遛狗服務。您還需要更新眾多網站上的新地址。
Gemini 可以管理這些任務,並在需要時詢問更多資訊,確保您始終掌控全局。
這至關重要——隨著我們開發這些體驗,我們專注於隱私、安全,並使其對所有人可及。
這些是簡單的例子,但它們展示了我們旨在通過構建智能系統解決的問題類型,這些系統能提前思考、推理並為您計劃。
對我們使命的意義
Gemini 的力量——其多模態、長上下文和代理——讓我們更接近我們的終極目標:讓 AI 對每個人都更有幫助。
這是我們實現使命的最大進展:組織全球資訊,涵蓋每一種輸入,通過任何輸出使其可及,並以真正有用的方式將全球資訊與您的世界資訊結合。
開拓新領域
要充分實現 AI 的潛力,我們需要突破界限。Google DeepMind 團隊一直在努力實現這一點。
我們看到對 1.5 Pro 及其長上下文窗口的極大熱情。但開發者也想要更快、更具成本效益的東西。因此,明天我們將推出 Gemini 1.5 Flash,一款為規模化設計的輕量級模型。它針對低延遲和成本至關重要的任務進行了最佳化。1.5 Flash 將於週二在 AI Studio 和 Vertex AI 上提供。
展望未來,我們一直希望打造一個對日常生活有用的通用代理。Project Astra 展示了多模態理解和即時對話能力。
我們在影片和圖像生成方面也取得了進展,推出了 Veo 和 Imagen 3,並介紹了 Gemma 2.0,我們的下一代開放模型,促進負責任的 AI 創新。您可以從 Demis Hassabis 了解更多。
AI 時代的基礎設施:介紹 Trillium
訓練最先進的模型需要大量運算能力。過去六年,機器學習運算需求增長了 100 萬倍,每年增長十倍。
Google 為此而生。25 年來,我們投資於世界級技術基礎設施,從支持搜尋的尖端硬體到推動我們 AI 進展的定制張量處理單元。
Gemini 完全在我們的第四和第五代 TPU 上訓練和運行。其他領先的 AI 公司,包括 Anthropic,也在我們的 TPU 上訓練了他們的模型。
今天,我們很高興宣佈我們的第六代 TPU,名為 Trillium。Trillium 是我們迄今最具性能和效率的 TPU,與上一代 TPU v5e 相比,每晶片運算性能提高了 4.7 倍。
我們將於 2024 年末向我們的雲客戶提供 Trillium。
除了我們的 TPU,我們還為任何工作負載提供 CPU 和 GPU。這包括我們上個月宣佈的 Axion 處理器,這是我們首款基於 Arm 的定制 CPU,提供業界領先的性能和能源效率。
我們也是首批提供 NVIDIA 尖端 Blackwell GPU 的雲提供商之一,將於 2025 年初提供。我們與 NVIDIA 的長期合作夥伴關係使我們能夠將 Blackwell 的突破性能力帶給我們的客戶。
晶片是我們端到端整合系統的基礎部分,從性能最佳化的硬體和開放軟體到靈活的消費模型。這一切在我們的 AI 超級電腦中匯聚,這是一個突破性的超級電腦架構。
企業和開發者正使用它來應對更複雜的挑戰,效率比僅購買原始硬體和晶片高出兩倍以上。我們的 AI 超級電腦進展部分得益於我們在資料中心採用的液冷方式。
我們近十年來一直在這樣做,遠早於這成為業界最先進的技術。今天,我們部署的液冷系統總容量接近 1 吉瓦並持續增長——這是其他任何艦隊容量的近 70 倍。
這一切的基礎是我們全球網絡的規模,連接我們的基礎設施。我們的網絡跨越超過 200 萬英里的陸地和海底光纖:比下一個領先的雲提供商覆蓋範圍大 10 倍以上。
我們將繼續進行必要的投資,以推進 AI 創新並提供最先進的能力。
搜尋最激動人心的篇章
我們最大的投資和創新領域之一是我們的創始產品——搜尋。25 年前,我們創建了搜尋,幫助人們在線上資訊洪流中導航。
隨著每個平台轉變,我們實現了突破,以更好地回答您的問題。在行動裝置上,我們解鎖了新型的問題和答案——使用更好的情境、位置感知和即時資訊。隨著自然語言理解和電腦視覺的進展,我們啟用了新的搜尋方式,例如使用您的聲音或哼唱來尋找您的新最愛歌曲,或使用您散步時看到的花朵圖像搜尋。現在您甚至可以圈選搜尋您想買的那些酷新鞋。去試試吧,您隨時可以退貨!
當然,Gemini 時代的搜尋將把這一切提升到全新層次,結合我們的基礎設施優勢、最新 AI 能力、對資訊品質的高標準,以及我們數十年來將您連接到網路豐富內容的經驗。結果是一個為您完成工作的產品。
Google 搜尋是人類好奇心規模上的生成 AI。這是我們搜尋中最激動人心的篇章。從 Liz Reid 了解更多關於 Gemini 時代搜尋的資訊。
更智能的 Gemini 體驗
Gemini 不僅僅是聊天機器人;它被設計為您的個人、實用的助手,能處理複雜任務並代表您採取行動。
與 Gemini 的互動應感覺像對話且直觀。因此,我們宣佈了一個新的 Gemini 體驗,名為 Live,讓您可以使用語音與 Gemini 進行深入對話。我們也將在今年晚些時候將 200 萬 token 帶到 Gemini Advanced,使上傳和分析超大檔案如影片和長程式碼成為可能。Sissie Hsiao 分享更多細節。
Android 上的 Gemini
全球有數十億 Android 使用者,我們很高興將 Gemini 更深入整合到用戶體驗中。作為您的新 AI 助手,Gemini 隨時隨地為您提供幫助。我們已將 Gemini 模型整合到 Android 中,包括我們最新的設備上模型:Gemini Nano with Multimodality,它處理文字、圖像、音訊和語音,以解鎖新體驗,同時保持您的設備上的資訊隱私。Sameer Samat 在此分享 Android 新聞。
我們對 AI 的負責任方法
我們繼續以大膽和興奮的態度迎接 AI 機會。我們也確保以負責任的方式進行。我們正在開發一種尖端的技術,稱為 AI 輔助紅隊測試,該技術借鑒 Google DeepMind 的遊戲突破,如 AlphaGo,以改進我們的模型。此外,我們已將 SynthID,我們的浮水印工具,擴展到兩個新模態:文字和影片,使 AI 生成的內容更容易識別。James Manyika 分享更多。
一起創造未來
所有這些顯示了我們在採取大膽且負責任的方式使 AI 對每個人都更有幫助的重大進展。
我們長期以來以 AI 為優先。我們數十年的研究領導地位開創了許多現代突破,推動了我們和整個行業的 AI 進展。此外,我們擁有:
- 為 AI 時代打造的世界領先基礎設施
- 搜尋的尖端創新,現由 Gemini 驅動
- 以非凡規模提供幫助的產品——包括 15 種擁有 5 億用戶的產品
- 以及使每個人——合作夥伴、客戶、創作者和您們所有人——能夠創造未來的平台。
這些進展只有在我們出色的開發者社群支持下才有可能。你們每天通過構建的體驗和應用程式讓這一切成為現實。因此,對在 Shoreline 的每個人以及全球數百萬觀眾,致敬未來的可能性,並一起創造它們。
從 Google 獲取更多故事到您的收件匣。
電子郵件地址您的資訊將根據 Google 的隱私政策使用。
訂閱完成。還差一步。
檢查您的收件匣以確認您的訂閱。
您已訂閱我們的通訊。
您也可以使用不同的電子郵件地址訂閱。



Super cool to see Google's AI push at I/O 2024! The Gemini era sounds like a sci-fi movie, but I'm curious how it’ll actually change my daily apps. 😎




Wow, Google's AI push at I/O 2024 sounds massive! The Gemini era feels like sci-fi coming to life. Curious how it’ll stack up against competitors. 😎




Google I/O 2024 foi incrível! A era Gemini parece ser o futuro que estávamos esperando. Eles têm trabalhado em IA por tanto tempo e finalmente está dando frutos. Mal posso esperar para ver o que vem a seguir! 🚀




Google I/O 2024は本当に衝撃的だった!ジェミニ時代は待ち望んでいた未来そのものだね。彼らがAIにどれだけ投資してきたかを見ると、次に何が来るのか楽しみで仕方ないよ!🚀




O Google I/O 2024 foi incrível! A era Gemini parece o futuro que estávamos esperando. É legal ver quanto eles investiram em IA ao longo dos anos. Mal posso esperar para ver o que vem por aí! 🚀




Google I/O 2024 was mind-blowing! The Gemini era sounds like the future we've been waiting for. They've been working on AI for so long, and it's finally paying off. Can't wait to see what they come up with next! 🚀












