雙子座推出增強模型,擴展上下文,AI代理
去年十二月,我们推出了首款原生多模态模型 Gemini 1.0,提供三种规格:Ultra、Pro 和 Nano。几个月后,我们发布了 1.5 Pro,拥有更强的性能和突破性的 100 萬 token 長上下文窗口。
开发者和企业客户已经以令人惊叹的方式利用 1.5 Pro,高度评价其長上下文窗口、强大的多模态推理能力和整体卓越的性能。
用户的反馈凸显了对低延迟和低成本模型的需求,这激励我们不断突破界限。因此,我们今天兴奋地推出 Gemini 1.5 Flash。此模型比 1.5 Pro 更轻量,设计上注重速度和效率,非常适合扩展应用。
1.5 Pro 和 1.5 Flash 现已进入公开预览,均具备 100 萬 token 上下文窗口,可通过 Google AI Studio 和 Vertex AI 访问。对于需要更多能力的用户,1.5 Pro 现在提供 200 萬 token 上下文窗口,开发者可通过 API 和 Google Cloud 客户通过等待列表获取。
我们并未止步于此。我们还在整个 Gemini 家族中推出更新,发布下一代开放模型 Gemma 2,并通过 Project Astra 在 AI 助手未来发展上取得进展。
與 Gemini 1.5 的 200 萬 token 能力相比,領先基礎模型的上下文長度
Gemini 模型家族更新
全新 1.5 Flash,專為速度與效率優化
推出 1.5 Flash,Gemini 家族中最快且最新的成員,通過我們的 API 提供服務。它專為高頻率、高量任務設計,提供成本效益高的擴展性,同時保持長上下文窗口的突破性優勢。
雖然比 1.5 Pro 輕量,1.5 Flash 表現毫不遜色。它在處理大量數據集的多模态推理方面表現出色,相較於其規模,品質令人印象深刻。
全新 Gemini 1.5 Flash 模型專為速度與效率優化,具備高度多模態推理能力,並擁有突破性的長上下文窗口。
1.5 Flash 在摘要、聊天應用、圖像和影片標題生成等任務中表現出色。它也擅長從長篇文檔和表格中提取數據。這種多功能性源於通過 1.5 Pro 的「知識蒸餾」訓練,將大型模型的核心知識和技能傳遞給更高效的小型模型。
有關 1.5 Flash 的更多詳情,請查看我們更新的 Gemini 1.5 技術報告、Gemini 技術頁面,並了解其可用性和定價資訊。
顯著提升 1.5 Pro
過去幾個月,我們在增強 1.5 Pro(我們在眾多任務中的頂尖表現者)方面取得了顯著進展。
我們已將其上下文窗口擴展至 200 萬 token,並提升了其在代碼生成、邏輯推理、規劃、多輪對話以及音頻和圖像理解方面的能力。這些增強得益於數據和算法的進步,在公開和內部基準測試中均顯示出顯著改進。
1.5 Pro 現在能處理日益複雜和細緻的指令,包括定義產品級行為的指令,如角色、格式和風格。我們優化了對模型回應的控制,適用於特定用例,例如自訂聊天代理角色或自動化多功能調用的工作流程。用戶現在可通過系統指令引導模型行為。
我們還在 Gemini API 和 Google AI Studio 中新增了音頻理解功能,使 1.5 Pro 能處理上傳至 Google AI Studio 的影片中的圖像和音頻。我們正將 1.5 Pro 整合進 Google 產品,如 Gemini Advanced 和 Workspace 應用。
有關 1.5 Pro 的更多資訊,請深入了解我們更新的 Gemini 1.5 技術報告和 Gemini 技術頁面。
Gemini Nano 支援多模態輸入
Gemini Nano 正在升級,從僅限文字輸入進展到包含圖像。從 Pixel 開始,使用多模態 Gemini Nano 的應用將能以更接近人類的方式理解世界,通過文字、視覺、聲音和口語。
了解更多關於 Android 上 Gemini 1.0 Nano 的資訊。
下一代開放模型
今天,我們也更新了 Gemma,我們的開放模型家族,這些模型基於與 Gemini 模型相同的研究和技術打造。
我們推出 Gemma 2,下一代用於負責任 AI 創新的開放模型。Gemma 2 採用全新架構,提供卓越性能和效率,並將推出新尺寸規格。
Gemma 家族正在擴展,新增了受 PaLI-3 啟發的首個視覺-語言模型 PaliGemma。我們還升級了負責任生成式 AI 工具包,新增 LLM Comparator 以評估模型回應品質。
欲了解更多詳情,請前往 Developer 部落格。
開發通用 AI 代理的進展
在 Google DeepMind,我們的使命是負責任地打造 AI 以造福人類。我們一直致力於創建能協助日常生活的通用 AI 代理。因此,我們分享了在 AI 助手未來發展上的進展,名為 Project Astra(進階視覺與語音回應代理)。
要讓 AI 代理真正發揮作用,它需要像人類一樣理解和回應世界,接收並記憶所見所聞,以理解上下文並採取相應行動。它還應具備主動性、可教性及個人化特質,實現自然且無延遲的對話。
雖然我們在處理多模態資訊方面取得了巨大進展,但實現對話回應速度仍是一項艱難的工程挑戰。多年來,我們一直在優化模型的感知、推理和對話方式,使互動更自然。
基於 Gemini,我們開發了原型代理,通過連續編碼視頻幀、將視頻和語音輸入合併為事件時間線,並快取這些數據以便快速回憶,從而更快地處理資訊。
通過使用我們頂尖的語音模型,我們還改進了這些代理的語音表現,使其擁有更廣泛的語調範圍。它們能更好地理解所在上下文,並在對話中迅速回應。
有了這項技術,不難想像未來每個人都能擁有專業的 AI 助手,隨時通過手機或眼鏡使用。其中一些功能將於今年晚些時候應用於 Google 產品,如 Gemini 應用和網頁體驗。
持續探索
我們的 Gemini 模型家族已取得長足進展,我們致力於進一步突破界限。通過不懈創新,我們在探索新領域的同時,為 Gemini 解鎖令人興奮的新用例。
欲了解更多關於 Gemini 及其功能的資訊,請查看我們的資源。




在您的收件匣中獲取更多來自 Google 的故事。在您的收件匣中獲取更多來自 Google 的故事。
電子郵件地址您的資訊將根據 Google 的隱私政策使用。
訂閱完成。僅剩一步。
請檢查您的收件匣以確認訂閱。
您已經訂閱了我們的電子報。
您也可以使用其他電子郵件地址訂閱。
相關文章
Salesforce 揭曉 Slack 中 AI 數位隊友以對抗 Microsoft Copilot
Salesforce 推出全新工作場所 AI 策略,於週一宣布在 Slack 對話中引入專屬的「數位隊友」。全新工具 Agentforce in Slack 讓企業能夠創建並部署針對特定任務的 AI 代理,這些代理可搜尋工作場所聊天記錄、存取公司資料,並在員工日常工作的訊息平台內執行操作。「正如專業員工協作解決問題,我們的客戶需要 AI 代理共同合作,為客戶和員工解決問題,」Salesforce
甲骨文40億美元Nvidia晶片投資推動德州AI數據中心
據《金融時報》報導,甲骨文計劃投資約40億美元於Nvidia晶片,為OpenAI在德州開發的大型新數據中心提供動力。這筆交易是迄今為止最大的晶片收購之一,凸顯了對AI運算資源的激增需求。該設施位於德州阿比林,是美國首個「星門」數據中心。由OpenAI和軟銀支持,屬於建設大規模AI基礎設施的更廣泛計劃的一部分。該德州中心預計明年完工,將提供1.2吉瓦的運算能力,位列全球最大之列。甲骨文計劃採購約40
Meta AI應用程式將推出高級訂閱與廣告
Meta的AI應用程式即將推出付費訂閱服務,類似於OpenAI、Google和Microsoft等競爭對手的產品。在2025年第一季財報電話會議中,Meta首席執行官馬克·祖克柏格概述了高級服務的計劃,讓用戶能夠使用更強大的運算能力或Meta AI的額外功能。為了與ChatGPT競爭,Meta本週推出了一款獨立的AI應用程式,允許用戶直接與聊天機器人互動並進行圖像生成。該聊天機器人目前擁有近10億
評論 (25)
0/200
LucasWalker
2025-04-19 05:37:58
ジェミニの新しいモデルが100万トークンのコンテキストを持つとは信じられない!🤯 まるで何でも扱える超賢いAIを持っているようです。AIエージェントもゲームチェンジャーです。次に何を出すのか楽しみです!🚀
0
FrankSmith
2025-04-16 08:37:56
젬니니의 새로운 모델 정말 멋지네요! 100만 토큰의 컨텍스트 윈도우는 정말 놀랍습니다. 마치 모든 대화를 기억하는 똑똑한 친구가 있는 것 같아요! 조금 더 빨랐으면 좋겠지만, 뭐 다 가질 수는 없죠? 🤓
0
JamesMiller
2025-04-16 01:53:33
O novo modelo do Gemini é bem legal! A janela de contexto de 1 milhão de tokens é louca, é como ter um amigo superinteligente que lembra de tudo o que você já disse! Só queria que fosse um pouco mais rápido, mas, ei, não dá pra ter tudo, né? 🤓
0
MarkRoberts
2025-04-15 09:25:31
El nuevo modelo Gemini es impresionante, especialmente la ventana de contexto larga. Es genial para desarrolladores, pero puede ser un poco abrumador para principiantes. Los agentes de IA son geniales, pero desearía que hubiera más documentación sobre cómo usarlos de manera efectiva.
0
BillyGarcia
2025-04-15 03:20:08
O novo modelo do Gemini com um contexto de um milhão de tokens é loucura! 🤯 É como ter uma IA super inteligente que pode lidar com qualquer coisa. Os agentes de IA também são um divisor de águas. Mal posso esperar para ver o que eles vão lançar a seguir! 🚀
0
RogerRoberts
2025-04-15 01:06:25
¡El nuevo modelo de Gemini es bastante genial! La ventana de contexto de 1 millón de tokens es una locura, es como tener un amigo súper inteligente que recuerda todo lo que has dicho alguna vez. Ojalá fuera un poco más rápido, pero bueno, no se puede tener todo, ¿verdad? 🤓
0
去年十二月,我们推出了首款原生多模态模型 Gemini 1.0,提供三种规格:Ultra、Pro 和 Nano。几个月后,我们发布了 1.5 Pro,拥有更强的性能和突破性的 100 萬 token 長上下文窗口。
开发者和企业客户已经以令人惊叹的方式利用 1.5 Pro,高度评价其長上下文窗口、强大的多模态推理能力和整体卓越的性能。
用户的反馈凸显了对低延迟和低成本模型的需求,这激励我们不断突破界限。因此,我们今天兴奋地推出 Gemini 1.5 Flash。此模型比 1.5 Pro 更轻量,设计上注重速度和效率,非常适合扩展应用。
1.5 Pro 和 1.5 Flash 现已进入公开预览,均具备 100 萬 token 上下文窗口,可通过 Google AI Studio 和 Vertex AI 访问。对于需要更多能力的用户,1.5 Pro 现在提供 200 萬 token 上下文窗口,开发者可通过 API 和 Google Cloud 客户通过等待列表获取。
我们并未止步于此。我们还在整个 Gemini 家族中推出更新,发布下一代开放模型 Gemma 2,并通过 Project Astra 在 AI 助手未来发展上取得进展。
Gemini 模型家族更新
全新 1.5 Flash,專為速度與效率優化
推出 1.5 Flash,Gemini 家族中最快且最新的成員,通過我們的 API 提供服務。它專為高頻率、高量任務設計,提供成本效益高的擴展性,同時保持長上下文窗口的突破性優勢。
雖然比 1.5 Pro 輕量,1.5 Flash 表現毫不遜色。它在處理大量數據集的多模态推理方面表現出色,相較於其規模,品質令人印象深刻。
1.5 Flash 在摘要、聊天應用、圖像和影片標題生成等任務中表現出色。它也擅長從長篇文檔和表格中提取數據。這種多功能性源於通過 1.5 Pro 的「知識蒸餾」訓練,將大型模型的核心知識和技能傳遞給更高效的小型模型。
有關 1.5 Flash 的更多詳情,請查看我們更新的 Gemini 1.5 技術報告、Gemini 技術頁面,並了解其可用性和定價資訊。
顯著提升 1.5 Pro
過去幾個月,我們在增強 1.5 Pro(我們在眾多任務中的頂尖表現者)方面取得了顯著進展。
我們已將其上下文窗口擴展至 200 萬 token,並提升了其在代碼生成、邏輯推理、規劃、多輪對話以及音頻和圖像理解方面的能力。這些增強得益於數據和算法的進步,在公開和內部基準測試中均顯示出顯著改進。
1.5 Pro 現在能處理日益複雜和細緻的指令,包括定義產品級行為的指令,如角色、格式和風格。我們優化了對模型回應的控制,適用於特定用例,例如自訂聊天代理角色或自動化多功能調用的工作流程。用戶現在可通過系統指令引導模型行為。
我們還在 Gemini API 和 Google AI Studio 中新增了音頻理解功能,使 1.5 Pro 能處理上傳至 Google AI Studio 的影片中的圖像和音頻。我們正將 1.5 Pro 整合進 Google 產品,如 Gemini Advanced 和 Workspace 應用。
有關 1.5 Pro 的更多資訊,請深入了解我們更新的 Gemini 1.5 技術報告和 Gemini 技術頁面。
Gemini Nano 支援多模態輸入
Gemini Nano 正在升級,從僅限文字輸入進展到包含圖像。從 Pixel 開始,使用多模態 Gemini Nano 的應用將能以更接近人類的方式理解世界,通過文字、視覺、聲音和口語。
了解更多關於 Android 上 Gemini 1.0 Nano 的資訊。
下一代開放模型
今天,我們也更新了 Gemma,我們的開放模型家族,這些模型基於與 Gemini 模型相同的研究和技術打造。
我們推出 Gemma 2,下一代用於負責任 AI 創新的開放模型。Gemma 2 採用全新架構,提供卓越性能和效率,並將推出新尺寸規格。
Gemma 家族正在擴展,新增了受 PaLI-3 啟發的首個視覺-語言模型 PaliGemma。我們還升級了負責任生成式 AI 工具包,新增 LLM Comparator 以評估模型回應品質。
欲了解更多詳情,請前往 Developer 部落格。
開發通用 AI 代理的進展
在 Google DeepMind,我們的使命是負責任地打造 AI 以造福人類。我們一直致力於創建能協助日常生活的通用 AI 代理。因此,我們分享了在 AI 助手未來發展上的進展,名為 Project Astra(進階視覺與語音回應代理)。
要讓 AI 代理真正發揮作用,它需要像人類一樣理解和回應世界,接收並記憶所見所聞,以理解上下文並採取相應行動。它還應具備主動性、可教性及個人化特質,實現自然且無延遲的對話。
雖然我們在處理多模態資訊方面取得了巨大進展,但實現對話回應速度仍是一項艱難的工程挑戰。多年來,我們一直在優化模型的感知、推理和對話方式,使互動更自然。
基於 Gemini,我們開發了原型代理,通過連續編碼視頻幀、將視頻和語音輸入合併為事件時間線,並快取這些數據以便快速回憶,從而更快地處理資訊。
通過使用我們頂尖的語音模型,我們還改進了這些代理的語音表現,使其擁有更廣泛的語調範圍。它們能更好地理解所在上下文,並在對話中迅速回應。
有了這項技術,不難想像未來每個人都能擁有專業的 AI 助手,隨時通過手機或眼鏡使用。其中一些功能將於今年晚些時候應用於 Google 產品,如 Gemini 應用和網頁體驗。
持續探索
我們的 Gemini 模型家族已取得長足進展,我們致力於進一步突破界限。通過不懈創新,我們在探索新領域的同時,為 Gemini 解鎖令人興奮的新用例。
欲了解更多關於 Gemini 及其功能的資訊,請查看我們的資源。




在您的收件匣中獲取更多來自 Google 的故事。在您的收件匣中獲取更多來自 Google 的故事。
訂閱完成。僅剩一步。
請檢查您的收件匣以確認訂閱。
您已經訂閱了我們的電子報。
您也可以使用其他電子郵件地址訂閱。



ジェミニの新しいモデルが100万トークンのコンテキストを持つとは信じられない!🤯 まるで何でも扱える超賢いAIを持っているようです。AIエージェントもゲームチェンジャーです。次に何を出すのか楽しみです!🚀




젬니니의 새로운 모델 정말 멋지네요! 100만 토큰의 컨텍스트 윈도우는 정말 놀랍습니다. 마치 모든 대화를 기억하는 똑똑한 친구가 있는 것 같아요! 조금 더 빨랐으면 좋겠지만, 뭐 다 가질 수는 없죠? 🤓




O novo modelo do Gemini é bem legal! A janela de contexto de 1 milhão de tokens é louca, é como ter um amigo superinteligente que lembra de tudo o que você já disse! Só queria que fosse um pouco mais rápido, mas, ei, não dá pra ter tudo, né? 🤓




El nuevo modelo Gemini es impresionante, especialmente la ventana de contexto larga. Es genial para desarrolladores, pero puede ser un poco abrumador para principiantes. Los agentes de IA son geniales, pero desearía que hubiera más documentación sobre cómo usarlos de manera efectiva.




O novo modelo do Gemini com um contexto de um milhão de tokens é loucura! 🤯 É como ter uma IA super inteligente que pode lidar com qualquer coisa. Os agentes de IA também são um divisor de águas. Mal posso esperar para ver o que eles vão lançar a seguir! 🚀




¡El nuevo modelo de Gemini es bastante genial! La ventana de contexto de 1 millón de tokens es una locura, es como tener un amigo súper inteligente que recuerda todo lo que has dicho alguna vez. Ojalá fuera un poco más rápido, pero bueno, no se puede tener todo, ¿verdad? 🤓












