選項
首頁
新聞
Google 推出 Gemini Embedding2:原生多模態模型整合語義空間

Google 推出 Gemini Embedding2:原生多模態模型整合語義空間

2026-04-02
88

Google 近期推出了其全新的原生多模態嵌入模型「Gemini Embedding2」。該模型能將文字、圖像、影片、音訊及 PDF 文件映射至一個共享的語義向量空間,旨在簡化複雜的 AI 資料工作流程,並提升多模態檢索與理解能力。這代表著 Google 在嵌入技術上的重大進展,從單一模態的文字處理邁向統一的多模態語義建模。

QQ20260312-085930.jpg

此前,在 2025 年 7 月,Google 推出了gemini-embedding-001文字嵌入模型。該模型支援超過 100 種語言,並在 MTEB 多語言基準測試中取得頂尖成績。 全新的 Gemini Embedding2 基於 Gemini 架構,但大幅擴展了其應用範圍。它現在可處理五種不同模態——文字、圖像、影片、音訊和 PDF——並將其投影至單一向量空間。這使得不同類型媒體之間能夠進行直接的語義比較,無需使用多個專用模型或額外的處理步驟。此功能對於語義搜尋、檢索增強生成(RAG)、情緒分析及資料聚類等應用尤為寶貴。

在輸入能力方面,新模型支援多達 8192 個文字標記,是先前 2048 個標記限制的四倍。它每筆請求可處理多達六張 PNG 或 JPEG 圖片、長度達 120 秒的影片,以及最多六頁的 PDF 文件。 值得注意的是,Gemini Embedding2 原生支援音訊處理,無需進行語音轉文字轉換,從而避免了轉錄過程中的潛在資訊損失。Google 還推出了「交錯輸入」技術,讓開發者能在單次請求中結合多種模態——例如將圖片與描述性文字混合——以更精準地捕捉它們之間的語義關聯。

QQ20260312-085920.jpg

在架構上,該模型持續採用「套娃式表徵學習」(MRL)。此技術利用分層結構動態調整向量維度。預設嵌入維度為 3072,並提供 1536 和 768 兩種可選配置,讓開發者能靈活地在檢索準確度與儲存效率之間取得平衡。

Google 的基準測試結果顯示,Gemini Embedding2 在文字、圖像、影片和語音任務中均展現領先的表現。例如,在文字-影片檢索任務中,其得分達 68.8,超越了 Amazon Nova2 多模態嵌入模型(60.3)和 Voyage Multimodal3.5(55.2)。 在文字-圖像對比中,其得分達 93.4,顯著領先於亞馬遜模型的 84.0 分。

開發者目前可透過Gemini APIVertex AI 存取 Gemini Embedding2。該模型已整合至 LangChain、LlamaIndex、Haystack、Weaviate、Qdrant、ChromaDB 及 Vector Search 等熱門框架與向量資料庫。為協助開發者快速上手,Google 提供了互動式 Colab 筆記本及輕量級多模態語義搜尋示範。

QQ20260312-085906.jpg

多模態嵌入技術的競爭日趨白熱化。值得注意的是,今年二月底,AI 搜尋引擎 Perplexity 釋出了其開源嵌入模型pplx-embed-v1pplx-embed-context-v1

相關文章
耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角 耀科傳媒首部AIGC劇集《秦嶺青銅之謎》今日上線,主演均由AI選角 今日,耀科傳媒的AIGC奇幻懸疑短劇《秦嶺青銅秘事》正式上線。本劇由該公司首批簽約的兩位AI演員秦凌月與林西妍主演,故事背景設定在神秘莫測的秦嶺礦區。 劇情追隨退休情報官秦月帶領團隊深入該區域,揭開一樁塵封已久的礦難,以及跨越兩代人的血祭真相——這份真相就隱藏在受限的地下區域,正是科學探索與古代巫術交匯之處。作為中國最早完全由AI數位人支持的電影之一,該劇在籌備階段便引發了業界熱烈討論,而關於其A
薩提亞·納德拉準備利用與OpenAI的新合作關係 薩提亞·納德拉準備利用與OpenAI的新合作關係 週三,一位華爾街分析師直接詢問了微軟執行長薩蒂亞·納德拉,修訂後的OpenAI合作關係將如何影響公司的財務狀況。 納德拉將這一新協議描述為對各方都有利的結果。“我們對與OpenAI的合作感到滿意。我始終非常重視任何合作關係,並確保它能夠實現雙贏。只有這樣,雙方才能保持良好的合作伙伴關係。” 他強調,微軟仍然可以使用OpenAI的智慧財產權,包括其模型和智慧體產品,但不再需要為此向OpenAI支付費用。 談到在2032年之前可以免費使用OpenAI最先進的人工智慧技術,納德拉表示:“
WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 WordPress.com 現已允許 AI 代理程式撰寫並發布文章,還有更多功能 廣受歡迎的網站託管與發佈平台 WordPress.com 現正積極導入 AI 代理程式——此舉可能重塑網路的樣貌與使用體驗。該公司於週五宣布,將允許 AI 代理程式在客戶網站上起草、編輯及發佈內容,同時也能管理留言、更新與修正元資料,並透過標籤和分類來整理內容。所有這些操作皆透過一個介面進行控制,網站擁有者只需使用自然語言指令說明其需求即可。憑藉這些新功能,網站幾乎可以完全由人工指導的 AI 代理
相關專題推薦
商業 最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支
最佳 AI 支出追蹤工具:掃描收據並自動分類公司開支

2026 年最新最佳 AI 報銷管理工具:備受好評的解決方案,可自動掃描收據並分類企業支出。探索強大且顛覆傳統的解決方案,助您輕鬆管理報銷、精準追蹤財務,並簡化合規流程。我們精心整理並每週更新的免費與付費方案比較指南,將協助您找到最合適的選擇。透過 XIX.AI 的專家精選,釋放您的 AI 優勢。

10 個工具
xix.ai
商業 最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試
最佳 AI 招聘工具:篩選履歷與自動化安排候選人面試

在 XIX.AI 探索 2026 年最新且評價最高的 AI 招聘工具。我們精心挑選的清單收錄了強大且具顛覆性的解決方案,可協助篩選履歷並自動化安排候選人面試。透過實際測試與每週更新的排行榜,比較免費與付費選項。立即找到最適合您的招聘助手,並優化您的招聘流程!

10 個工具
xix.ai
生產率 AI 個人健康與專注力教練:管理倦怠感並提升精神能量
AI 個人健康與專注力教練:管理倦怠感並提升精神能量

立即在 XIX.AI 探索 2026 年最佳 AI 個人健康與專注力教練。我們精心策劃的排行榜收錄了備受好評、能帶來革命性改變的工具,助您管理倦怠感並提升精神能量。透過實際使用心得,比較免費與付費方案的差異。立即開啟通往巔峰生產力與身心健康的道路。

10 個工具
xix.ai
聊天機器人 最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係
最受好評的 AI 浪漫聊天機器人:透過一貫的個性建立長期關係

探索 2026 年最新、評價最高的 AI 浪漫聊天機器人,助您建立真摯且長久的連結。我們精心整理的清單包含功能強大且性格鮮明的聊天機器人、免費與付費版本的比較,以及實際測試結果。立即前往 XIX.AI 尋找您的完美伴侶,並開始建立這段關係吧。

10 個工具
xix.ai
教育與學習 最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程
最佳AI資料科學導師:精通SQL、Pandas及機器學習工作流程

探索2026年最優秀的人工智慧資料科學導師,幫助他們掌握SQL、Pandas以及機器學習工作流程。在XIX.AI上檢視我們精心挑選的頂級導師名單,獲得強大而具有變革性的指導。透過對比免費和付費選項,並結合實際應用案例進行了解,今天就開啟你的資料科學精通之路吧。

10 個工具
xix.ai
聊天機器人 最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信
最佳 AI 調情與對話訓練工具:即時提升社交魅力與自信

在 XIX.AI 探索 2026 年最頂尖的 AI 調情與對話訓練工具。我們精心挑選、評價最高的精選清單,能助您即時建立社交魅力與自信。探索這些必試且能徹底改變遊戲規則的工具,並透過免費與付費版本的比較,以及每週更新的排行榜,立即解鎖您的社交優勢。

10 個工具
xix.ai
評論 (0)
0/500
OR