螞蟻集團推出 F2LLM-v2：一款多語言全規模嵌入式模型

首頁

新聞

2026-05-13

JustinScott

克服語義表徵中的「英語中心」限制，已成為大型語言模型演進過程中的關鍵前沿。

3月26日，螞蟻集團與 上海交通大學 組成的CodeFuse團隊正式發布了F2LLM-v2系列嵌入式模型。該系列不僅在權威評測中取得領先表現，更透過完全開源的方式，為全球開發者提供了一套高效能且高效率的語義表示解決方案。

卓越表現：在 MTEB 取得 11 項 SOTA 成績

在評估嵌入模型的權威性 MTEB 基準測試中，F2LLM-v2展現了全面優勢：

11項榜首：在包括德語、法語、日語及程式碼檢索在內的11個語言與領域專用排行榜中均奪得第一名。

強勁的挑戰者：即使是其輕量級變體，也始終優於同等規模的知名業界模型。

廣泛涵蓋：評估涵蓋 430 項多元子任務，例如醫療問答與程式碼檢索，實現全場景覆蓋。

全面理解能力：精通 282 種自然語言及 40 多種程式語言

F2LLM-v2的強大實力源自其高度包容的訓練基礎：

多語言強化：針對中、低資源語言（如北歐及東南亞語系）提供更強大的支援，實現真正的全球語言覆蓋。

程式設計專長：對 Python、Java 和 Go 等 40 多種程式語言具備深度理解，是開發者建構 RAG（檢索增強生成）系統與程式碼助理的理想選擇。

高品質數據：建基於 6,000 萬筆經細緻清理的公開樣本，確保模型知識庫的純度與廣度。

極致效能：涵蓋 8,000 萬至 140 億參數的完整模型系列

為滿足從行動裝置到雲端運算的多元需求，CodeFuse 團隊開發了一套全面的模型矩陣：

行動裝置優化：參數介於 8000 萬至 3.3 億的緊湊型模型，運用「模型修剪」與「知識蒸餾」技術，確保在行動平台上流暢運作。

「嵌套式」創新：支援動態維度調整，讓使用者能靈活切換 8 維度與全維度模式，優化推論速度與儲存成本之間的權衡。

完全開源：透明度樹立新的社群標準

有別於許多「黑箱」模型，F2LLM-v2秉持完全開源的理念：

完整釋出：所有尺寸變體的模型權重均可下載。

詳盡透明度：發布了全面技術報告，公開完整的訓練方法論。

完全可重現性：所有程式碼與訓練檢查點均已釋出，賦予全球研究人員基於此成果進行進一步開發的能力。

結論：突破界限，探索 AI 的無限潛能

作為CodeFuse 開源系列的又一重要里程碑，F2LLM-v2的發布

AI 瀏覽器 Comet 正式上線，在 iPad 上全面支援多工處理 Perplexity 的 AI 瀏覽器 Comet 已正式推出 iPad 版本，現已全面相容於 iPadOS。此次更新導入多視窗瀏覽功能、多工處理支援，並與 OpenAI 和 Anthropic 等頂尖 AI 模型深度整合，帶來更智能的網路體驗。Comet 瀏覽器拓展了使用者探索網路及與 AI 聊天機器人互動的方式，提供直觀的管道存取 OpenAI 和 Anthropic 等頂尖 AI 模型，以進

Trace籌集了300萬美元，用於解決企業採用AI智慧助手時所遇到的各種障礙。儘管人工智慧代理具有巨大潛力，但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為，根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業，它作為Y Combinator 2025年夏季培訓專案的一部分誕生，旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程，為人工智慧代理提供所需的上下文資訊，從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生，企業完全可以利用這些資源，”Trace的執行長Tim Cherkasov解釋

Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能 Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上，該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能，讓使用者能針對收件匣內容提出問題，而非僅依賴搜尋關鍵字。據 Google 表示，這項由 Gemini AI 驅動的工具名為「Gmail Live」，能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源：Google舉例來說，您可能需要查詢即將

相關專題推薦

商業