螞蟻集團推出 F2LLM-v2:一款多語言全規模嵌入式模型
克服語義表徵中的「英語中心」限制,已成為大型語言模型演進過程中的關鍵前沿。
3月26日,螞蟻集團與 上海交通大學 組成的CodeFuse團隊正式發布了F2LLM-v2系列嵌入式模型。該系列不僅在權威評測中取得領先表現,更透過完全開源的方式,為全球開發者提供了一套高效能且高效率的語義表示解決方案。

卓越表現:在 MTEB 取得 11 項 SOTA 成績
在評估嵌入模型的權威性 MTEB 基準測試中,F2LLM-v2展現了全面優勢:
11項榜首:在包括德語、法語、日語及程式碼檢索在內的11個語言與領域專用排行榜中均奪得第一名。
強勁的挑戰者:即使是其輕量級變體,也始終優於同等規模的知名業界模型。
廣泛涵蓋:評估涵蓋 430 項多元子任務,例如醫療問答與程式碼檢索,實現全場景覆蓋。

全面理解能力:精通 282 種自然語言及 40 多種程式語言
F2LLM-v2的強大實力源自其高度包容的訓練基礎:
多語言強化:針對中、低資源語言(如北歐及東南亞語系)提供更強大的支援,實現真正的全球語言覆蓋。
程式設計專長:對 Python、Java 和 Go 等 40 多種程式語言具備深度理解,是開發者建構 RAG(檢索增強生成)系統與程式碼助理的理想選擇。
高品質數據:建基於 6,000 萬筆經細緻清理的公開樣本,確保模型知識庫的純度與廣度。

極致效能:涵蓋 8,000 萬至 140 億參數的完整模型系列
為滿足從行動裝置到雲端運算的多元需求,CodeFuse 團隊開發了一套全面的模型矩陣:
行動裝置優化:參數介於 8000 萬至 3.3 億的緊湊型模型,運用「模型修剪」與「知識蒸餾」技術,確保在行動平台上流暢運作。
「嵌套式」創新:支援動態維度調整,讓使用者能靈活切換 8 維度與全維度模式,優化推論速度與儲存成本之間的權衡。
完全開源:透明度樹立新的社群標準
有別於許多「黑箱」模型,F2LLM-v2秉持完全開源的理念:
完整釋出:所有尺寸變體的模型權重均可下載。
詳盡透明度:發布了全面技術報告,公開完整的訓練方法論。
完全可重現性:所有程式碼與訓練檢查點均已釋出,賦予全球研究人員基於此成果進行進一步開發的能力。
結論:突破界限,探索 AI 的無限潛能
作為CodeFuse 開源系列的又一重要里程碑,F2LLM-v2的發布
相關文章
AI 瀏覽器 Comet 正式上線,在 iPad 上全面支援多工處理
Perplexity 的 AI 瀏覽器 Comet 已正式推出 iPad 版本,現已全面相容於 iPadOS。此次更新導入多視窗瀏覽功能、多工處理支援,並與 OpenAI 和 Anthropic 等頂尖 AI 模型深度整合,帶來更智能的網路體驗。Comet 瀏覽器拓展了使用者探索網路及與 AI 聊天機器人互動的方式,提供直觀的管道存取 OpenAI 和 Anthropic 等頂尖 AI 模型,以進
Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。
儘管人工智慧代理具有巨大潛力,但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為,根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業,它作為Y Combinator 2025年夏季培訓專案的一部分誕生,旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程,為人工智慧代理提供所需的上下文資訊,從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生,企業完全可以利用這些資源,”Trace的執行長Tim Cherkasov解釋
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將
相關專題推薦
評論 (0)
0/500
克服語義表徵中的「英語中心」限制,已成為大型語言模型演進過程中的關鍵前沿。
3月26日,螞蟻集團與 上海交通大學 組成的CodeFuse團隊正式發布了F2LLM-v2系列嵌入式模型。該系列不僅在權威評測中取得領先表現,更透過完全開源的方式,為全球開發者提供了一套高效能且高效率的語義表示解決方案。

卓越表現:在 MTEB 取得 11 項 SOTA 成績
在評估嵌入模型的權威性 MTEB 基準測試中,F2LLM-v2展現了全面優勢:
11項榜首:在包括德語、法語、日語及程式碼檢索在內的11個語言與領域專用排行榜中均奪得第一名。
強勁的挑戰者:即使是其輕量級變體,也始終優於同等規模的知名業界模型。
廣泛涵蓋:評估涵蓋 430 項多元子任務,例如醫療問答與程式碼檢索,實現全場景覆蓋。

全面理解能力:精通 282 種自然語言及 40 多種程式語言
F2LLM-v2的強大實力源自其高度包容的訓練基礎:
多語言強化:針對中、低資源語言(如北歐及東南亞語系)提供更強大的支援,實現真正的全球語言覆蓋。
程式設計專長:對 Python、Java 和 Go 等 40 多種程式語言具備深度理解,是開發者建構 RAG(檢索增強生成)系統與程式碼助理的理想選擇。
高品質數據:建基於 6,000 萬筆經細緻清理的公開樣本,確保模型知識庫的純度與廣度。

極致效能:涵蓋 8,000 萬至 140 億參數的完整模型系列
為滿足從行動裝置到雲端運算的多元需求,CodeFuse 團隊開發了一套全面的模型矩陣:
行動裝置優化:參數介於 8000 萬至 3.3 億的緊湊型模型,運用「模型修剪」與「知識蒸餾」技術,確保在行動平台上流暢運作。
「嵌套式」創新:支援動態維度調整,讓使用者能靈活切換 8 維度與全維度模式,優化推論速度與儲存成本之間的權衡。
完全開源:透明度樹立新的社群標準
有別於許多「黑箱」模型,F2LLM-v2秉持完全開源的理念:
完整釋出:所有尺寸變體的模型權重均可下載。
詳盡透明度:發布了全面技術報告,公開完整的訓練方法論。
完全可重現性:所有程式碼與訓練檢查點均已釋出,賦予全球研究人員基於此成果進行進一步開發的能力。
結論:突破界限,探索 AI 的無限潛能
作為CodeFuse 開源系列的又一重要里程碑,F2LLM-v2的發布
AI 瀏覽器 Comet 正式上線,在 iPad 上全面支援多工處理
Perplexity 的 AI 瀏覽器 Comet 已正式推出 iPad 版本,現已全面相容於 iPadOS。此次更新導入多視窗瀏覽功能、多工處理支援,並與 OpenAI 和 Anthropic 等頂尖 AI 模型深度整合,帶來更智能的網路體驗。Comet 瀏覽器拓展了使用者探索網路及與 AI 聊天機器人互動的方式,提供直觀的管道存取 OpenAI 和 Anthropic 等頂尖 AI 模型,以進
Trace籌集了300萬美元,用於解決企業採用AI智慧助手時所遇到的各種障礙。
儘管人工智慧代理具有巨大潛力,但它們在企業中仍難以取得實質性進展。一家新興的初創企業認為,根本問題在於缺乏上下文資訊。Trace是一家專注於工作流程協作的初創企業,它作為Y Combinator 2025年夏季培訓專案的一部分誕生,旨在彌補這一空白。該公司能夠梳理複雜的企業環境和業務流程,為人工智慧代理提供所需的上下文資訊,從而幫助它們快速發展。“OpenAI和Anthropic培養出了非常優秀的人工智慧實習生,企業完全可以利用這些資源,”Trace的執行長Tim Cherkasov解釋
Google I/O 2026 發表了與 Gmail 收件匣的語音互動功能
Google 持續將人工智慧整合至您的收件匣中。在週二舉行的 IO 2026 開發者大會上,該公司透過對話式人工智慧擴充了 Gmail 的「AI 收件匣」功能,讓使用者能針對收件匣內容提出問題,而非僅依賴搜尋關鍵字。據 Google 表示,這項由 Gemini AI 驅動的工具名為「Gmail Live」,能協助使用者快速找出埋藏在收件匣中的資訊。圖片來源:Google舉例來說,您可能需要查詢即將





首頁






