Mistral揭露高級代碼嵌入模型的表現優於OpenAI，並在現實世界檢索任務中匯總

首頁

新聞

2025-06-07

DanielLewis

Mistral 以 Codestral Embed 進軍內嵌領域

隨著企業檢索擴增世代 (RAG) 持續受到矚目，嵌入模型的創新市場已經成熟。Mistral 是一家法國人工智能公司，以推進人工智能開發的界限而聞名。最近，他們推出了專為程式碼量身打造的嵌入模型 Codestral Embed。

根據 Mistral 的說法，在 SWE-Bench 等基準測試中，Codestral Embed 的表現優於現有的模型。該模型在擷取真實世界的程式碼資料時表現最為亮眼，在擷取情境中提供令人印象深刻的效能。Codestral Embed 以每百萬個代幣 0.15 美元的價格提供給開發人員，為增強代碼相關應用程式提供了經濟實惠且功能強大的選擇。

在最近的一則公告中，Mistral自豪地表示Codestral Embed超越了領先的代碼嵌入器，如Voyage Code 3、Cohere Embed v4.0和OpenAI的Text Embedding 3 Large。這個大膽的宣稱引起了科技社群的注意，並在 X（前 Twitter）等平台上引發討論。

超興奮地宣布 @MistralAI Codestral Embed，我們第一個專門用於程式碼的嵌入模型。
它在真實世界程式碼資料的檢索用例上表現特別好。
- Sophia Yang 博士 (@sophiamyang) 2025 年 5 月 28 日

Codestral Embed 是 Mistral 的 Codestral 系列編碼模型的一部分，可生成將代碼和資料轉換為數字表示的嵌入，使其成為 RAG 的理想選擇。該模型在輸出尺寸和精確度方面具有彈性，可在檢索品質和儲存成本之間取得平衡。Mistral 指出，即使是 256 維度與 int8 精度的 Codestral Embed 也比競爭對手的模型優勝。

基準效能

Mistral 對 Codestral Embed 進行了嚴格的基準測試，例如 SWE-Bench 和 GitHub 的 Text2Code。在這兩種情況下，模型都比業界領先的嵌入模型表現優異。

SWE-Bench

Text2Code

潛在用例

Mistral 預期 Codestral Embed 可在高效能程式碼檢索和語意理解方面大放異彩。該模型迎合了幾個關鍵用例：

RAG：為任務和代理程序提供更快速的資訊檢索。
語意程式碼搜尋：開發人員可使用自然語言查詢尋找程式碼片段，簡化文件系統和編碼協同程式等平台上的工作流程。
相似性搜尋：協助找出重複或相似的程式碼區段，協助企業執行重複使用政策。
程式碼分析：支援語意聚類，可根據功能或結構將代碼分組，以便深入瞭解代碼架構。

市場動態與競爭

Mistral 在競爭日益激烈的情況下進入嵌入式領域。該公司一直積極擴展其產品，推出 Mistral Medium 3 - 旗艦大型語言模型 (LLM) 的中型版本 - 並推出 Agents API，用於建立以任務為導向的代理。

產業觀察家們都注意到了這一點。一些觀察家指出，Mistral 的時機與嵌入式領域的激烈競爭不謀而合。Codestral Embed 在與 OpenAI 和 Cohere 等巨頭的閉源模型競爭的同時，也面臨 Qodo-Embed-1-1.5 B 等開源替代方案的激烈競爭。

VentureBeat 與 Mistral 聯繫，進一步瞭解 Codestral Embed 授權選項的詳細資訊，突顯人們對這項新興技術的興趣與日俱增。

充滿希望的未來

Codestral Embed 著重於特定程式碼的最佳化以及具競爭力的價格，使其成為嵌入式領域的有力競爭者。隨著開發人員不斷尋求創新的解決方案來應付程式碼相關的挑戰，Mistral 的最新產品可能會在這個快速發展的領域中開闢出一席之地，推動其向前邁進。

Master Emerald Kaizo Nuzlocke：終極生存與策略指南 Emerald Kaizo 是有史以來最強大的 Pokémon ROM hacks 之一。雖然嘗試執行 Nuzlocke 會使挑戰成倍增加，但透過縝密的規劃和策略執行，勝利仍然是可以實現的。這本權威指南提供在 Hardcore Nuzlocke 規則下征服 Emerald Kaizo 的必要工具、經過實戰考驗的戰術以及深入的 AI 分析。準備好迎接 Pokémon 精通的終極考驗吧！基本策略收集關

AI Powered Cover Letters：期刊投稿專家指南在現今競爭激烈的學術出版環境中，撰寫一封有效的求職信對您的稿件能否被接受起著舉足輕重的作用。探索像 ChatGPT 之類的人工智能工具如何簡化這項重要任務，幫助您撰寫出精緻、專業的求職信，吸引期刊編輯的注意。我們的全面指南揭示了逐步優化您的投稿包並最大化出版成功率的策略。重點必要的研究準備：彙整所有稿件細節和期刊規格。AI 輔助撰稿：使用 ChatGPT 生成初始求職信模板。個人客製化：完善 AI

美國將因社交媒體法規制裁外國官員美國站出來反對全球數位內容法規美國國務院本周針對歐洲的數位治理政策發出尖銳的外交譴責，顯示在網路平台控制權上的緊張關係正不斷升級。國務卿 Marco Rubio 公布了一項新的簽證限制政策，針對參與美國認為影響美國數位空間的過度審查的外國官員。新簽證限制說明根據週三公佈的政策，美國將拒絕被判定為正在執行影響美國受保護言論的海外內容規定的外國公民入境。Rubio 強調兩項主要的違法行為：

評論 (3)

0/200

提交

BillyAdams

2025-08-12 14:01:01

Wow, Mistral’s Codestral Embed sounds like a game-changer! Outperforming OpenAI and Cohere in retrieval tasks is no small feat. I’m curious how this’ll shake up enterprise RAG—more efficient embeddings could mean faster, smarter AI apps. Anyone else excited to see where this goes? 🚀

RogerLopez

2025-08-08 14:38:17

Wow, Mistral's Codestral Embed sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. I'm curious how this'll shake up enterprise RAG. Anyone tried it yet? 😎

JoeWalker

2025-08-04 14:48:52

Mistral's new embedding model sounds like a game-changer! Beating OpenAI and Cohere in retrieval tasks is no small feat. Can't wait to see how it performs in real-world apps. 😎 Anyone tried it yet?

頭號新聞

2025頂級AI影片生成器：Pika Labs與其他對比 Gemini 2.5 Pro現在比Claude，GPT-4O更便宜，更便宜 AI配音：真實聲音創作終極指南 Cambium的AI將垃圾木頭變成木材 AI Builder和Power Automate革新文件摘要 Openai增強了AI語音助手以進行更好的聊天如何確保您的數據值得信賴AI集成 NotebookLM在全球範圍內擴展，添加幻燈片並增強了事實檢查對美國數據中心的調整可以解鎖76 GW的新電源容量 Google利用AI暫停了超過3900萬的廣告帳戶，以涉嫌欺詐

精選