模型簡介
DeepSeek-R1 在後訓練階段廣泛採用了強化學習技術,僅使用少量標記數據就顯著提升了模型的推理能力。在涉及數學、編碼以及自然語言推理的任務中,其表現與OpenAI的o1官方發布版相當。


語言理解能力
能夠理解複雜的上下文並產生邏輯上的連貫句子,儘管偶爾會在音調控制中脫離。
7.5


知識覆蓋範圍
涵蓋200多個專業領域,實時整合最新的研究結果和跨文化知識。
9.0


推理能力
可以通過三個以上的步驟執行邏輯推理,儘管在處理非線性關係時效率下降。
8.5
模型比較
DeepSeek-R1 vs Qwen2.5-7B-Instruct
與Qwen2一樣,Qwen2.5語言模型支援高達128K個tokens,並且可以生成高達8K個tokens。它們還持續支援超過29種語言,包括中文、英文、法文、西班牙文、葡萄牙文、德文、義大利文、俄文、日文、韓文、越南文、泰文、阿拉伯文等。
相關模型
DeepSeek-V2-Chat-0628
DeepSeek-V2 是一種強大的混合專家模型(Mixture-of-Experts),其特點是訓練成本經濟且推理高效。它總共有2360億個參數,每次生成每個標記時激活其中的210億個參數。與DeepSeek 67B相比,DeepSeek-V2 性能更強,同時節省了42.5%的訓練成本,將KV緩存減少93.3%,並將最大生成吞吐量提高到5.76倍。
DeepSeek-V2.5
DeepSeek-V2.5 是一個升級版本,結合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct。新模型整合了前兩個版本的通用和編碼能力。
DeepSeek-V3-0324
在多項評估中,DeepSeek-V3的表現優於其他開源模型,例如Qwen2.5-72B和Llama-3.1-405B,並且其性能與頂級閉源模型,如GPT-4和Claude-3.5-Sonnet相當。
DeepSeek-V2-Lite-Chat
DeepSeek-V2 是由 DeepSeek 提出的强大混合專家模型(MoE),DeepSeek-V2-Lite 是它的輕量版。
DeepSeek-V2-Chat
DeepSeek-V2 是一種強大的混合專家模型(MoE),以其經濟的訓練和高效的推理能力著稱。它總共有2360億個參數,每次生成每個標記時激活其中的210億個參數。與DeepSeek 67B相比,DeepSeek-V2 性能更強,同時節省了42.5%的訓練成本,將KV緩存減少93.3%,並將最大生成吞吐量提高到5.76倍。
相關文件
谷歌Gemini代碼助手強化AI編程代理功能
Google旗下AI程式開發助手Gemini Code Assist近期推出全新「代理模式」功能,目前開放預覽體驗。在最新Cloud Next大會上,Google展示這些AI代理如何突破性處理複雜編程任務——從Google文件規格書直接生成完整應用程式,或輕鬆實現跨語言程式碼轉換。更令人驚豔的是,開發者現可在Android Studio等整合開發環境中直接啟
微軟在Build大會上開源命令行文本編輯器
微軟在Build 2025大會全面擁抱開源今年在Build 2025開發者大會上,微軟在開源領域祭出多項重大舉措,發布了數個關鍵工具與應用程式——其中包含一款名為Edit的全新Windows命令列文字編輯器。為何擁抱開源?不只為了營利雖然開源軟體不會直接為微軟創造收益,但這實為一種強而有力的市場調查手段——更是引導用戶使用付費產品的聰明策略。透過與開源社群互
OpenAI升級其Operator Agent的AI模型
OpenAI將Operator推向全新境界OpenAI正為其自主AI代理Operator進行重大升級。這項變革意味著Operator即將採用基於o3模型的架構,這是OpenAI尖端o系列推理模型的最新成員。此前Operator一直使用客製化版本的GPT-4o驅動,但這次迭代將帶來顯著改進。o3的突破性意義在數學與邏輯推理任務方面,o3幾乎在所有指標上都超越前
谷歌的人工智慧未來基金可能需要謹慎行事
Google 的新 AI 投資計劃:監管審查下的戰略轉變Google 最近宣布設立 AI 未來基金(AI Futures Fund),這標誌著這家科技巨頭在其塑造人工智慧未來的征程中邁出了大膽的一步。該計劃旨在為初創公司提供急需的資金、早期接觸仍在開發中的尖端人工智慧模型,以及來自 Google 內部專家的指導。儘管這不是 Google 第一次涉足初創企業生
AI YouTube縮略圖發電機:增強視頻視圖
AI在當今的數字景觀中,AI的力量在YouTube縮略圖中,迷人的YouTube縮略圖對於引起觀眾的關注至關重要。由於數百萬個視頻競爭點擊,因此醒目的縮略圖可以使一切與眾不同。 AI YouTube縮略圖發電機已經成為GAM