DeepSeek 推出 V4 灰階測試與專家模式

4月7日,Readhub 報導指出,DeepSeek V4 正進行密集的灰階測試。多位程式設計師與科技部落客分享的螢幕截圖顯示,這一代新模型不僅在底層架構上取得突破,其互動邏輯與多模態能力也獲得顯著提升。
重點亮點:三層級全新功能架構
根據外流的測試介面顯示,DeepSeek V4 提供三種核心選項,標誌著其產品陣容的全面進化:
輕量版(DeepSeek V4 Lite):優先考量回應速度,適合日常輕量級對話。
專家版(DeepSeek V4):專注於深度邏輯推理的模式,可能建基於梁文峰共同撰寫的論文中提及的「新記憶體架構」。
視覺版(DeepSeek V4 Vision):代表多模態能力的深度整合,可直接處理圖像與影片分析任務。
技術路線:堅定倡導「國產晶片」
DeepSeek 的崛起不僅源於演算法,更源於與本地運算生態系統的深度整合:
優先採用國產 AI 晶片:報導指出 DeepSeek 正開發至少兩個完全基於國產 AI 晶片的大型模型,並已啟動國產晶片採購熱潮 。
拒絕外部依賴:在先前向美國晶片製造商提交的測試申請中,DeepSeek 未授予 V4 模型測試權限, 而是優先選擇國內企業進行協作優化。
業界期待:能否挑戰程式設計的巔峰?
除了整體性能的提升,市場對DeepSeek V4 還抱有具體的垂直領域期待:
AI 程式設計特別版:業界推測將推出專為程式碼生成與工程實作量身打造的版本,使其能直接與Anthropic 的 Mythos 或OpenAI 的 GPT 系列一較高下。
超長上下文處理:基於DeepSeek 既有的優勢 ,預期 V4 將能單次處理數百萬個標記的超長上下文。
主題追蹤:眾所期待的發布週期
從一月MODEL1 新架構 的洩露,到二月OCR 2 模型的 發布,再到如今頻繁的灰度測試,DeepSeek V4 的推出似乎迫在眉睫。隨著預期發布窗口於本月臨近,這款強調「原生記憶體」與「本土化」的旗艦模型,或將再次重新定義國內大型模型的性價比標竿。
結論:更懂中文運算力的 AI
從自動化程式碼驗證到創新的視覺互動,DeepSeek 正證明了國產模型無需依賴頂級海外晶片,也能實現令人矚目的演進突破。
相關文章
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作
相關專題推薦
評論 (0)
0/500

4
重點亮點:三層級全新功能架構
根據外流的測試介面
輕量版(DeepSeek V4 Lite):優先考量回應速度,適合日常輕量級對話。
專家版(DeepSeek V4):專注於深度邏輯推理的模式,可能建基於梁文峰共同撰寫的論文中提及的「新記憶體架構」。
視覺版(DeepSeek V4 Vision):代表多模態能力的深度整合,可直接處理圖像與影片分析任務。
技術路線:堅定倡導「國產晶片」
優先採用國產 AI 晶片:報導指出 DeepSeek 正開發至少兩個完全基於國產 AI 晶片的大型模型,並已啟動
拒絕外部依賴:在先前向美國晶片製造商提交的測試申請中
業界期待:能否挑戰程式設計的巔峰?
除了整體性能的提升,市場對
AI 程式設計特別版:業界推測將推出專為程式碼生成與工程實作量身打造的版本,使其能直接與
超長上下文處理:基於
主題追蹤:眾所期待的發布週期
從一月
結論:更懂中文運算力的 AI
從自動化程式碼驗證到創新的視覺
Claude 被用於製作惡意 npm 套件:逾 670 個套件遭入侵,威脅開源社群
一則近期發生的網路安全事件揭露了大型語言模型(LLMs)如何被用作開發惡意軟體的工具。資安研究員 Sibi Moosa 發現一名化名為「mousie-5212-super-formatter」的攻擊者,利用 Anthropic 的 Claude AI 生成有害程式碼,並污染 npm 套件生態系統。 在短時間內,超過 670 個惡意套件被上傳至 npm 套件庫,此類攻擊的速度與自動化程度引發了高度警
隨著印度加速推動科技發展,信實集團公布了1,100億美元的人工智慧投資計畫
印度信實集團(Reliance)的億萬富豪主席穆克什·安巴尼(Mukesh Ambani)於週四宣布,將斥資10兆盧比(約合1,100億美元),在未來七年間於印度各地建設人工智慧運算基礎設施。安巴尼週四在新德里舉行的「印度人工智慧影響力峰會」上表示,這筆投資將用於支持吉瓦級數據中心、全國性的邊緣運算網路,以及與信實集團旗下Jio電信平台整合的新人工智慧服務。安巴尼指出,信實集團已開始在古吉拉特邦的
智源WITA以首份合規申報書為「裸體」機器人互動畫下句點
具身智能領域已達成一項重要里程碑。根據上海市網絡信息辦公室的最新公告,智源研究所研發的WITA大模型已成功完成備案,成為國內首個符合規範部署的具身智能交互大模型。這項成就不僅僅是取得許可證。WITA 的核心宗旨在於讓類人型機器人能夠真正進行對話、感知情緒,並發展出鮮明的個性。它專為機器人互動場景設計,透過自然且富有情感表達的溝通方式,將冰冷的機械軀體轉化為具備連續記憶與個人特質的「矽基夥伴」。 作





首頁






