DeepSeek V4 預計將於四月與騰訊的「夢圓」模型同步推出

根據百明實驗室的獨家報導,備受矚目的 DeepSeek V4 以及姚順宇的新型 MixFormer 模型,預計將於 2026 年 4 月正式發布。DeepSeek V4 是由梁文峰領銜開發的多模態大型模型。 經過廣泛的優化,預計將在編碼能力與長期記憶方面取得重大突破。此次發布符合 DeepSeek 團隊近年來的研究方向,特別是在視覺內容處理與 AI 驅動的搜尋能力方面。
梁文峰的研究聚焦於探索「條件記憶」機制。2026年1月,他發表了題為《透過可擴展查找實現條件記憶》(Conditional Memory via Scalable Lookup)的論文,闡述了相關核心理論。 此外,他在2025年12月發表了另一項研究《mHC:流形約束超連接》,進一步優化了底層架構。這項工作旨在解決Transformer模型在記憶與訓練穩定性方面的已知限制。DeepSeek V4不僅具備強大的多模態處理能力,更針對國產晶片進行深度優化,目標是成為完全依賴國內運算基礎設施的核心模型。
與此同時,姚順宇的新模型 MixFormer 也預計於四月發布。自 2025 年 12 月起,姚順宇擔任騰訊執行委員會首席 AI 科學家,同時負責 AI 基礎設施及大型語言模型部門。 2026年2月,他推出了 CL-bench,這是一套針對「情境學習」的創新評估基準,著重於長上下文處理與代理程式(Agent)的可用性。報導指出,姚順宇的新模型將擁有約30億個參數,其團隊從一開始便優先考量實際應用,而非僅追求參數規模的競爭。
這兩款模型即將問世的消息已引起市場高度關注,凸顯了中國在人工智慧領域的加速進展。無論是DeepSeek V4在長期記憶方面的突破,還是騰訊MixFormer模型在實際任務評估中的改進,這兩項努力都從根本上探討了未來大型模型如何能更有效地整合到生產環境中。
相關文章
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區
相關專題推薦
評論 (0)
0/500

根據百明實驗室的獨家報導,備受矚目的 DeepSeek V4 以及姚順宇的新型 MixFormer 模型,預計將於 2026 年 4 月正式發布。DeepSeek V4 是由梁文峰領銜開發的多模態大型模型。 經過廣泛的優化,預計將在編碼能力與長期記憶方面取得重大突破。此次發布符合 DeepSeek 團隊近年來的研究方向,特別是在視覺內容處理與 AI 驅動的搜尋能力方面。
梁文峰的研究聚焦於探索「條件記憶」機制。2026年1月,他發表了題為《透過可擴展查找實現條件記憶》(Conditional Memory via Scalable Lookup)的論文,闡述了相關核心理論。 此外,他在2025年12月發表了另一項研究《mHC:流形約束超連接》,進一步優化了底層架構。這項工作旨在解決Transformer模型在記憶與訓練穩定性方面的已知限制。DeepSeek V4不僅具備強大的多模態處理能力,更針對國產晶片進行深度優化,目標是成為完全依賴國內運算基礎設施的核心模型。
與此同時,姚順宇的新模型 MixFormer 也預計於四月發布。自 2025 年 12 月起,姚順宇擔任騰訊執行委員會首席 AI 科學家,同時負責 AI 基礎設施及大型語言模型部門。 2026年2月,他推出了 CL-bench,這是一套針對「情境學習」的創新評估基準,著重於長上下文處理與代理程式(Agent)的可用性。報導指出,姚順宇的新模型將擁有約30億個參數,其團隊從一開始便優先考量實際應用,而非僅追求參數規模的競爭。
這兩款模型即將問世的消息已引起市場高度關注,凸顯了中國在人工智慧領域的加速進展。無論是DeepSeek V4在長期記憶方面的突破,還是騰訊MixFormer模型在實際任務評估中的改進,這兩項努力都從根本上探討了未來大型模型如何能更有效地整合到生產環境中。
北京工業大學就包括人工智慧模型上下文協議在內的121項行業標準徵求公眾意見
中國工業和資訊化部正式釋出通知,徵求公眾對121項行業標準化的意見,其中包括“人工智慧安全治理模型上下文協議的應用安全要求”。這一公告標誌著中國在建立人工智慧基礎標準和安全監管框架方面取得了重要進展。此次公開徵求意見的重點是針對該模型上下文協議的應用安全問題,旨在透過標準化的技術規範來解決多模態互動、長文字處理以及跨平臺呼叫過程中出現的協議相容性和資料安全方面的問題。
OpenAI與美國國防部合作,ChatGPT的解除安裝數量激增了295%
公眾憤怒:OpenAI的軍事合作引發“解除安裝潮”近日,人工智慧領域的領頭羊OpenAI宣佈與美國國防部建立了深度合作關係,將其人工智慧模型整合到高度機密的軍事網路中。這一訊息在美國引發了廣泛的使用者抗議,“抵制ChatGPT”運動勢頭日益強勁。根據市場分析機構Sensor Tower的資料,2026年2月28日——OpenAI正式宣佈這一合作的當天——美國市場上ChatGPT移動應用的解除安裝率比前一天激增了295%,而此前該應用的平均每日解除安裝率約為9%。使用者們對人工智慧被用於軍事目的表示強烈擔憂,
OpenAI 推出「Sites」功能,以文字驅動的網站標誌著「無程式碼」時代的終結
OpenAI 推出了「Sites」,這是其軟體工程人工智慧平台 Codex 的一項新功能。目前該功能處於預覽階段,僅限付費的「Business」和「Enterprise」訂閱用戶使用,旨在消除網頁與應用程式開發中的傳統障礙。從核心功能來看,Sites 是一個能將抽象概念轉化為實用工具的平台。使用者可輸入概念、數據分析或專案計畫,Codex 便會自動將這些靜態內容重組為儀表板、排程規劃器、審查工作區





首頁






