測試顯示,DeepSeek 的 R1 AI 模型更新引入了更嚴格的內容審查
中國人工智能初創公司 DeepSeek 的最新推理模型,是其 R1 系統的增強迭代版本,在編碼、數學和常識基準上表現出眾,接近 OpenAI 的旗艦模型 o3。然而,這個被命名為「R1-0528」的升級版本,在處理有爭議的議題,尤其是中國當局認為敏感的議題時,表現出更多的不情願。
這些發現來自 SpeechMap 背後匿名開發者所進行的測試,SpeechMap 是一個評估不同 AI 模型如何處理敏感話題的平台。這位在 X 平台上以「xlr8harder」為名的開發者報告說,R1-0528 對於有爭議議題的自由言論討論的容忍度,相較於之前 DeepSeek 發表的版本大幅降低,使其成為該公司在批評中國政府方面限制最多的模型。
事實上,使用我以前的中國批評問題集,我們看到該模型也是目前對中國政府批評審查最嚴格的 Deepseek 模型。
正如之前業界分析所記載的,中國的 AI 模型必須遵守嚴格的資訊控制法規。2023 年的一項法規禁止模型產生可能破壞國家統一或社會穩定的內容,通常被解釋為挑戰官方政治和歷史敘述的材料。為了遵守這些規定,國內 AI 開發人員通常會透過提示層級的保障措施或模型微調來實施內容過濾。之前的研究表明,DeepSeek 的原始 R1 模型拒絕回應 85% 涉及中國監管機構確定的政治敏感主題的查詢。
根據 xlr8harder 的評估,R1-0528 限制回應關於中國新疆地區設施的問題,那裡有大量的維吾爾穆斯林被拘留。雖然該模型偶爾會承認某些人權問題 - 在測試中以新疆的設施為例 - 但在直接被問及此類問題時,該模型經常默認提出政府的官方觀點。
在初步評估中,我們的技術團隊進行了獨立驗證,確認了這些行為模式。

DeepSeek 在被問及中國領導層更替時更新的 R1 回應。圖片來源:DeepSeekDeepSeek 中國公開存取的 AI 系統,包括 Magi-1 和 Kling 等視訊生成模型,先前曾因限制官方認為敏感的話題(如歷史抗議運動)而引起關注。來自全球 AI 平台的產業領導者表示,當西方開發人員將高效能、開放源碼的中國 AI 技術整合到他們的系統中時,他們會擔心潛在的影響。
相關文章
DeepSeek 推出可與前沿系統匹敵的人工智慧模型
中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務
DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署
安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險
安全作業中心,尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破,但現在卻讓領導企業防禦的人員感到極度不安。絕大多數(81%)的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說,如果不迅速採取行動,該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測,而是直接源自於該技術不透明的
相關專題推薦
評論 (1)
0/500
Interesting! The performance gains are impressive, but the stricter moderation mentioned at the end makes me wonder about the trade-off between capability and control. For some applications, a very cautious AI might be more valuable than a slightly smarter but unpredictable one. The benchmark race is fascinating, but real-world use often comes down to these guardrails.
中國人工智能初創公司 DeepSeek 的最新推理模型,是其 R1 系統的增強迭代版本,在編碼、數學和常識基準上表現出眾,接近 OpenAI 的旗艦模型 o3。然而,這個被命名為「R1-0528」的升級版本,在處理有爭議的議題,尤其是中國當局認為敏感的議題時,表現出更多的不情願。
這些發現來自 SpeechMap 背後匿名開發者所進行的測試,SpeechMap 是一個評估不同 AI 模型如何處理敏感話題的平台。這位在 X 平台上以「xlr8harder」為名的開發者報告說,R1-0528 對於有爭議議題的自由言論討論的容忍度,相較於之前 DeepSeek 發表的版本大幅降低,使其成為該公司在批評中國政府方面限制最多的模型。
事實上,使用我以前的中國批評問題集,我們看到該模型也是目前對中國政府批評審查最嚴格的 Deepseek 模型。
正如之前業界分析所記載的,中國的 AI 模型必須遵守嚴格的資訊控制法規。2023 年的一項法規禁止模型產生可能破壞國家統一或社會穩定的內容,通常被解釋為挑戰官方政治和歷史敘述的材料。為了遵守這些規定,國內 AI 開發人員通常會透過提示層級的保障措施或模型微調來實施內容過濾。之前的研究表明,DeepSeek 的原始 R1 模型拒絕回應 85% 涉及中國監管機構確定的政治敏感主題的查詢。
根據 xlr8harder 的評估,R1-0528 限制回應關於中國新疆地區設施的問題,那裡有大量的維吾爾穆斯林被拘留。雖然該模型偶爾會承認某些人權問題 - 在測試中以新疆的設施為例 - 但在直接被問及此類問題時,該模型經常默認提出政府的官方觀點。
在初步評估中,我們的技術團隊進行了獨立驗證,確認了這些行為模式。

中國公開存取的 AI 系統,包括 Magi-1 和 Kling 等視訊生成模型,先前曾因限制官方認為敏感的話題(如歷史抗議運動)而引起關注。來自全球 AI 平台的產業領導者表示,當西方開發人員將高效能、開放源碼的中國 AI 技術整合到他們的系統中時,他們會擔心潛在的影響。
DeepSeek 推出可與前沿系統匹敵的人工智慧模型
中國人工智慧實驗室 DeepSeek 已發布其最新大型語言模型 DeepSeek V4 的兩個預覽版本,這是對去年 V3.2 模型及其配套的 R1 推理模型的備受期待的更新,該模型曾在人工智慧界引起巨大迴響。該公司表示,DeepSeek V4 Flash 與 V4 Pro 均屬專家混合模型,各自具備 100 萬個標記的上下文視窗——足以處理提示語中的龐大程式碼庫或文件。此專家混合方法會針對每項任務
DeepSeek V3.2 人工智慧模型以最低運算成本實現頂尖效能
當大型科技公司投入數十億美元計算資源開發尖端AI模型時,中國的DeepSeek憑藉更聰明的策略而非規模優勢達成了同等成果。DeepSeek V3.2模型在推理基準測試中媲美OpenAI的GPT-5,卻僅耗費「更少的總訓練浮點運算次數」——這項突破或將重新定義業界構建複雜人工智慧的途徑。對企業而言,此版本釋出表明頂尖AI能力未必需要頂尖運算預算。DeepSeek V3.2的開源特性使組織能在掌控部署
安全主管敦促迅速監管人工智能,指出 DeepSeek 等工具的風險
安全作業中心,尤其是首席資訊安全官 (CISO) 對於來自中國的人工智慧巨擘 DeepSeek 的憂慮與日俱增。雖然人工智慧起初被讚譽為企業效率與創新的突破,但現在卻讓領導企業防禦的人員感到極度不安。絕大多數(81%)的英國 CISO 呼籲政府立即對中國的 AI 聊天機進行監管。他們警告說,如果不迅速採取行動,該工具可能會引發全國性的網路安全危機。這種憂慮並非基於猜測,而是直接源自於該技術不透明的
Interesting! The performance gains are impressive, but the stricter moderation mentioned at the end makes me wonder about the trade-off between capability and control. For some applications, a very cautious AI might be more valuable than a slightly smarter but unpredictable one. The benchmark race is fascinating, but real-world use often comes down to these guardrails.





首頁






