DeepSeek的R1和V3編碼技巧測試了:我們尚未註定
介紹 DeepSeek:AI 領域的新玩家
DeepSeek 於週末突然登場,憑藉三個引人注目的原因吸引全球關注:
- 它是一款來自中國的 AI 聊天機器人,與常見的美國產品截然不同。
- 它是開源的,這在科技社群中意義重大。
- 它所需的基礎設施遠少於其他重量級競爭對手,使其成為一個引人入勝的選擇。
雖然美國政府對 TikTok 及其可能涉及中國政府的程式碼審查引起關注,但 DeepSeek 從中國的出現自然也引來類似目光。然而,我們在此不談政治。讓我們深入探討 DeepSeek V3 和 DeepSeek R1 在編碼任務中與其他 AI 模型的比較。
根據 DeepSeek 自身的指引:
- 選擇 V3 處理需要深度和精確度的任務,例如解決複雜數學問題或生成複雜程式碼。
- 選擇 R1 當需要快速、高量應用時,例如客戶支援自動化或基本文字處理。
您可以在聊天介面中使用一個小按鈕在 R1 和 V3 之間切換。如果按鈕顯示藍色,您正在使用 R1。

David Gewirtz/ZDNET 截圖 那麼,它們的表現如何?兩個模型都展現潛力,但並非完美無瑕。讓我們來看看結果。
測試 1:製作 WordPress 外掛
我的第一個測試靈感來自我妻子為她的線上團體需要一個管理參與設備的 WordPress 外掛。這是一個經典案例,外掛需接受一份名單、排序,並確保重複項目不相鄰。我已將此挑戰丟給許多 AI,這是一個棘手的任務。

David Gewirtz/ZDNET 截圖 DeepSeek V3 完美達成,創建了符合需求的用戶介面和程式邏輯。R1 採取不同方式,先提供了長達 4502 字的分析才分享程式碼。其用戶介面較廣泛,但介面和邏輯都有效,因此 R1 也通過了。

David Gewirtz/ZDNET 截圖 
David Gewirtz/ZDNET 截圖 目前,V3 和 R1 在四個測試中各通過一個。
測試 2:重寫字串函數
一名用戶在捐款欄位輸入美元和美分時遇到問題,我的原始程式碼不允許這樣。任務是修改程式以接受兩者。DeepSeek 確實生成功能性程式碼,但仍有改進空間。
V3 的程式碼過於冗長且重複,而 R1 在生成程式碼前的推理也過於冗長。兩者都驗證了最多兩位小數,但對極大數字的處理不佳。R1 使用 JavaScript 的 Number 轉換未檢查邊緣情況,可能導致崩潰。
有趣的是,R1 提供了一份不錯的測試案例清單:

David Gewirtz/ZDNET 截圖 我將這一分給 V3,因為其程式碼不會崩潰且能產生預期結果。R1 因非字串輸入可能導致崩潰而失敗。V3 在四個測試中贏得兩分,R1 得一分。
測試 3:追蹤惱人錯誤
此測試源於我難以找到的一個錯誤。挑戰在於錯誤訊息的明顯答案是錯的,這常會誤導 AI。解決它需要理解 WordPress API 呼叫、看透錯誤訊息並精確定位錯誤。
V3 和 R1 幾乎給出相同答案,雙雙通過此測試,V3 在四個測試中贏得三分,R1 得兩分。DeepSeek 已超越 Gemini、Copilot、Claude 和 Meta。
測試 4:製作腳本
此測試很難,因為涉及三個環境:AppleScript、Chrome 物件模型和 Keyboard Maestro。ChatGPT 完美通過,但 DeepSeek V3 和 R1 表現不佳。兩者都未理解將任務分配給 Keyboard Maestro 和 Chrome 的需求,且 AppleScript 知識薄弱。
R1 做出錯誤假設,例如假設總是存在前台視窗且前台程式總是 Chrome。這使 V3 在四個測試中得三分、一失敗,R1 得兩分、兩失敗。
最終想法
DeepSeek 堅持使用如 Gmail 的公共雲端電子郵件而非我的企業域名令人沮喪。測試過程中的響應問題也使測試時間超出預期。
我最初因以下錯誤無法註冊:
DeepSeek 的線上服務近期遭受大規模惡意攻擊。為確保服務持續,註冊暫時僅限 +86 電話號碼。現有用戶可正常登入。感謝您的理解與支持。
進入後,我得以執行測試。DeepSeek 的程式碼傾向於冗長。測試 4 的 AppleScript 既不正確又過長。測試 2 的正規表達式本可更易維護,但 V3 正確完成。
V3 擊敗 Gemini、Copilot 和 Meta 令人印象深刻,但仍處於舊 GPT-3.5 水平,顯示有成長空間。R1 的表現令人失望。若需程式設計幫助,我會選擇 ChatGPT。
儘管如此,對於一個使用較少基礎設施的新工具,DeepSeek 絕對值得關注。
您有何看法?您試過 DeepSeek 嗎?您使用 AI 進行程式設計支援嗎?請在下方評論中告訴我們。
在社交媒體上關注我的每日項目更新,訂閱我的每週新聞簡訊,並在 Twitter/X (@DavidGewirtz)、Facebook (Facebook.com/DavidGewirtz)、Instagram (Instagram.com/DavidGewirtz)、Bluesky (@DavidGewirtz.com) 及 YouTube (YouTube.com/DavidGewirtzTV) 與我聯繫。
相關文章
Master Emerald Kaizo Nuzlocke:終極生存與策略指南
Emerald Kaizo 是有史以來最強大的 Pokémon ROM hacks 之一。雖然嘗試執行 Nuzlocke 會使挑戰成倍增加,但透過縝密的規劃和策略執行,勝利仍然是可以實現的。這本權威指南提供在 Hardcore Nuzlocke 規則下征服 Emerald Kaizo 的必要工具、經過實戰考驗的戰術以及深入的 AI 分析。準備好迎接 Pokémon 精通的終極考驗吧!基本策略收集關
AI Powered Cover Letters:期刊投稿專家指南
在現今競爭激烈的學術出版環境中,撰寫一封有效的求職信對您的稿件能否被接受起著舉足輕重的作用。探索像 ChatGPT 之類的人工智能工具如何簡化這項重要任務,幫助您撰寫出精緻、專業的求職信,吸引期刊編輯的注意。我們的全面指南揭示了逐步優化您的投稿包並最大化出版成功率的策略。重點必要的研究準備:彙整所有稿件細節和期刊規格。AI 輔助撰稿:使用 ChatGPT 生成初始求職信模板。個人客製化:完善 AI
美國將因社交媒體法規制裁外國官員
美國站出來反對全球數位內容法規美國國務院本周針對歐洲的數位治理政策發出尖銳的外交譴責,顯示在網路平台控制權上的緊張關係正不斷升級。國務卿 Marco Rubio 公布了一項新的簽證限制政策,針對參與美國認為影響美國數位空間的過度審查的外國官員。新簽證限制說明根據週三公佈的政策,美國將拒絕被判定為正在執行影響美國受保護言論的海外內容規定的外國公民入境。Rubio 強調兩項主要的違法行為:
評論 (13)
0/200
CarlCarter
2025-09-06 04:30:30
DeepSeek这波操作有点东西啊!中国本土AI终于不再只擅长写诗和做饭了,居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂
0
BruceGonzalez
2025-08-25 15:01:02
DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀
0
JoseGonzalez
2025-08-07 14:33:00
DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄
0
ArthurSanchez
2025-04-23 16:48:34
DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏
0
NicholasAdams
2025-04-23 14:36:41
DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏
0
StephenGonzalez
2025-04-21 12:47:37
DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀
0
介紹 DeepSeek:AI 領域的新玩家
DeepSeek 於週末突然登場,憑藉三個引人注目的原因吸引全球關注:
- 它是一款來自中國的 AI 聊天機器人,與常見的美國產品截然不同。
- 它是開源的,這在科技社群中意義重大。
- 它所需的基礎設施遠少於其他重量級競爭對手,使其成為一個引人入勝的選擇。
雖然美國政府對 TikTok 及其可能涉及中國政府的程式碼審查引起關注,但 DeepSeek 從中國的出現自然也引來類似目光。然而,我們在此不談政治。讓我們深入探討 DeepSeek V3 和 DeepSeek R1 在編碼任務中與其他 AI 模型的比較。
根據 DeepSeek 自身的指引:
- 選擇 V3 處理需要深度和精確度的任務,例如解決複雜數學問題或生成複雜程式碼。
- 選擇 R1 當需要快速、高量應用時,例如客戶支援自動化或基本文字處理。
您可以在聊天介面中使用一個小按鈕在 R1 和 V3 之間切換。如果按鈕顯示藍色,您正在使用 R1。
那麼,它們的表現如何?兩個模型都展現潛力,但並非完美無瑕。讓我們來看看結果。
測試 1:製作 WordPress 外掛
我的第一個測試靈感來自我妻子為她的線上團體需要一個管理參與設備的 WordPress 外掛。這是一個經典案例,外掛需接受一份名單、排序,並確保重複項目不相鄰。我已將此挑戰丟給許多 AI,這是一個棘手的任務。
DeepSeek V3 完美達成,創建了符合需求的用戶介面和程式邏輯。R1 採取不同方式,先提供了長達 4502 字的分析才分享程式碼。其用戶介面較廣泛,但介面和邏輯都有效,因此 R1 也通過了。
目前,V3 和 R1 在四個測試中各通過一個。
測試 2:重寫字串函數
一名用戶在捐款欄位輸入美元和美分時遇到問題,我的原始程式碼不允許這樣。任務是修改程式以接受兩者。DeepSeek 確實生成功能性程式碼,但仍有改進空間。
V3 的程式碼過於冗長且重複,而 R1 在生成程式碼前的推理也過於冗長。兩者都驗證了最多兩位小數,但對極大數字的處理不佳。R1 使用 JavaScript 的 Number 轉換未檢查邊緣情況,可能導致崩潰。
有趣的是,R1 提供了一份不錯的測試案例清單:
我將這一分給 V3,因為其程式碼不會崩潰且能產生預期結果。R1 因非字串輸入可能導致崩潰而失敗。V3 在四個測試中贏得兩分,R1 得一分。
測試 3:追蹤惱人錯誤
此測試源於我難以找到的一個錯誤。挑戰在於錯誤訊息的明顯答案是錯的,這常會誤導 AI。解決它需要理解 WordPress API 呼叫、看透錯誤訊息並精確定位錯誤。
V3 和 R1 幾乎給出相同答案,雙雙通過此測試,V3 在四個測試中贏得三分,R1 得兩分。DeepSeek 已超越 Gemini、Copilot、Claude 和 Meta。
測試 4:製作腳本
此測試很難,因為涉及三個環境:AppleScript、Chrome 物件模型和 Keyboard Maestro。ChatGPT 完美通過,但 DeepSeek V3 和 R1 表現不佳。兩者都未理解將任務分配給 Keyboard Maestro 和 Chrome 的需求,且 AppleScript 知識薄弱。
R1 做出錯誤假設,例如假設總是存在前台視窗且前台程式總是 Chrome。這使 V3 在四個測試中得三分、一失敗,R1 得兩分、兩失敗。
最終想法
DeepSeek 堅持使用如 Gmail 的公共雲端電子郵件而非我的企業域名令人沮喪。測試過程中的響應問題也使測試時間超出預期。
我最初因以下錯誤無法註冊:
DeepSeek 的線上服務近期遭受大規模惡意攻擊。為確保服務持續,註冊暫時僅限 +86 電話號碼。現有用戶可正常登入。感謝您的理解與支持。
進入後,我得以執行測試。DeepSeek 的程式碼傾向於冗長。測試 4 的 AppleScript 既不正確又過長。測試 2 的正規表達式本可更易維護,但 V3 正確完成。
V3 擊敗 Gemini、Copilot 和 Meta 令人印象深刻,但仍處於舊 GPT-3.5 水平,顯示有成長空間。R1 的表現令人失望。若需程式設計幫助,我會選擇 ChatGPT。
儘管如此,對於一個使用較少基礎設施的新工具,DeepSeek 絕對值得關注。
您有何看法?您試過 DeepSeek 嗎?您使用 AI 進行程式設計支援嗎?請在下方評論中告訴我們。
在社交媒體上關注我的每日項目更新,訂閱我的每週新聞簡訊,並在 Twitter/X (@DavidGewirtz)、Facebook (Facebook.com/DavidGewirtz)、Instagram (Instagram.com/DavidGewirtz)、Bluesky (@DavidGewirtz.com) 及 YouTube (YouTube.com/DavidGewirtzTV) 與我聯繫。




DeepSeek这波操作有点东西啊!中国本土AI终于不再只擅长写诗和做饭了,居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂




DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀




DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄




DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏




DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏




DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀












