選項
首頁
新聞
DeepSeek的R1和V3編碼技巧測試了:我們尚未註定

DeepSeek的R1和V3編碼技巧測試了:我們尚未註定

2025-04-17
106

介紹 DeepSeek:AI 領域的新玩家

DeepSeek 於週末突然登場,憑藉三個引人注目的原因吸引全球關注:

  • 它是一款來自中國的 AI 聊天機器人,與常見的美國產品截然不同。
  • 它是開源的,這在科技社群中意義重大。
  • 它所需的基礎設施遠少於其他重量級競爭對手,使其成為一個引人入勝的選擇。

雖然美國政府對 TikTok 及其可能涉及中國政府的程式碼審查引起關注,但 DeepSeek 從中國的出現自然也引來類似目光。然而,我們在此不談政治。讓我們深入探討 DeepSeek V3 和 DeepSeek R1 在編碼任務中與其他 AI 模型的比較。

根據 DeepSeek 自身的指引:

  • 選擇 V3 處理需要深度和精確度的任務,例如解決複雜數學問題或生成複雜程式碼。
  • 選擇 R1 當需要快速、高量應用時,例如客戶支援自動化或基本文字處理。

您可以在聊天介面中使用一個小按鈕在 R1 和 V3 之間切換。如果按鈕顯示藍色,您正在使用 R1。

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

那麼,它們的表現如何?兩個模型都展現潛力,但並非完美無瑕。讓我們來看看結果。

測試 1:製作 WordPress 外掛

我的第一個測試靈感來自我妻子為她的線上團體需要一個管理參與設備的 WordPress 外掛。這是一個經典案例,外掛需接受一份名單、排序,並確保重複項目不相鄰。我已將此挑戰丟給許多 AI,這是一個棘手的任務。

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

DeepSeek V3 完美達成,創建了符合需求的用戶介面和程式邏輯。R1 採取不同方式,先提供了長達 4502 字的分析才分享程式碼。其用戶介面較廣泛,但介面和邏輯都有效,因此 R1 也通過了。

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

目前,V3 和 R1 在四個測試中各通過一個。

測試 2:重寫字串函數

一名用戶在捐款欄位輸入美元和美分時遇到問題,我的原始程式碼不允許這樣。任務是修改程式以接受兩者。DeepSeek 確實生成功能性程式碼,但仍有改進空間。

V3 的程式碼過於冗長且重複,而 R1 在生成程式碼前的推理也過於冗長。兩者都驗證了最多兩位小數,但對極大數字的處理不佳。R1 使用 JavaScript 的 Number 轉換未檢查邊緣情況,可能導致崩潰。

有趣的是,R1 提供了一份不錯的測試案例清單:

David Gewirtz/ZDNET 截圖

David Gewirtz/ZDNET 截圖

我將這一分給 V3,因為其程式碼不會崩潰且能產生預期結果。R1 因非字串輸入可能導致崩潰而失敗。V3 在四個測試中贏得兩分,R1 得一分。

測試 3:追蹤惱人錯誤

此測試源於我難以找到的一個錯誤。挑戰在於錯誤訊息的明顯答案是錯的,這常會誤導 AI。解決它需要理解 WordPress API 呼叫、看透錯誤訊息並精確定位錯誤。

V3 和 R1 幾乎給出相同答案,雙雙通過此測試,V3 在四個測試中贏得三分,R1 得兩分。DeepSeek 已超越 Gemini、Copilot、Claude 和 Meta。

測試 4:製作腳本

此測試很難,因為涉及三個環境:AppleScript、Chrome 物件模型和 Keyboard Maestro。ChatGPT 完美通過,但 DeepSeek V3 和 R1 表現不佳。兩者都未理解將任務分配給 Keyboard Maestro 和 Chrome 的需求,且 AppleScript 知識薄弱。

R1 做出錯誤假設,例如假設總是存在前台視窗且前台程式總是 Chrome。這使 V3 在四個測試中得三分、一失敗,R1 得兩分、兩失敗。

最終想法

DeepSeek 堅持使用如 Gmail 的公共雲端電子郵件而非我的企業域名令人沮喪。測試過程中的響應問題也使測試時間超出預期。

我最初因以下錯誤無法註冊:

DeepSeek 的線上服務近期遭受大規模惡意攻擊。為確保服務持續,註冊暫時僅限 +86 電話號碼。現有用戶可正常登入。感謝您的理解與支持。

進入後,我得以執行測試。DeepSeek 的程式碼傾向於冗長。測試 4 的 AppleScript 既不正確又過長。測試 2 的正規表達式本可更易維護,但 V3 正確完成。

V3 擊敗 Gemini、Copilot 和 Meta 令人印象深刻,但仍處於舊 GPT-3.5 水平,顯示有成長空間。R1 的表現令人失望。若需程式設計幫助,我會選擇 ChatGPT。

儘管如此,對於一個使用較少基礎設施的新工具,DeepSeek 絕對值得關注。

您有何看法?您試過 DeepSeek 嗎?您使用 AI 進行程式設計支援嗎?請在下方評論中告訴我們。

在社交媒體上關注我的每日項目更新,訂閱我的每週新聞簡訊,並在 Twitter/X (@DavidGewirtz)、Facebook (Facebook.com/DavidGewirtz)、Instagram (Instagram.com/DavidGewirtz)、Bluesky (@DavidGewirtz.com) 及 YouTube (YouTube.com/DavidGewirtzTV) 與我聯繫。

相關文章
AI驅動的音樂創作:輕鬆打造歌曲與影片 AI驅動的音樂創作:輕鬆打造歌曲與影片 音樂創作可能複雜,需耗費時間、資源與專業知識。人工智慧已改變此過程,使其簡單且易於上手。本指南介紹如何利用AI讓任何人免費創作獨特的歌曲與視覺效果,開啟新的創意可能性。我們探索具有直觀介面與先進AI的平台,將您的音樂創意轉化為現實,且無需高昂成本。重點AI可生成完整歌曲,包括人聲,不僅限於器樂。Suno AI與Hailuo AI等平台提供免費音樂創作工具。ChatGPT等AI工具簡化歌詞創作,加速
創建AI驅動的著色書:全面指南 創建AI驅動的著色書:全面指南 設計著色書是一項有益的追求,結合藝術表達與為使用者提供平靜的體驗。然而,此過程可能相當勞力密集。幸運的是,AI工具能輕鬆簡化高品質、一致的著色頁創建。本指南提供使用AI製作著色書的逐步方法,專注於保持一致風格和最佳效率的技術。關鍵要點使用AI提示工具開發詳細、結構化的著色頁提示。確保著色書中所有頁面的藝術風格一致。生成單一著色頁設計的多樣變化。利用Ideogram等AI平台快速高效創建著色書。精煉
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
評論 (11)
0/200
JoseGonzalez
JoseGonzalez 2025-08-07 14:33:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez
ArthurSanchez 2025-04-23 16:48:34

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams
NicholasAdams 2025-04-23 14:36:41

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏

StephenGonzalez
StephenGonzalez 2025-04-21 12:47:37

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

BruceClark
BruceClark 2025-04-21 02:54:30

ディープシークのR1とV3はかなりクールですが、完璧ではありません。コーディングのスキルはまあまあですが、時々レスポンスがずれることがあります。それでも、中国から新しいプレイヤーがAIの世界に参入するのは素晴らしいです。ディープシーク、改善を続けてください!👀

AnthonyHernández
AnthonyHernández 2025-04-20 17:41:17

딥시크의 R1과 V3는 꽤 멋지지만, 완벽하진 않아요. 코딩 스킬은 괜찮은데, 가끔 응답이 좀 어긋나요. 그래도 중국에서 새로운 플레이어가 AI 게임에 참여하는 건 멋진 일이에요. 딥시크, 계속 개선하세요! 👀

回到頂部
OR