选项
首页
新闻
DeepSeek的R1和V3编码技巧测试了:我们尚未注定

DeepSeek的R1和V3编码技巧测试了:我们尚未注定

2025-04-17
106

介绍DeepSeek:AI领域的新玩家

DeepSeek在周末突然崭露头角,凭借三个引人注目的原因吸引了全球关注:

  • 它是一款来自中国的AI聊天机器人,与常见的美国产品明显不同。
  • 它是开源的,这在科技社区中意义重大。
  • 它所需的硬件基础设施远少于重量级对手,使其成为一个引人注目的选择。

虽然美国政府对TikTok及其代码可能涉及中国政府的审查引发了关注,DeepSeek来自中国自然也引起了类似关注。然而,我们这里不谈政治。相反,让我们深入探讨DeepSeek V3和DeepSeek R1在编码任务中与其他AI模型的对比。

根据DeepSeek自己的指导意见:

  • 选择V3处理需要深度和准确性的任务,如解决复杂数学问题或生成复杂代码。
  • 选择R1用于需要快速、高吞吐量的应用,如客户支持自动化或基本文本处理。

你可以通过聊天界面中的一个小按钮在R1和V3之间切换。如果按钮是蓝色的,你正在使用R1。

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

那么,它们的表现如何?两个模型都展现了潜力,但并非完美无缺。让我们来探讨结果。

测试1:打造一个WordPress插件

我的第一个测试灵感来自我妻子为她的在线小组需要一个管理参与设备的WordPress插件,这是一个经典案例。该插件需要接受一个姓名列表,对其排序,并确保重复项不挨在一起。我已将这个挑战抛给了许多AI,这是一个艰难的任务。

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

DeepSeek V3完美地完成了任务,创建了符合需求的界面和程序逻辑。R1采取了不同方法,在分享代码前提供了多达4502字的分析。它的界面更广泛,但界面和逻辑都有效,因此R1也通过了测试。

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

到目前为止,V3和R1在四个测试中各通过了一个。

测试2:重写字符串函数

一位用户在输入美元和美分的捐款字段时遇到问题,我的原始代码不支持此功能。任务是修改程序以接受两者。DeepSeek确实生成了可运行的代码,但仍有改进空间。

V3的代码过长且重复,而R1在生成代码前的推理也冗长。两个模型都验证了最多两位小数,但它们处理超大数字的能力不足。R1使用JavaScript的Number转换而未检查边缘情况,可能导致崩溃。

有趣的是,R1提供了一份不错的测试用例列表:

David Gewirtz/ZDNET截图

David Gewirtz/ZDNET截图

我将这一分给V3,因为它的代码不会崩溃且能产生预期结果。R1因非字符串输入可能导致崩溃而失败。V3在四个测试中赢得了两场,R1赢得了一场。

测试3:追踪一个棘手的错误

这个测试源于我苦苦寻找的一个错误。挑战在于,基于错误信息的显而易见答案是错误的,这常常会误导AI。解决它需要理解WordPress API调用,超越错误信息,并精确找到错误。

V3和R1都以几乎相同的答案通过了这个测试,使V3在四个测试中赢得三场,R1赢得两场。DeepSeek已超越Gemini、Copilot、Claude和Meta的表现。

测试4:编写一个脚本

这个测试很困难,因为它涉及三个环境:AppleScript、Chrome对象模型和Keyboard Maestro。ChatGPT完美通过,但DeepSeek V3和R1表现不佳。两个模型都没能理解在Keyboard Maestro和Chrome之间拆分任务的需要,且它们的AppleScript知识薄弱。

R1做出了错误假设,例如假设始终存在前台窗口,且前台运行的程序始终是Chrome。这使得V3在四个测试中三胜一负,R1两胜两负。

最终想法

DeepSeek坚持使用Gmail等公共云邮箱而非我的企业域名令人沮丧。测试过程中还遇到了一些响应问题,导致测试时间超出预期。

我最初因以下错误无法注册:

DeepSeek的在线服务近期遭受大规模恶意攻击。为确保服务持续,注册暂时仅限+86电话号码。现有用户可正常登录。感谢您的理解和支持。

进入后,我得以运行测试。DeepSeek的代码倾向于冗长。测试4中的AppleScript既不正确又过长。测试2中的正则表达式本可以更易维护,尽管V3做对了。

V3击败了Gemini、Copilot和Meta让我印象深刻,但它仍处于旧的GPT-3.5水平,表明还有成长空间。R1的表现令人失望。如果让我选择,我会继续用ChatGPT来帮助编程。

尽管如此,对于一个在更少基础设施上运行的新工具,DeepSeek绝对值得关注。

你怎么看?你试过DeepSeek吗?你用过AI来支持编程吗?请在下方评论中告诉我们。

在社交媒体上关注我的每日项目更新,订阅我的每周简讯,并在Twitter/X上通过@DavidGewirtz、Facebook上通过Facebook.com/DavidGewirtz、Instagram上通过Instagram.com/DavidGewirtz、Bluesky上通过@DavidGewirtz.com以及YouTube上通过YouTube.com/DavidGewirtzTV与我联系。

相关文章
马乔里·泰勒·格林批评AI聊天机器人Grok涉嫌左翼偏见 马乔里·泰勒·格林批评AI聊天机器人Grok涉嫌左翼偏见 上周,埃隆·马斯克的AI聊天机器人Grok出现故障,导致其在用户提出无关问题时讨论南非的“白人种族灭绝”阴谋论。此后不久,Grok质疑了大屠杀死亡人数,将问题归咎于“编码故障”。令人意外的是,众议员马乔里·泰勒·格林(共和党-乔治亚州)称埃隆·马斯克的AI创作Grok过于进步。图片来源:Twitter/X(截图)“Grok倾向左翼并传播虚假叙事,”格林在X上发帖说。她分享了一张截图,Grok在其中
AI语音翻译器G5 Pro:无缝全球沟通 AI语音翻译器G5 Pro:无缝全球沟通 在全球互联至关重要的世界中,弥合语言差距比以往任何时候都更重要。AI语音翻译器G5 Pro以其实时翻译功能为多种场景提供实用解决方案。无论您是探索新国家、进行国际商务,还是学习新语言,此设备都能轻松简化沟通。本文深入探讨AI语音翻译器G5 Pro的功能、优势和应用,展示其如何在多语言环境中增强互动。主要亮点AI语音翻译器G5 Pro支持多种语言,促进全球互联。其即时翻译功能支持旅行、教育和商务等场
使用HitPaw AI照片增强器提升您的图像:全面指南 使用HitPaw AI照片增强器提升您的图像:全面指南 想改变您的照片编辑体验吗?凭借尖端人工智能技术,改善您的图像现在变得轻而易举。本详细指南介绍了HitPaw AI照片增强器,这是一款离线AI工具,可自动提升图像质量和分辨率。无论您是经验丰富的摄影师还是希望优化个人快照的爱好者,HitPaw AI照片增强器都能提供强大的功能,带来惊艳的效果。主要亮点HitPaw AI照片增强器是一款适用于Windows和Mac的AI驱动解决方案,旨在提升图像质量。
评论 (11)
0/200
JoseGonzalez
JoseGonzalez 2025-08-07 14:33:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez
ArthurSanchez 2025-04-23 16:48:34

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams
NicholasAdams 2025-04-23 14:36:41

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね!DeepSeek、改善を続けてください!👏

StephenGonzalez
StephenGonzalez 2025-04-21 12:47:37

DeepSeek's R1 and V3 are pretty cool, but they're not perfect. The coding skills are decent, but sometimes the responses are a bit off. Still, it's great to see a new player from China in the AI game. Keep improving, DeepSeek! 👀

BruceClark
BruceClark 2025-04-21 02:54:30

ディープシークのR1とV3はかなりクールですが、完璧ではありません。コーディングのスキルはまあまあですが、時々レスポンスがずれることがあります。それでも、中国から新しいプレイヤーがAIの世界に参入するのは素晴らしいです。ディープシーク、改善を続けてください!👀

AnthonyHernández
AnthonyHernández 2025-04-20 17:41:17

딥시크의 R1과 V3는 꽤 멋지지만, 완벽하진 않아요. 코딩 스킬은 괜찮은데, 가끔 응답이 좀 어긋나요. 그래도 중국에서 새로운 플레이어가 AI 게임에 참여하는 건 멋진 일이에요. 딥시크, 계속 개선하세요! 👀

返回顶部
OR