DeepSeek的R1和V3编码技巧测试了：我们尚未注定

首页

新闻

2025-04-17

MarkSmith

229

介绍DeepSeek：AI领域的新玩家

DeepSeek在周末突然崭露头角，凭借三个引人注目的原因吸引了全球关注：

它是一款来自中国的AI聊天机器人，与常见的美国产品明显不同。
它是开源的，这在科技社区中意义重大。
它所需的硬件基础设施远少于重量级对手，使其成为一个引人注目的选择。

虽然美国政府对TikTok及其代码可能涉及中国政府的审查引发了关注，DeepSeek来自中国自然也引起了类似关注。然而，我们这里不谈政治。相反，让我们深入探讨DeepSeek V3和DeepSeek R1在编码任务中与其他AI模型的对比。

根据DeepSeek自己的指导意见：

选择V3处理需要深度和准确性的任务，如解决复杂数学问题或生成复杂代码。
选择R1用于需要快速、高吞吐量的应用，如客户支持自动化或基本文本处理。

你可以通过聊天界面中的一个小按钮在R1和V3之间切换。如果按钮是蓝色的，你正在使用R1。

David Gewirtz/ZDNET截图

那么，它们的表现如何？两个模型都展现了潜力，但并非完美无缺。让我们来探讨结果。

测试1：打造一个WordPress插件

我的第一个测试灵感来自我妻子为她的在线小组需要一个管理参与设备的WordPress插件，这是一个经典案例。该插件需要接受一个姓名列表，对其排序，并确保重复项不挨在一起。我已将这个挑战抛给了许多AI，这是一个艰难的任务。

David Gewirtz/ZDNET截图

DeepSeek V3完美地完成了任务，创建了符合需求的界面和程序逻辑。R1采取了不同方法，在分享代码前提供了多达4502字的分析。它的界面更广泛，但界面和逻辑都有效，因此R1也通过了测试。

David Gewirtz/ZDNET截图

到目前为止，V3和R1在四个测试中各通过了一个。

测试2：重写字符串函数

一位用户在输入美元和美分的捐款字段时遇到问题，我的原始代码不支持此功能。任务是修改程序以接受两者。DeepSeek确实生成了可运行的代码，但仍有改进空间。

V3的代码过长且重复，而R1在生成代码前的推理也冗长。两个模型都验证了最多两位小数，但它们处理超大数字的能力不足。R1使用JavaScript的Number转换而未检查边缘情况，可能导致崩溃。

有趣的是，R1提供了一份不错的测试用例列表：

David Gewirtz/ZDNET截图

我将这一分给V3，因为它的代码不会崩溃且能产生预期结果。R1因非字符串输入可能导致崩溃而失败。V3在四个测试中赢得了两场，R1赢得了一场。

测试3：追踪一个棘手的错误

这个测试源于我苦苦寻找的一个错误。挑战在于，基于错误信息的显而易见答案是错误的，这常常会误导AI。解决它需要理解WordPress API调用，超越错误信息，并精确找到错误。

V3和R1都以几乎相同的答案通过了这个测试，使V3在四个测试中赢得三场，R1赢得两场。DeepSeek已超越Gemini、Copilot、Claude和Meta的表现。

测试4：编写一个脚本

这个测试很困难，因为它涉及三个环境：AppleScript、Chrome对象模型和Keyboard Maestro。ChatGPT完美通过，但DeepSeek V3和R1表现不佳。两个模型都没能理解在Keyboard Maestro和Chrome之间拆分任务的需要，且它们的AppleScript知识薄弱。

R1做出了错误假设，例如假设始终存在前台窗口，且前台运行的程序始终是Chrome。这使得V3在四个测试中三胜一负，R1两胜两负。

最终想法

DeepSeek坚持使用Gmail等公共云邮箱而非我的企业域名令人沮丧。测试过程中还遇到了一些响应问题，导致测试时间超出预期。

我最初因以下错误无法注册：

DeepSeek的在线服务近期遭受大规模恶意攻击。为确保服务持续，注册暂时仅限+86电话号码。现有用户可正常登录。感谢您的理解和支持。

进入后，我得以运行测试。DeepSeek的代码倾向于冗长。测试4中的AppleScript既不正确又过长。测试2中的正则表达式本可以更易维护，尽管V3做对了。

V3击败了Gemini、Copilot和Meta让我印象深刻，但它仍处于旧的GPT-3.5水平，表明还有成长空间。R1的表现令人失望。如果让我选择，我会继续用ChatGPT来帮助编程。

尽管如此，对于一个在更少基础设施上运行的新工具，DeepSeek绝对值得关注。

你怎么看？你试过DeepSeek吗？你用过AI来支持编程吗？请在下方评论中告诉我们。

在社交媒体上关注我的每日项目更新，订阅我的每周简讯，并在Twitter/X上通过@DavidGewirtz、Facebook上通过Facebook.com/DavidGewirtz、Instagram上通过Instagram.com/DavidGewirtz、Bluesky上通过@DavidGewirtz.com以及YouTube上通过YouTube.com/DavidGewirtzTV与我联系。

WordPress.com 现已支持 AI 助手撰写和发布文章，还有更多功能广受欢迎的网站托管和发布平台 WordPress.com 现已开始引入人工智能助手——这一举措或将重塑网络的呈现方式。该公司于周五宣布，将允许人工智能助手在用户网站上起草、编辑和发布内容，同时还能管理评论、更新和修正元数据，并通过标签和分类对内容进行整理。所有这些操作均通过一个界面进行控制，网站所有者只需使用自然语言命令说明其需求即可。凭借这些新功能，网站几乎可以完全由人工指导的AI代理来创建和运

Anthropic公司的实验性人工智能Claude在电子商务测试中完成了谈判和交易随着人工智能的飞速发展，Anthropic上周五悄然启动了一项名为“Project Deal”的内部实验，展示了人工智能在电子商务领域的潜力。该实验让其人工智能模型Claude在封闭的市场环境中自主处理买卖及价格谈判，并涉及真实的金融交易。实验的核心是一个基于Slack构建的内部市场，Claude在其中同时担任买卖双方的谈判代表。它首先对69名员工进行了访谈，收集了他们的买卖意向及个性化指示，随后

DeepSeek Code 即将发布随着人工智能技术的加速发展，DeepSeek正处于一个激动人心的关键时刻。这家人工智能公司近日透露，已获得超过700亿元的融资。公司管理层强调，将致力于开创性的人工智能研究，而非追求眼前的商业利益。这一战略转型表明，DeepSeek将全力投入新产品的开发，尤其是备受期待的DeepSeek Code。DeepSeek Code的规划已初具雏形，公司招聘页面上已发布多个相关职位，例如“Agent Ha

相关专题推荐

商业

最佳人工智能招聘工具：筛选简历并自动安排候选人面试

在 XIX.AI 上探索 2026 年最新、评价最高的人工智能招聘工具。我们精心筛选的清单汇集了功能强大、颠覆传统的解决方案，可帮助您筛选简历并自动安排候选人面试。通过实际测试和每周更新的排名，对比免费与付费选项。立即找到最适合您的招聘助手，优化您的招聘流程！

10 个工具

xix.ai

生产率

AI个人健康与专注力教练：缓解倦怠，提升精神能量

立即访问 XIX.AI，探索 2026 年最优秀的 AI 个人健康与专注力教练。我们的精选排行榜汇集了广受好评、具有颠覆性意义的工具，助您缓解倦怠、提升精神能量。通过真实案例分析，对比免费与付费选项。立即开启通往巅峰生产力和身心健康的道路。

10 个工具

xix.ai

聊天机器人

备受好评的AI浪漫聊天机器人：凭借稳定的个性建立长期关系

探索2026年最新、评价最高的人工智能浪漫聊天机器人，助您建立真实而长久的联系。我们的精选清单涵盖了功能强大且性格鲜明的聊天机器人，并提供了免费与付费版本的对比分析以及实际测试结果。在XIX.AI上找到您的完美伴侣，立即开始建立联系吧。

10 个工具

xix.ai

教育与学习

最佳AI数据科学导师：精通SQL、Pandas及机器学习工作流程

探索2026年最优秀的人工智能数据科学导师，帮助他们掌握SQL、Pandas以及机器学习工作流程。在XIX.AI上查看我们精心挑选的顶级导师名单，获得强大而具有变革性的指导。通过对比免费和付费选项，并结合实际应用案例进行了解，今天就开启你的数据科学精通之路吧。

10 个工具

xix.ai

聊天机器人

最佳AI调情与对话训练工具：实时提升社交魅力与自信

在 XIX.AI 上探索 2026 年最优秀的 AI 调情与对话训练工具。我们精心挑选的高评分工具助您实时提升社交魅力与自信。探索这些必试的、颠覆性的工具，查看免费版与付费版的对比，并了解每周更新的排行榜。立即开启您的社交优势。

10 个工具

xix.ai

代码

最适合自动化单元测试的最佳AI工具：一键生成Jest、PyTest和JUnit测试用例

探索2026年最新评选出的顶级AI工具，这些工具专为自动化单元测试而设计。我们精心挑选了那些功能强大、能够改变开发流程的工具，它们能够帮助您快速生成Jest、PyTest和JUnit测试用例。在XIX.AI平台上，您可以免费查看各种选项，并通过实际测试结果以及每周更新的排名来了解它们的优劣。立即利用这些AI工具，提升您的开发效率吧！

10 个工具

xix.ai

0/500

请登录后再操作

KennethRoberts

2026-05-27 16:00:19

Als Entwickler finde ich es super, dass jetzt auch China mit DeepSeek in den Open-Source-AI-Markt einsteigt. Die Coding-Tests klingen vielversprechend – vielleicht wird die Konkurrenz zwischen den Modellen ja endlich mal die Preise drücken. Hoffentlich bleibt das Projekt langfristig unabhängig und wird nicht von irgendwelchen Firmen vereinnahmt. 🤔

CarlCarter

2025-09-06 04:30:30

DeepSeek这波操作有点东西啊！中国本土AI终于不再只擅长写诗和做饭了，居然在代码能力上也能和国外大模型掰手腕👏 不过开源这事...希望别过两天就变成'部分开源'吧😂

BruceGonzalez

2025-08-25 15:01:02

DeepSeek's open-source approach is a game-changer! I'm stoked to see a Chinese AI shaking things up. The coding skills are solid, but I wonder how it’ll stack against giants like GPT in the long run. Exciting times! 🚀

JoseGonzalez

2025-08-07 14:33:00

DeepSeek's open-source approach is super cool! It's wild to see a Chinese AI shaking up the game like this. I wonder how it'll stack up against ChatGPT in real-world coding tasks. Excited to try it out! 😄

ArthurSanchez

2025-04-23 16:48:34

DeepSeek's R1 and V3 are pretty cool, but let's be real, they're not perfect. The coding skills are decent, but sometimes it feels like they're just guessing. Still, it's refreshing to see a new player from China in the AI space! Keep improving, DeepSeek! 👏

NicholasAdams

2025-04-23 14:36:41

DeepSeekのR1とV3はかなりクールですが、正直に言うと、完璧ではありません。コーディングのスキルはまあまあですが、時々ただ推測しているように感じます。それでも、中国からAIの新しいプレイヤーが登場するのは新鮮ですね！DeepSeek、改善を続けてください！👏

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Ramp 数据显示企业人工智能应用趋于平稳 Bing图像创建者教程：AI艺术生成指南学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 Embodied Intelligence 发布首个行业标准，旨在遏制无序增长

精选