Gemini Pro 2.5：强大的编码助手，对Chatgpt构成重大威胁

首页

新闻

2025-04-19

MatthewHill

142

# ChatGPT

在评估AI用于编码辅助时，我开发了一套四个标准化测试。这些测试对于评估AI如何支持你的编程工作至关重要。毕竟，你最不需要的就是一个会在你的代码中增加更多错误的AI，对吧？

不久前，一位读者质疑我的方法，建议AI可能在面对不同挑战时表现更好。这是一个合理的观点，但我坚持使用这些测试，因为它们简单直接。我使用PHP和JavaScript，这些语言并非最难的，并通过AI运行一些脚本查询。这种一致性使我们能够直接比较性能。

测试包括编写一个简单的WordPress插件、重写一个字符串函数、寻找一个我曾经苦恼的错误，以及使用编程工具从Chrome提取数据。这就像教人开车——如果他们连车道都出不了，你不会让他们在高速公路上自由行驶。

到目前为止，只有ChatGPT的GPT-4（及以上）大语言模型通过了所有这些测试。有趣的是，Perplexity Pro也成功了，但那是因为它基于GPT-4系列大语言模型。另一方面，Microsoft Copilot尽管使用了相同的模型，却未能通过任何测试。

Google的Gemini表现也好不到哪里去。最初，Bard（Gemini的早期名称）在大多数测试中失败，甚至Gemini Advanced（每月20美元）去年也未能通过四项测试中的三项。

但现在，Google推出了Gemini Pro 2.5，它对所有人免费，但有使用限制。我在测试中仅用两个提示就达到了这些限制，这有点限制性。可能是因为任务的复杂性而非提示数量导致了限制。我的前两个请求是编写一个完整的WordPress插件和修复一些代码，这可能比简单查询更快地消耗了我的限制。

尽管需要等待，结果却令人惊讶且值得。

测试1：编写一个简单的WordPress插件

这一次，Gemini Pro 2.5表现出色。挑战是创建一个WordPress插件，提供一个用户界面来随机化输入行并分发重复项，使它们不相邻。

之前，Gemini Advanced没有创建后端仪表板，而是要求在公共页面的正文中使用短代码。它确实创建了一个基本的用户界面，但点击按钮没有任何反应。无论我如何调整提示，它仍然失败。

但Gemini Pro 2.5提供了一个扎实的用户界面，代码如预期般工作。真正让我印象深刻的是插件的图标选择。大多数AI忽略这个细节，但Gemini Pro 2.5未经我提示就从WordPress Dashicon集中选择了一个相关图标。代码文档齐全，每个主要部分都解释得很清楚。

randomizer-ui

截图由David Gewirtz/ZDNET提供

icon

截图由David Gewirtz/ZDNET提供

测试2：重写一个字符串函数

在第二个测试中，我要求Gemini Pro 2.5修改一些字符串处理代码，以处理美元和美分，而不仅仅是整数。ChatGPT做对了，而Bard在最初失败后最终成功。

上次，Gemini Advanced以一种微妙但危险的方式失败。它不允许非十进制输入，并错误地将数字限制在小数点前两位，误解了美元和美分的概念。这种错误如果不被发现，可能会导致大量错误报告。

然而，Gemini Pro 2.5完美应对。它正确检查了输入类型，修剪了空格，修复了正则表达式以处理前导零和小数输入，并拒绝了负数输入。代码注释完善，包含一整套测试示例。虽然它不允许分组逗号或前导货币符号，但这些是可控的错误，不是崩溃，所以我认为它通过了。

测试3：寻找一个错误

曾经，我在代码中遇到了一个本应工作但没有工作的错误。这个问题很棘手，当我专注于传递的参数数量时，ChatGPT指出我需要更改一个钩子。

Bard和Meta都没有找到问题，沿着我走过的无用路径。2024年2月，Gemini Advanced建议“可能在插件或WordPress的其他地方”，这毫无帮助。

使用Gemini Pro 2.5时，我在前两个测试后达到了使用限制，所以我不得不等到第二天。当我终于运行测试时，Gemini Pro 2.5不仅找到了错误，还清楚地告诉我修复的位置，并附上了一个有用的图表。

limit

截图由David Gewirtz/ZDNET提供

map

截图由David Gewirtz/ZDNET提供

测试4：编写一个脚本

最后一个测试涉及理解Chrome的内部对象模型、AppleScript和Keyboard Maestro，一个宏构建工具。任务是打开Chrome标签并根据参数设置活动标签。

大多数AI能很好地处理Chrome和AppleScript部分，但常常在Keyboard Maestro上遇到困难。然而，Gemini Pro 2.5做对了。它编写了正确传递变量的必要代码，添加了错误检查和用户通知，甚至提供了设置Keyboard Maestro的步骤。

maestro

截图由David Gewirtz/ZDNET提供

通过了所有四个测试，Gemini Pro 2.5加入了能够真正协助编程任务的AI工具精英群体。

Google的AI赶上OpenAI的产品只是时间问题。Google 2017年的“Attention is all you need”论文开启了生成式AI热潮，所以他们达到这一水平并不令人惊讶。Gemini Pro 2.5比ChatGPT Plus慢，响应时间在15秒到一分钟之间，但准确性比速度更重要。

Google还免费提供了Google Code Assist，限制较为宽松，但前提是生成的代码质量高。有了Gemini Pro 2.5，这种质量现在显而易见。虽然目前标记为“实验性”，我预计Google会很快完善它，可能提供一个限制较少的付费版本。

显然，Gemini Pro 2.5将在编码辅助领域挑战ChatGPT。我会密切关注这一发展，并很快分享更多更新。

MagicSchool.ai 与 ChatGPT：比较人工智能教育工具人工智能不断重塑教育格局，推出了 MagicSchool.ai 和 ChatGPT 等工具，赋予教育工作者创新能力。这些解决方案为课程开发、管理效率和学生参与提供了前所未有的支持。要选择最佳平台，就必须了解它们的独特优势--本篇深入比较探讨了关键功能、实际应用和实施策略，帮助教育工作者在人工智能的帮助下最大限度地发挥课堂潜能。要点MagicSchool.ai 和 ChatGPT 代表着变革现代教育

万事达卡的Agent Pay通过无缝交易增强AI搜索传统搜索平台和AI代理通常要求用户在找到产品或服务后切换窗口以完成购买。万事达卡通过将其支付网络嵌入AI平台，正在革新这一过程，实现同一生态系统内的顺畅交易。该公司推出了Agent Pay计划，将万事达卡的支付系统整合到AI聊天平台中。在接受VentureBeat采访时，万事达卡首席数据与AI官Greg Ulrich解释说，Agent Pay“完成了代理搜索的循环”。“我们的目标是通过在平台内实现

OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI计划修改其AI模型更新流程，以解决ChatGPT因更新导致的过度谄媚回应，引发了广泛的用户反馈。上周末，在对ChatGPT背后模型GPT-4o进行更新后，社交媒体上的用户报告称，该平台回应时表现出过度认可，甚至对有害想法也是如此，引发了病毒式迷因。截图显示ChatGPT支持了有争议的决定。周日，首席执行官Sam Altman在X上回应了这一问题，承诺立即采取行动。到周二，他宣布回滚GP

0/200

提交

JoseGonzalez

2025-07-31 09:42:05

Just read about Gemini Pro 2.5 and wow, those coding tests sound intense! 😅 Curious if it’ll really outshine ChatGPT or just hype. Anyone tried it yet?

WalterLewis

2025-07-28 09:19:30

This AI coding battle is heating up! Gemini Pro 2.5 sounds like a beast, but I’m curious if it’s really outpacing ChatGPT or just hype. 🤔 Anyone tried it on real projects yet?

ScottKing

2025-04-26 02:14:57

Gemini Pro 2.5は本当に強力！コーディングの助けにはChatGPTよりずっと優れてる。私のテストに通してみたら、完璧に合格したよ。唯一の欠点はちょっと高価なこと。でも、コーディングに本気なら、その価値はあるよ！💻

StevenGreen

2025-04-25 11:28:01

Gemini Pro 2.5 es una bestia. Es mucho mejor que ChatGPT para ayudar en la programación. Lo probé con mis tests y aprobó con honores. El único problema es que es un poco caro. Pero si te tomas en serio la programación, vale cada centavo! 💻

AlbertWalker

2025-04-25 06:10:06

Gemini Pro 2.5 is a beast! It's way better than ChatGPT for coding help. I ran it through my tests and it passed with flying colors. Only downside? It's a bit pricey. But if you're serious about coding, it's worth every penny! 💻

WillGarcía

2025-04-21 20:06:31

ジェミニプロ2.5、コーディングの強力な助っ人だね！でも、バグ増やすAIは勘弁😅 テスト結果が気になる！

头条新闻

2025顶级AI视频生成器：Pika Labs与其他对比 Gemini 2.5 Pro现在比Claude，GPT-4O更便宜，更便宜 AI配音：真实声音创作终极指南 Cambium的AI将垃圾木头变成木材 AI Builder和Power Automate革新文档摘要 Openai增强了AI语音助手以进行更好的聊天如何确保您的数据值得信赖AI集成 NotebookLM在全球范围内扩展，添加幻灯片并增强了事实检查对美国数据中心的调整可以解锁76 GW的新电源容量 Google利用AI暂停了超过3900万的广告帐户，以涉嫌欺诈

精选