选项
首页
新闻
Gemini Pro 2.5:强大的编码助手,对Chatgpt构成重大威胁

Gemini Pro 2.5:强大的编码助手,对Chatgpt构成重大威胁

2025-04-19
142

在评估AI用于编码辅助时,我开发了一套四个标准化测试。这些测试对于评估AI如何支持你的编程工作至关重要。毕竟,你最不需要的就是一个会在你的代码中增加更多错误的AI,对吧?

不久前,一位读者质疑我的方法,建议AI可能在面对不同挑战时表现更好。这是一个合理的观点,但我坚持使用这些测试,因为它们简单直接。我使用PHP和JavaScript,这些语言并非最难的,并通过AI运行一些脚本查询。这种一致性使我们能够直接比较性能。

测试包括编写一个简单的WordPress插件、重写一个字符串函数、寻找一个我曾经苦恼的错误,以及使用编程工具从Chrome提取数据。这就像教人开车——如果他们连车道都出不了,你不会让他们在高速公路上自由行驶。

到目前为止,只有ChatGPT的GPT-4(及以上)大语言模型通过了所有这些测试。有趣的是,Perplexity Pro也成功了,但那是因为它基于GPT-4系列大语言模型。另一方面,Microsoft Copilot尽管使用了相同的模型,却未能通过任何测试。

Google的Gemini表现也好不到哪里去。最初,Bard(Gemini的早期名称)在大多数测试中失败,甚至Gemini Advanced(每月20美元)去年也未能通过四项测试中的三项。

但现在,Google推出了Gemini Pro 2.5,它对所有人免费,但有使用限制。我在测试中仅用两个提示就达到了这些限制,这有点限制性。可能是因为任务的复杂性而非提示数量导致了限制。我的前两个请求是编写一个完整的WordPress插件和修复一些代码,这可能比简单查询更快地消耗了我的限制。

尽管需要等待,结果却令人惊讶且值得。

测试1:编写一个简单的WordPress插件

这一次,Gemini Pro 2.5表现出色。挑战是创建一个WordPress插件,提供一个用户界面来随机化输入行并分发重复项,使它们不相邻。

之前,Gemini Advanced没有创建后端仪表板,而是要求在公共页面的正文中使用短代码。它确实创建了一个基本的用户界面,但点击按钮没有任何反应。无论我如何调整提示,它仍然失败。

但Gemini Pro 2.5提供了一个扎实的用户界面,代码如预期般工作。真正让我印象深刻的是插件的图标选择。大多数AI忽略这个细节,但Gemini Pro 2.5未经我提示就从WordPress Dashicon集中选择了一个相关图标。代码文档齐全,每个主要部分都解释得很清楚。

randomizer-ui

截图由David Gewirtz/ZDNET提供

icon

截图由David Gewirtz/ZDNET提供

测试2:重写一个字符串函数

在第二个测试中,我要求Gemini Pro 2.5修改一些字符串处理代码,以处理美元和美分,而不仅仅是整数。ChatGPT做对了,而Bard在最初失败后最终成功。

上次,Gemini Advanced以一种微妙但危险的方式失败。它不允许非十进制输入,并错误地将数字限制在小数点前两位,误解了美元和美分的概念。这种错误如果不被发现,可能会导致大量错误报告。

然而,Gemini Pro 2.5完美应对。它正确检查了输入类型,修剪了空格,修复了正则表达式以处理前导零和小数输入,并拒绝了负数输入。代码注释完善,包含一整套测试示例。虽然它不允许分组逗号或前导货币符号,但这些是可控的错误,不是崩溃,所以我认为它通过了。

测试3:寻找一个错误

曾经,我在代码中遇到了一个本应工作但没有工作的错误。这个问题很棘手,当我专注于传递的参数数量时,ChatGPT指出我需要更改一个钩子。

Bard和Meta都没有找到问题,沿着我走过的无用路径。2024年2月,Gemini Advanced建议“可能在插件或WordPress的其他地方”,这毫无帮助。

使用Gemini Pro 2.5时,我在前两个测试后达到了使用限制,所以我不得不等到第二天。当我终于运行测试时,Gemini Pro 2.5不仅找到了错误,还清楚地告诉我修复的位置,并附上了一个有用的图表。

limit

截图由David Gewirtz/ZDNET提供

map

截图由David Gewirtz/ZDNET提供

测试4:编写一个脚本

最后一个测试涉及理解Chrome的内部对象模型、AppleScript和Keyboard Maestro,一个宏构建工具。任务是打开Chrome标签并根据参数设置活动标签。

大多数AI能很好地处理Chrome和AppleScript部分,但常常在Keyboard Maestro上遇到困难。然而,Gemini Pro 2.5做对了。它编写了正确传递变量的必要代码,添加了错误检查和用户通知,甚至提供了设置Keyboard Maestro的步骤。

maestro

截图由David Gewirtz/ZDNET提供

通过了所有四个测试,Gemini Pro 2.5加入了能够真正协助编程任务的AI工具精英群体。

Google的AI赶上OpenAI的产品只是时间问题。Google 2017年的“Attention is all you need”论文开启了生成式AI热潮,所以他们达到这一水平并不令人惊讶。Gemini Pro 2.5比ChatGPT Plus慢,响应时间在15秒到一分钟之间,但准确性比速度更重要。

Google还免费提供了Google Code Assist,限制较为宽松,但前提是生成的代码质量高。有了Gemini Pro 2.5,这种质量现在显而易见。虽然目前标记为“实验性”,我预计Google会很快完善它,可能提供一个限制较少的付费版本。

显然,Gemini Pro 2.5将在编码辅助领域挑战ChatGPT。我会密切关注这一发展,并很快分享更多更新。

相关文章
万事达卡的Agent Pay通过无缝交易增强AI搜索 万事达卡的Agent Pay通过无缝交易增强AI搜索 传统搜索平台和AI代理通常要求用户在找到产品或服务后切换窗口以完成购买。万事达卡通过将其支付网络嵌入AI平台,正在革新这一过程,实现同一生态系统内的顺畅交易。该公司推出了Agent Pay计划,将万事达卡的支付系统整合到AI聊天平台中。在接受VentureBeat采访时,万事达卡首席数据与AI官Greg Ulrich解释说,Agent Pay“完成了代理搜索的循环”。“我们的目标是通过在平台内实现
OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI承诺在ChatGPT过度顺从回应后进行修复 OpenAI计划修改其AI模型更新流程,以解决ChatGPT因更新导致的过度谄媚回应,引发了广泛的用户反馈。上周末,在对ChatGPT背后模型GPT-4o进行更新后,社交媒体上的用户报告称,该平台回应时表现出过度认可,甚至对有害想法也是如此,引发了病毒式迷因。截图显示ChatGPT支持了有争议的决定。周日,首席执行官Sam Altman在X上回应了这一问题,承诺立即采取行动。到周二,他宣布回滚GP
OpenAI发布高级AI推理模型,o3和o4-mini OpenAI发布高级AI推理模型,o3和o4-mini OpenAI周三推出o3和o4-mini,新AI模型设计为在回答前暂停并分析问题。OpenAI称o3是其迄今最先进的推理模型,在数学、编码、推理、科学和视觉理解测试中超越先前模型。同时,o4-mini平衡了成本、速度和性能,是开发者构建AI驱动应用的优选。与早期模型不同,o3和o4-mini利用ChatGPT工具,如网页浏览、Python代码执行、图像处理和图像生成。从今天起,这些模型及o4-mi
评论 (22)
0/200
JoseGonzalez
JoseGonzalez 2025-07-31 09:42:05

Just read about Gemini Pro 2.5 and wow, those coding tests sound intense! 😅 Curious if it’ll really outshine ChatGPT or just hype. Anyone tried it yet?

WalterLewis
WalterLewis 2025-07-28 09:19:30

This AI coding battle is heating up! Gemini Pro 2.5 sounds like a beast, but I’m curious if it’s really outpacing ChatGPT or just hype. 🤔 Anyone tried it on real projects yet?

ScottKing
ScottKing 2025-04-26 02:14:57

Gemini Pro 2.5は本当に強力!コーディングの助けにはChatGPTよりずっと優れてる。私のテストに通してみたら、完璧に合格したよ。唯一の欠点はちょっと高価なこと。でも、コーディングに本気なら、その価値はあるよ!💻

StevenGreen
StevenGreen 2025-04-25 11:28:01

Gemini Pro 2.5 es una bestia. Es mucho mejor que ChatGPT para ayudar en la programación. Lo probé con mis tests y aprobó con honores. El único problema es que es un poco caro. Pero si te tomas en serio la programación, vale cada centavo! 💻

AlbertWalker
AlbertWalker 2025-04-25 06:10:06

Gemini Pro 2.5 is a beast! It's way better than ChatGPT for coding help. I ran it through my tests and it passed with flying colors. Only downside? It's a bit pricey. But if you're serious about coding, it's worth every penny! 💻

WillGarcía
WillGarcía 2025-04-21 20:06:31

ジェミニプロ2.5、コーディングの強力な助っ人だね!でも、バグ増やすAIは勘弁😅 テスト結果が気になる!

返回顶部
OR