选项
首页
新闻
X的Grok在AI编码测试中超过了期望

X的Grok在AI编码测试中超过了期望

2025-04-17
132

X的Grok在AI编码测试中超过了期望

当X首次推出其聊天机器人时,它被隐藏在付费墙后。但正如俗话所说,没有免费的午餐(TANSTAAFL),直到最近X决定向所有人开放Grok。出于对其功能的好奇,我决定通过我的编程测试来检验它。

我一直对Grok有种特别的喜爱,这得益于它的名字,这个名字由我最喜欢的科幻作家之一罗伯特·海因莱因(Robert Heinlein)创造。海因莱因的作品在塑造我年轻时的思想方面发挥了重要作用。我的父母对我的媒体消费非常严格,但他们允许我在当地图书馆沉浸于科幻小说,假设凡是标有“科学”的东西都必须具有教育意义。

海因莱因的故事不仅有趣,还发人深省,挑战社会规范,将科学主题与社会评论交织在一起。“grok”这个词在《异乡异客》(*Stranger in a Strange Land*)中首次出现,体现了一种深刻的、基本的理解,因此非常适合作为AI聊天机器人的名字。

然而,有一个问题……

当我询问Grok使用的大型语言模型(LLM)时,它提到受到《银河系漫游指南》(*Hitchhiker's Guide to the Galaxy*)的机智和叛逆精神的启发。虽然《银河系漫游指南》确实有其魅力,但它实际上并未使用“grok”这个词。不过,我们还是继续来看编程测试吧。

1. 编写WordPress插件

这个测试要求AI展示PHP编程技能和WordPress插件开发的知识。这源于我妻子的一次现实需求,她需要一个工具为她的电子商务网站随机化每月参与设备的名称。难点在于,有些用户可能有多个条目,因此随机化工具需要确保这些名称不会被排列在一起。

代码还必须用户友好,让她可以简单地粘贴名称,点击按钮,然后获取列表。Grok以优异的表现通过了这个测试。界面简洁、功能完善,完全符合预期。

2. 重写字符串函数

第二个测试涉及修复用户报告的一个问题,该问题与验证美元和美分金额的函数有关。我的原始代码只接受整数,因此$5是有效的,但$5.25无效。Grok重写了正则表达式,接近成功。然而,它未能识别像.5这样的数字为有效货币,并且使用了效率较低的双重转换方法。所以,这个测试它失败了。

3. 寻找一个恼人的错误

这个测试要求理解WordPress框架和API,以定位一个微妙的错误。许多大型语言模型,包括我最初在内,都在这个问题上遇到了困难。但Grok完美地解决了它,提供了正确且实用的解决方案。这是三个测试中的第二个胜利。

4. 编写脚本

最后一个测试颇具挑战性,要求了解Keyboard Maestro这一小众Mac脚本工具,并能同时为多个环境编写代码:Keyboard Maestro、Chrome和AppleScript。此前只有Google Gemini和使用GPT-4或更高版本的ChatGPT通过了这个测试。然而,Grok也完美通过,取得了四个测试中的三个胜利。

最终想法

Grok在这些测试中表现得很出色。如果它能允许没有前导零的货币值,它的表现就完美了。尽管我对X自取代Twitter以来的变化有复杂的情感,但Grok已被证明是一个强大的聊天机器人,尤其是在编程技能方面。

你对Grok的看法如何?你试过它了吗?还有《异乡异客》或《银河系漫游指南》呢?在下面的评论中分享你的想法吧。再见,感谢所有的鱼!

相关文章
人工智能漫画工厂:利用人工智能技术轻松创作令人惊叹的漫画 人工智能漫画工厂:利用人工智能技术轻松创作令人惊叹的漫画 在我们的数字时代,人工智能正前所未有地改变着创意产业。人工智能漫画工厂(AI Comic Factory)站在这场革命的前沿,提供了一个直观的平台,任何人都可以在这个平台上制作引人入胜的视觉故事--无需任何艺术专长。这一基于网络的创新解决方案正在重塑教育工作者、营销人员和故事讲述者如何通过人工智能驱动的漫画生成来进行内容创作。我们的全面探索揭示了这一工具如何在保持创作自由的同时消除技术障碍,让所有
通过 Eleven Labs 掌握人工智能配音:逼真语音合成深度指南 通过 Eleven Labs 掌握人工智能配音:逼真语音合成深度指南 在内容驱动的当今世界,专业配音对于吸引现代受众至关重要。Eleven Labs 不需要昂贵的录音设备或专业人才,就能提供录音棚品质的人工智能语音,从而打破了障碍。本指南将探讨这一开创性平台如何生成超逼真的语音,实现自定义语音创作,并为不同经验水平的创作者改变音频制作工作流程。主要优势Eleven Labs 提供无与伦比的人工智能语音生成功能和电影级的输出质量丰富的多语言语音库,提供多种不同的音调、
Mistral 推出两款新的人工智能推理模型,增强认知能力 Mistral 推出两款新的人工智能推理模型,增强认知能力 法国人工智能巨头 Mistral 凭借其全新的 Magistral 系列进入推理模型领域,在解决复杂问题的人工智能领域向 OpenAI 和谷歌等老牌公司发起挑战。扩展 Mistral 的人工智能能力本周二,Mistral 推出了首款推理人工智能模型 Magistral Small 和 Magistral Medium。这些模型有条不紊地处理复杂问题,类似于 OpenAI 的 o3 和谷歌的
评论 (23)
0/200
SamuelEvans
SamuelEvans 2025-08-27 23:01:28

Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?

JosephScott
JosephScott 2025-08-23 09:01:25

Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎

EdwardJackson
EdwardJackson 2025-07-28 09:20:21

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee
WalterLee 2025-04-20 19:43:55

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing
JonathanKing 2025-04-20 18:14:26

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark
BruceClark 2025-04-19 19:37:49

Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀

返回顶部
OR