X的Grok在AI编码测试中超过了期望

首页

新闻

X的Grok在AI编码测试中超过了期望

2025-04-17

JamesLopez

194

X的Grok在AI编码测试中超过了期望

当X首次推出其聊天机器人时，它被隐藏在付费墙后。但正如俗话所说，没有免费的午餐（TANSTAAFL），直到最近X决定向所有人开放Grok。出于对其功能的好奇，我决定通过我的编程测试来检验它。

我一直对Grok有种特别的喜爱，这得益于它的名字，这个名字由我最喜欢的科幻作家之一罗伯特·海因莱因（Robert Heinlein）创造。海因莱因的作品在塑造我年轻时的思想方面发挥了重要作用。我的父母对我的媒体消费非常严格，但他们允许我在当地图书馆沉浸于科幻小说，假设凡是标有“科学”的东西都必须具有教育意义。

海因莱因的故事不仅有趣，还发人深省，挑战社会规范，将科学主题与社会评论交织在一起。“grok”这个词在《异乡异客》（*Stranger in a Strange Land*）中首次出现，体现了一种深刻的、基本的理解，因此非常适合作为AI聊天机器人的名字。

然而，有一个问题……

当我询问Grok使用的大型语言模型（LLM）时，它提到受到《银河系漫游指南》（*Hitchhiker's Guide to the Galaxy*）的机智和叛逆精神的启发。虽然《银河系漫游指南》确实有其魅力，但它实际上并未使用“grok”这个词。不过，我们还是继续来看编程测试吧。

1. 编写WordPress插件

这个测试要求AI展示PHP编程技能和WordPress插件开发的知识。这源于我妻子的一次现实需求，她需要一个工具为她的电子商务网站随机化每月参与设备的名称。难点在于，有些用户可能有多个条目，因此随机化工具需要确保这些名称不会被排列在一起。

代码还必须用户友好，让她可以简单地粘贴名称，点击按钮，然后获取列表。Grok以优异的表现通过了这个测试。界面简洁、功能完善，完全符合预期。

2. 重写字符串函数

第二个测试涉及修复用户报告的一个问题，该问题与验证美元和美分金额的函数有关。我的原始代码只接受整数，因此$5是有效的，但$5.25无效。Grok重写了正则表达式，接近成功。然而，它未能识别像.5这样的数字为有效货币，并且使用了效率较低的双重转换方法。所以，这个测试它失败了。

3. 寻找一个恼人的错误

这个测试要求理解WordPress框架和API，以定位一个微妙的错误。许多大型语言模型，包括我最初在内，都在这个问题上遇到了困难。但Grok完美地解决了它，提供了正确且实用的解决方案。这是三个测试中的第二个胜利。

4. 编写脚本

最后一个测试颇具挑战性，要求了解Keyboard Maestro这一小众Mac脚本工具，并能同时为多个环境编写代码：Keyboard Maestro、Chrome和AppleScript。此前只有Google Gemini和使用GPT-4或更高版本的ChatGPT通过了这个测试。然而，Grok也完美通过，取得了四个测试中的三个胜利。

最终想法

Grok在这些测试中表现得很出色。如果它能允许没有前导零的货币值，它的表现就完美了。尽管我对X自取代Twitter以来的变化有复杂的情感，但Grok已被证明是一个强大的聊天机器人，尤其是在编程技能方面。

你对Grok的看法如何？你试过它了吗？还有《异乡异客》或《银河系漫游指南》呢？在下面的评论中分享你的想法吧。再见，感谢所有的鱼！

中国电信投资面壁智能，为大型语言模型及数据基础设施筹集71.3万元资金在大模型领域，这支“国家队”与来自清华大学的领军人物正在深化战略合作。据企查查最新企业注册数据显示，2026年3月1日，北京面壁智能科技有限公司进行了重大股权重组，正式引入了电信巨头和行业基金的投资。这一转变不仅关乎资金注入——更预示着国内大模型在公共数据平台及智能硬件领域的商业化进程将大幅提速。核心亮点：电信巨头与本土基金的双重背书此次股权变更后，面壁智能的股东结构迎来了数家重要新成员：中国电信

陶天集团加速推进AI原生转型，向实习生发放免费代币配额陶天集团近期推出了“AI生产力计划”，旨在通过资源配置和工具补贴，加速将AI技术融入电商运营及研发工作流程。该计划现已向所有实习生开放，使其在实习期间享有与正式员工同等的AI权限、计算配额及审批流程。自3月17日起，淘天集团员工已获授权免费使用多款付费AI工具，包括悟空和Qoder系列。这些工具支持从基础技术研发到日常办公效率提升等广泛应用场景。通过直接提供Token配额，公司降低了使用大型语言

Glean瞄准企业级AI基础设施市场，展开抢占先机之战争夺企业人工智能主导权的竞争正在加速。微软正将 Copilot 嵌入 Office，谷歌则将 Gemini 整合到 Workspace 中，而 OpenAI 和 Anthropic 都在直接向企业销售产品。与此同时，如今几乎每家 SaaS 供应商都配备了人工智能助手。在各方争相掌控用户界面的热潮中，Glean却采取了一种更低调的策略：成为底层的智能架构。七年前，Glean以“职场版谷歌”的定位起家

相关专题推荐

写作

最佳AI仙侠与武侠助手：创作史诗般的修仙历程与武打场面

探索2026年最优秀的AI助手，助您创作史诗级的仙侠与武侠故事。XIX.AI精心整理的这份清单汇集了广受好评、能彻底改变创作格局的工具，助您驾驭修仙进阶与武术动作设计。通过实际测试对比免费与付费选项。释放您的创作潜能，今天就开始写作吧！

10 个工具

xix.ai

代码

AI移动应用开发工具：根据提示生成跨平台的Flutter与React Native代码

探索2026年最适合Flutter和React Native的最佳AI移动应用开发工具。我们精心挑选的这些高评分工具能够提供强大的功能，帮助您根据提示生成跨平台代码。通过实际测试来对比免费选项和付费选项，让开发更加高效，从而打造出更出色的应用程序。现在就访问XIX.AI查看排名吧！

10 个工具

xix.ai

代码

最佳 AI Chrome 扩展程序生成工具：无需编程经验即可创建自定义浏览器插件

在 XIX.AI 上探索 2026 年最佳 AI Chrome 扩展程序生成器。我们精心挑选的这份清单汇集了广受好评、不容错过的工具，让您无需编写代码即可创建自定义浏览器插件。对比免费与付费选项，查看实际测试结果，并释放您的工作效率。立即查看最新排行榜，找到最适合您的工具！

10 个工具

xix.ai

文字转语音

最佳人工智能多语言文本转语音技术：能够生成50多种语言的逼真原声发音

探索2026年最优秀的人工智能多语言文本转语音工具，这些工具能够生成50多种语言中具有真实母语口音的语音。查看我们精心挑选的排名榜单，了解免费版本与付费版本的差异，并通过实际测试来验证它们的效果。在XIX.AI上找到最适合你的语音工具，立即开启全球交流的新篇章吧。

10 个工具

xix.ai

会议助理

最适合提升协作效率的最佳人工智能会议自动化工具

探索2026年最新评选出的顶级AI会议自动化工具，让协作变得更智能、更高效。我们精心挑选的这些工具能够有效实现笔记、总结和待办事项的自动化处理。通过实际测试和每周更新的排名，您可以了解免费选项与付费选项的差异。立即访问XIX.AI，发现最适合您需求的工具，提升团队生产力吧。

10 个工具

xix.ai

提示词

适用于基础设施即代码的 AI 提示：安全部署 Terraform 和 Docker 配置

探索 2026 年最新、评价最高的“基础设施即代码”（Infrastructure-as-Code）AI 提示词。XIX.AI 精心挑选的提示词集可助您安全部署 Terraform 和 Docker 配置、自动化云环境搭建，并提升 DevOps 工作效率。通过实际测试对比免费与付费选项。立即探索，释放您的 AI 优势。

10 个工具

xix.ai

0/500

请登录后再操作

SamuelEvans

2025-08-27 23:01:28

Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?

JosephScott

2025-08-23 09:01:25

Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎

EdwardJackson

2025-07-28 09:20:21

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee

2025-04-20 19:43:55

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing

2025-04-20 18:14:26

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark

2025-04-19 19:37:49

Grokのコード能力は驚異的です！まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね！🚀

头条新闻

AI Builder和Power Automate革新文档摘要 AI寄主Notebooklm播客现已上中国发布人形机器人及具身智能国家标准 Bing图像创建者教程：AI艺术生成指南 Ramp 数据显示企业人工智能应用趋于平稳学习使用您的声音创建AI音乐：逐步Suno教程 iMyFone MagicMic：实时AI变声器评测与教程 2025顶级AI视频生成器：Pika Labs与其他对比 DeepSeek V4 作为多模态人工智能变革者横空出世 AI音乐翻唱：打造独特歌曲的终极指南

精选