XのGrokは、AIコーディングテストでの期待を上回ります

家

ニュース

2025年4月17日

JamesLopez

132

XのGrokは、AIコーディングテストでの期待を上回ります

Xが最初にチャットボットをリリースしたとき、それは有料の壁の裏に隠されていました。しかし、ことわざにあるように、「タダで昼食は食べられない（TANSTAAFL）」という状況でしたが、最近、XがGrokを全員に開放することを決定するまではそうでした。その能力に興味を持った私は、プログラミングテストを通じてそれ試してみることにしました。

私はGrokにいつも特別な愛着を持っていました。その名前のおかげです。この名前は、私が最も好きなSF作家の一人、ロバート・ハインラインによって作られました。ハインラインの作品は、私の若い心を形成する上で大きな役割を果たしました。メディアの消費に対してかなり厳格だった私の両親は、地元の図書館でSFを読むことを許してくれました。「科学」とラベル付けされたものは教育的なものに違いないという前提のもとで。

ハインラインの物語は単に面白かっただけでなく、考えさせられるもので、社会規範に挑戦し、科学的テーマと社会的解説を織り交ぜていました。『異邦人』で紹介された「grok」という言葉は、深い基本的な理解を体現しており、AIチャットボットの名前にふさわしいものです。

しかし、ここに落とし穴があります...

Grokが使用している大規模言語モデル（LLM）について尋ねたところ、*銀河ヒッチハイク・ガイド*の機知と反抗心にインスパイアされていると述べました。*ヒッチハイク*には確かに魅力がありますが、実際には「grok」という言葉は使われていません。それでは、プログラミングテストに移りましょう。

1. WordPressプラグインの作成

このテストでは、AIにPHPプログラミングスキルとWordPressプラグイン開発の知識を示すことが求められました。これは私の妻からの実際の依頼に由来しており、彼女のeコマースサイトの月次関与デバイス用に名前をランダム化するツールが必要でした。ひねりは、一部のユーザーが複数エントリーを持つ可能性があるため、ランダマイザーはこれらの名前が隣り合わないようにする必要がありました。

コードはユーザーにとって使いやすく、名前を貼り付けてボタンをクリックするだけでリストを取得できるようにする必要がありました。Grokはこのテストを見事に通過しました。インターフェースはクリーンで機能的で、求められた通りの動作をしました。

2. 文字列関数の書き換え

2番目のテストは、ドルとセントの金額を検証する関数に関するユーザー報告の問題を修正することでした。私の元のコードは整数のみを受け入れていたため、$5は有効でしたが、$5.25は無効でした。Grokは正規表現を書き換え、勝利に近づきました。しかし、.5のような数字を有効な通貨として認識できず、2重変換による非効率な方法を使用していました。よって、このテストでは負けです。

3. 厄介なバグの発見

このテストでは、WordPressフレームワークとAPIを理解して微妙なバグを特定する必要がありました。多くのLLM、最初は私自身も含めて、これに苦労しました。しかし、Grokはこれを正確かつ有用な解決策を提供し、見事に成功しました。3つのテストのうち2勝です。

4. スクリプトの作成

最後のテストは難易度が高く、ニッチなMacスクリプトツールであるKeyboard Maestroの知識と、Keyboard Maestro、Chrome、AppleScriptの複数の環境で同時にコードを書く能力が必要でした。これまでこのテストを通過したのは、Google GeminiとGPT-4以上のChatGPTだけでした。しかし、Grokはこれを見事にクリアし、4つのテストのうち3勝を確保しました。

最終的な感想

Grokはこれらのテストでよく持ちこたえました。先行ゼロなしの通貨値を受け入れていれば完璧だったでしょう。XがTwitterを置き換えてからの変化に対して複雑な気持ちを持っていますが、Grokは特にプログラミングスキルにおいて堅牢なチャットボットであることが証明されました。

Grokについてどう思いますか？試してみましたか？また、『異邦人』や*銀河ヒッチハイク・ガイド*についてはどうですか？以下のコメントであなたの考えを共有してください。それでは、また会いましょう、そしてすべての魚に感謝！

Polyを使ったAIテクスチャ生成でデザインに革命を起こす急速に進歩するデジタルデザインの世界では、AIを搭載したツールが、プロフェッショナルのビジュアルアセットの作成方法や操作方法を再構築しています。このディープダイブでは、人工知能を使用してシームレスでタイル状のテクスチャを生成する最先端のプラットフォーム、Polyを検証します。基本的な操作から専門的なアプリケーションまで、ゲーム、建築、プロダクトデザインなどの業界において、このテクノロジーがどのよう

SAG-AFTRAのAIボイス契約：倫理的なAIの進歩か、それとも一時的な修正か？全米映画俳優組合（SAG-AFTRA）は、レプリカ・スタジオと先駆的なAI音声契約を締結し、俳優がビデオゲームやその他のメディア向けにデジタル音声レプリカを作成し、ライセンス供与することを可能にした。これは、倫理的なAIの実践と俳優の公正な報酬に向けた前進ではあるが、長期的な業界への影響については懸念が残る。本記事では、この合意の詳細と、エンターテインメントの専門家に対するより広範な影響について考

AnthropicのAIアップグレード：クロードがグーグルのワークスペース全体を瞬時に検索するようになった Anthropicの本日のメジャーアップグレードは、ClaudeをAIアシスタントから同社が「真のバーチャルコラボレーター」と呼ぶものへと変貌させ、画期的な自律的研究機能とシームレスなGoogle Workspace統合を導入しました。これらの進化により、クロードはますます混雑する企業向けAI生産性分野において、OpenAIやマイクロソフトに対抗する強力な競争相手となる。新しいリサーチ大国自律的な

コメント (23)

0/200

提出する

SamuelEvans

2025年8月28日 0:01:28 JST

Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?

JosephScott

2025年8月23日 10:01:25 JST

Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎

EdwardJackson

2025年7月28日 10:20:21 JST

Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?

WalterLee

2025年4月20日 20:43:55 JST

ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀

JonathanKing

2025年4月20日 19:14:26 JST

¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀

BruceClark

2025年4月19日 20:37:49 JST

Grokのコード能力は驚異的です！まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね！🚀

トップニュース

Gemini 2.5 ProはClaudeよりも無制限で安価で、GPT-4O 2025年トップAIビデオジェネレーター：Pika Labs vs 代替案 AIボイスオーバー：リアルな声制作究極ガイドカンビウムのAIは、廃棄物を木材に変換します Openaiは、より良いチャットのためにAIの音声アシスタントを強化します AI統合のためにデータが信頼できることを確認する方法 Notebooklmはグローバルに拡張し、スライドを追加し、ファクトチェックを強化します米国のデータセンターへの微調整は、76 GWの新しい電源容量のロックを解除できます GoogleはAIを利用して、詐欺の疑いのために3900万を超える広告アカウントを一時停止します AIボイスクローン：音声変換を極めるための完全ガイド

もっと

特集