X的Grok在AI編碼測試中超過了期望

當X首次推出其聊天機器人時,它被藏在付費牆後。然而,正如俗語所說,天下沒有免費的午餐(TANSTAAFL),直到最近X決定向所有人開放Grok。出於對其功能的好奇,我決定讓它接受我的程式設計測試。
我一直對Grok有種特別的喜愛,這要歸功於它的名字,這個名字是由我最喜歡的科幻作家之一羅伯特·海萊因(Robert Heinlein)創造的。海萊因的作品在塑造我年輕的心智方面發揮了重要作用。我的父母對我接觸的媒體相當嚴格,但他們允許我在當地圖書館潛心閱讀科幻小說,認為任何標有「科學」的東西必定具有教育意義。
海萊因的故事不僅僅是娛樂;它們發人深省,挑戰社會規範,並將科學主題與社會評論交織在一起。在《異鄉異客》(*Stranger in a Strange Land*)中引入的「grok」一詞,體現了深刻的、根本的理解,使其成為AI聊天機器人的恰當名稱。
然而,有一個問題...
當我詢問Grok使用的大型語言模型(LLM)時,它提到受到《銀河系漫遊指南》(*Hitchhiker's Guide to the Galaxy*)的機智與叛逆精神的啟發。雖然《銀河系漫遊指南》確實有其魅力,但它實際上並未使用「grok」一詞。不過,讓我們繼續進行程式設計測試。
1. 撰寫WordPress外掛
這項測試要求AI展示PHP程式設計技能以及WordPress外掛開發的知識。這源於我妻子的一個現實需求,她需要一個工具為她的電子商務網站的每月參與設備隨機排列名稱。特別之處在於,某些用戶可能有多個條目,因此隨機器需要確保這些名稱不會被排列在一起。
程式碼還必須使用戶友好,讓她能簡單地貼上名稱,點擊按鈕,然後獲得她的清單。Grok以優異的表現通過了這項測試。介面乾淨、功能完善,完美地完成了任務。
2. 重寫字串函數
第二項測試涉及修復一個用戶報告的問題,該問題與一個用於驗證美元和美分金額的函數有關。我的原始程式碼只接受整數,因此$5是有效的,但$5.25無效。Grok重寫了正則表達式,接近成功。然而,它未能識別像.5這樣的數字為有效貨幣,且使用了效率低下的雙重轉換方法。因此,這項測試失敗了。
3. 尋找一個惱人的錯誤
這項測試需要理解WordPress框架和API,以找出一個微妙的錯誤。許多大型語言模型,包括我最初在內,都對此感到困難。但Grok成功解決了問題,提供了正確且實用的解決方案。三項測試中贏得了兩項。
4. 撰寫腳本
最後一項測試頗具挑戰性,要求了解Keyboard Maestro這款小眾Mac腳本工具,並能同時為多個環境編寫程式碼:Keyboard Maestro、Chrome和AppleScript。此前只有Google Gemini和搭載GPT-4或更高版本的ChatGPT通過了這項測試。然而,Grok輕鬆過關,四項測試中贏得了三項。
最終想法
Grok在這些測試中表現出色。如果它能允許不帶前導零的貨幣值,那將是完美的。儘管我對X取代Twitter後的變化有著複雜的感受,Grok已證明自己是一個強大的聊天機器人,特別是在程式設計技能方面。
你對Grok的看法如何?你試過它了嗎?還有《異鄉異客》或《銀河系漫遊指南》呢?在下面的評論中分享你的想法。再見,感謝所有的魚!
相關文章
AI 和川普在全球反彈中引發加沙爭議
數位時代為分辨真實內容與合成媒體帶來了新的挑戰,尤其是在政治與全球事務方面。前美國總統川普的社交平台上出現了一段有爭議的人工智能產生的視頻,將加沙描繪成田園度假勝地,引發了國際辯論,顯示了新興技術、政治溝通和全球外交之間的複雜關係。重點具爭議性的 AI 視訊:川普社交媒體上對加沙的奢華度假勝地描述。全球批評:聯合國官員與人權組織表示憤怒。操控指控:影片被指歪曲加沙的現實狀況。地緣政治反響:對中東穩
AI 賦予 D&D:改變您的桌面 RPG 體驗
人工智慧已經從科幻小說轉變成桌上型 RPG 遊戲愛好者的強大盟友,重塑我們如何處理像 Dungeons & Dragons 之類的經典遊戲。這些尖端的工具正在徹底改變遊戲的準備方式,在減少繁瑣工作量的同時,也為故事的敘述注入了新的創意。無論您是要塑造身歷其境的角色背景或是建構充滿活力的世界,AI 對於尋求提升遊戲體驗的地下城主與玩家來說,既是繆斯也是助手。加入我們,一起探索這些技術進步如何改變您的
探索 ElevenLabs:人工智能驅動語音合成技術的未來
ElevenLabs 透過尖端的 AI 語音合成技術,提供前所未有的自然合成語音,重新定義數位音訊體驗。由於這項技術重塑了各種依賴語音的產業,因此了解其卓越的功能和重要的注意事項至關重要。本指南全面探討 ElevenLabs 的突破性技術、其實際應用、道德層面以及轉型潛力。重點領先業界的 AI 語音合成技術,提供自然、具表現力的語音先進的深度學習架構提供逼真的語音輸出從有聲讀物製作到虛擬助理的多樣
評論 (23)
0/200
SamuelEvans
2025-08-27 23:01:28
Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?
0
JosephScott
2025-08-23 09:01:25
Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎
0
EdwardJackson
2025-07-28 09:20:21
Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?
0
WalterLee
2025-04-20 19:43:55
ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀
0
JonathanKing
2025-04-20 18:14:26
¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀
0
BruceClark
2025-04-19 19:37:49
Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀
0
當X首次推出其聊天機器人時,它被藏在付費牆後。然而,正如俗語所說,天下沒有免費的午餐(TANSTAAFL),直到最近X決定向所有人開放Grok。出於對其功能的好奇,我決定讓它接受我的程式設計測試。
我一直對Grok有種特別的喜愛,這要歸功於它的名字,這個名字是由我最喜歡的科幻作家之一羅伯特·海萊因(Robert Heinlein)創造的。海萊因的作品在塑造我年輕的心智方面發揮了重要作用。我的父母對我接觸的媒體相當嚴格,但他們允許我在當地圖書館潛心閱讀科幻小說,認為任何標有「科學」的東西必定具有教育意義。
海萊因的故事不僅僅是娛樂;它們發人深省,挑戰社會規範,並將科學主題與社會評論交織在一起。在《異鄉異客》(*Stranger in a Strange Land*)中引入的「grok」一詞,體現了深刻的、根本的理解,使其成為AI聊天機器人的恰當名稱。
然而,有一個問題...
當我詢問Grok使用的大型語言模型(LLM)時,它提到受到《銀河系漫遊指南》(*Hitchhiker's Guide to the Galaxy*)的機智與叛逆精神的啟發。雖然《銀河系漫遊指南》確實有其魅力,但它實際上並未使用「grok」一詞。不過,讓我們繼續進行程式設計測試。
1. 撰寫WordPress外掛
這項測試要求AI展示PHP程式設計技能以及WordPress外掛開發的知識。這源於我妻子的一個現實需求,她需要一個工具為她的電子商務網站的每月參與設備隨機排列名稱。特別之處在於,某些用戶可能有多個條目,因此隨機器需要確保這些名稱不會被排列在一起。
程式碼還必須使用戶友好,讓她能簡單地貼上名稱,點擊按鈕,然後獲得她的清單。Grok以優異的表現通過了這項測試。介面乾淨、功能完善,完美地完成了任務。
2. 重寫字串函數
第二項測試涉及修復一個用戶報告的問題,該問題與一個用於驗證美元和美分金額的函數有關。我的原始程式碼只接受整數,因此$5是有效的,但$5.25無效。Grok重寫了正則表達式,接近成功。然而,它未能識別像.5這樣的數字為有效貨幣,且使用了效率低下的雙重轉換方法。因此,這項測試失敗了。
3. 尋找一個惱人的錯誤
這項測試需要理解WordPress框架和API,以找出一個微妙的錯誤。許多大型語言模型,包括我最初在內,都對此感到困難。但Grok成功解決了問題,提供了正確且實用的解決方案。三項測試中贏得了兩項。
4. 撰寫腳本
最後一項測試頗具挑戰性,要求了解Keyboard Maestro這款小眾Mac腳本工具,並能同時為多個環境編寫程式碼:Keyboard Maestro、Chrome和AppleScript。此前只有Google Gemini和搭載GPT-4或更高版本的ChatGPT通過了這項測試。然而,Grok輕鬆過關,四項測試中贏得了三項。
最終想法
Grok在這些測試中表現出色。如果它能允許不帶前導零的貨幣值,那將是完美的。儘管我對X取代Twitter後的變化有著複雜的感受,Grok已證明自己是一個強大的聊天機器人,特別是在程式設計技能方面。
你對Grok的看法如何?你試過它了嗎?還有《異鄉異客》或《銀河系漫遊指南》呢?在下面的評論中分享你的想法。再見,感謝所有的魚!




Grok's coding skills blew me away! 😮 I threw some tricky Python problems at it, and it nailed them faster than my old CS prof. Makes me wonder if AI like this will soon be pair-programming with us at work. What's next, Grok writing my entire app?




Wow, Grok's coding skills are seriously impressive! I tossed some tricky Python problems at it, and it nailed them faster than my old professor could grade papers. Makes me wonder if it'll start writing my apps for me soon! 😎




Grok's coding skills blew me away! 😮 I tossed some tricky Python problems at it, and it nailed them faster than my old prof could grade papers. X opening it up for free feels like a game-changer—wonder how long it'll stay this good before they slap a paywall back on?




ग्रॉक की कोडिंग क्षमता अद्भुत है! ऐसा लगता है जैसे मेरे पास एक सुपर स्मार्ट दोस्त है जो इंसानों से बेहतर कोड करता है। मैंने अपने टेस्ट से इसे चेक किया और यह सभी में पास हो गया, बिना किसी परेशानी के! बस काश यह कभी-कभी जल्दी जवाब देता। फिर भी, किसी भी कोडर के लिए जरूरी है! 🚀




¡Las habilidades de codificación de Grok son increíbles! Es como tener un amigo superinteligente que programa mejor que la mayoría de las personas. Lo probé con mis tests y pasó todos sin problemas. Solo desearía que respondiera más rápido a veces. Aún así, esencial para cualquier programador! 🚀




Grokのコード能力は驚異的です!まるで人間のコードを超える友達がいるようです。自分のテストで試してみたら、全て完璧にこなしました。ただ、返事がもう少し早ければいいのに。でも、コーダーには必須のアプリですね!🚀












