選項
首頁
新聞
Meta AI在編碼測試中未能與Llama,Gemini和Chatgpt競爭

Meta AI在編碼測試中未能與Llama,Gemini和Chatgpt競爭

2025-06-03
83

AI工具如何撰寫程式碼?

過去一年左右,我測試了多個大型語言模型,檢視它們處理基本程式設計挑戰的成效。測試的理念很簡單:如果它們無法應對基礎挑戰,則不太可能在更複雜的任務中有所幫助。但如果它們在這些基礎挑戰中表現出色,則可能成為開發者節省時間的寶貴盟友。

為了建立基準,我使用了四項不同的測試。這些測試從簡單的程式設計任務到需要深入了解WordPress等框架的除錯練習。讓我們深入探討每個測試,並比較Meta的新AI工具與其他工具的表現。

測試1:撰寫WordPress插件

創建WordPress插件涉及在WordPress生態系統中使用PHP進行網頁開發,還需要一些UI設計。如果AI聊天機器人能做到這一點,它可能成為網頁開發者的得力助手。

結果:

  • Meta AI:介面尚可,但功能失敗。
  • Meta Code Llama:完全失敗。
  • Google Gemini Advanced:介面良好,功能失敗。
  • ChatGPT:介面乾淨且功能正常。

以下是視覺比較: UI測試(注意:請將"/path-to-image/"替換為圖像檔案的實際路徑。)

ChatGPT提供了更整潔的介面,並將「隨機化」按鈕放置得更合理。然而,在實際運行插件時,Meta AI崩潰,出現了可怕的「白屏死機」。

測試2:重寫字串函數

此測試評估AI改進實用函數的能力。成功表示對開發者有潛在幫助,失敗則意味著有改進空間。

結果:

  • Meta AI:因錯誤值修正、多位小數處理不佳及格式問題而失敗。
  • Meta Code Llama:成功。
  • Google Gemini Advanced:失敗。
  • ChatGPT:成功。

雖然Meta AI在這個看似簡單的任務上失誤,但Meta Code Llama表現出色,展示了其能力。ChatGPT也表現優異。

測試3:尋找惱人錯誤

這不是關於撰寫程式碼,而是診斷問題。成功需要深入了解WordPress API以及程式碼不同部分之間的交互。

結果:

  • Meta AI:表現出色,識別問題並提出提升效率的建議。
  • Meta Code Llama:失敗。
  • Google Gemini Advanced:失敗。
  • ChatGPT:通過。

令人意外的是,儘管Meta AI之前表現不佳,但在此表現卓越,證明了其潛力,但也凸顯了其回應的不一致性。

測試4:撰寫腳本

此測試評估對Keyboard Maestro和AppleScript等專業工具的知識。這兩個工具相對小眾,但代表了更廣泛的程式設計技能。

結果:

  • Meta AI:無法從Keyboard Maestro檢索資料。
  • Meta Code Llama:同樣失敗。
  • Google Gemini Advanced:成功。
  • ChatGPT:成功。

Gemini和ChatGPT展現了對這些工具的熟練掌握,而Meta的產品則表現不足。

總體結果

模型成功率
Meta AI1/4
Meta Code Llama1/4
Google Gemini1/4
ChatGPT4/4

根據我六個月使用ChatGPT進行程式設計項目的經驗,我對其可靠性仍充滿信心。其他模型尚未能匹敵其一致性和有效性。雖然Meta AI偶有亮眼表現,但整體表現仍有很大改進空間。

你有沒有試過這些工具?請在下方評論中分享你的想法!

相關文章
AI驅動的音樂創作:輕鬆打造歌曲與影片 AI驅動的音樂創作:輕鬆打造歌曲與影片 音樂創作可能複雜,需耗費時間、資源與專業知識。人工智慧已改變此過程,使其簡單且易於上手。本指南介紹如何利用AI讓任何人免費創作獨特的歌曲與視覺效果,開啟新的創意可能性。我們探索具有直觀介面與先進AI的平台,將您的音樂創意轉化為現實,且無需高昂成本。重點AI可生成完整歌曲,包括人聲,不僅限於器樂。Suno AI與Hailuo AI等平台提供免費音樂創作工具。ChatGPT等AI工具簡化歌詞創作,加速
創建AI驅動的著色書:全面指南 創建AI驅動的著色書:全面指南 設計著色書是一項有益的追求,結合藝術表達與為使用者提供平靜的體驗。然而,此過程可能相當勞力密集。幸運的是,AI工具能輕鬆簡化高品質、一致的著色頁創建。本指南提供使用AI製作著色書的逐步方法,專注於保持一致風格和最佳效率的技術。關鍵要點使用AI提示工具開發詳細、結構化的著色頁提示。確保著色書中所有頁面的藝術風格一致。生成單一著色頁設計的多樣變化。利用Ideogram等AI平台快速高效創建著色書。精煉
Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo與Google Cloud合作為開發者提供免費AI程式碼審查工具 Qodo,一家專注於程式碼品質的以色列AI編碼新創公司,與Google Cloud合作推出夥伴關係,以提升AI生成軟體的完整性。隨著企業越來越依賴AI進行編碼,對強大監督和品質保證工具的需求日益增長。Qodo執行長Itamar Friedman指出,AI生成程式碼現已成為現代開發的核心。「想像一個未來,AI撰寫所有程式碼;人類無法全部審查,」Friedman說。「我們需要系統確保程式碼符合預期價值
評論 (4)
0/200
ChristopherTaylor
ChristopherTaylor 2025-08-12 23:00:59

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris
PaulHarris 2025-08-01 21:47:34

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez
MarkGonzalez 2025-07-28 09:20:02

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts
TerryRoberts 2025-07-22 09:25:03

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

回到頂部
OR