Meta AI在編碼測試中未能與Llama，Gemini和Chatgpt競爭

首頁

新聞

2025-06-03

GeorgeNelson

AI工具如何撰寫程式碼？

過去一年左右，我測試了多個大型語言模型，檢視它們處理基本程式設計挑戰的成效。測試的理念很簡單：如果它們無法應對基礎挑戰，則不太可能在更複雜的任務中有所幫助。但如果它們在這些基礎挑戰中表現出色，則可能成為開發者節省時間的寶貴盟友。

為了建立基準，我使用了四項不同的測試。這些測試從簡單的程式設計任務到需要深入了解WordPress等框架的除錯練習。讓我們深入探討每個測試，並比較Meta的新AI工具與其他工具的表現。

測試1：撰寫WordPress插件

創建WordPress插件涉及在WordPress生態系統中使用PHP進行網頁開發，還需要一些UI設計。如果AI聊天機器人能做到這一點，它可能成為網頁開發者的得力助手。

結果：

Meta AI：介面尚可，但功能失敗。
Meta Code Llama：完全失敗。
Google Gemini Advanced：介面良好，功能失敗。
ChatGPT：介面乾淨且功能正常。

以下是視覺比較： UI測試 (注意：請將"/path-to-image/"替換為圖像檔案的實際路徑。)

ChatGPT提供了更整潔的介面，並將「隨機化」按鈕放置得更合理。然而，在實際運行插件時，Meta AI崩潰，出現了可怕的「白屏死機」。

測試2：重寫字串函數

此測試評估AI改進實用函數的能力。成功表示對開發者有潛在幫助，失敗則意味著有改進空間。

結果：

Meta AI：因錯誤值修正、多位小數處理不佳及格式問題而失敗。
Meta Code Llama：成功。
Google Gemini Advanced：失敗。
ChatGPT：成功。

雖然Meta AI在這個看似簡單的任務上失誤，但Meta Code Llama表現出色，展示了其能力。ChatGPT也表現優異。

測試3：尋找惱人錯誤

這不是關於撰寫程式碼，而是診斷問題。成功需要深入了解WordPress API以及程式碼不同部分之間的交互。

結果：

Meta AI：表現出色，識別問題並提出提升效率的建議。
Meta Code Llama：失敗。
Google Gemini Advanced：失敗。
ChatGPT：通過。

令人意外的是，儘管Meta AI之前表現不佳，但在此表現卓越，證明了其潛力，但也凸顯了其回應的不一致性。

測試4：撰寫腳本

此測試評估對Keyboard Maestro和AppleScript等專業工具的知識。這兩個工具相對小眾，但代表了更廣泛的程式設計技能。

結果：

Meta AI：無法從Keyboard Maestro檢索資料。
Meta Code Llama：同樣失敗。
Google Gemini Advanced：成功。
ChatGPT：成功。

Gemini和ChatGPT展現了對這些工具的熟練掌握，而Meta的產品則表現不足。

總體結果

模型	成功率
Meta AI	1/4
Meta Code Llama	1/4
Google Gemini	1/4
ChatGPT	4/4

根據我六個月使用ChatGPT進行程式設計項目的經驗，我對其可靠性仍充滿信心。其他模型尚未能匹敵其一致性和有效性。雖然Meta AI偶有亮眼表現，但整體表現仍有很大改進空間。

你有沒有試過這些工具？請在下方評論中分享你的想法！

Master Emerald Kaizo Nuzlocke：終極生存與策略指南 Emerald Kaizo 是有史以來最強大的 Pokémon ROM hacks 之一。雖然嘗試執行 Nuzlocke 會使挑戰成倍增加，但透過縝密的規劃和策略執行，勝利仍然是可以實現的。這本權威指南提供在 Hardcore Nuzlocke 規則下征服 Emerald Kaizo 的必要工具、經過實戰考驗的戰術以及深入的 AI 分析。準備好迎接 Pokémon 精通的終極考驗吧！基本策略收集關

AI Powered Cover Letters：期刊投稿專家指南在現今競爭激烈的學術出版環境中，撰寫一封有效的求職信對您的稿件能否被接受起著舉足輕重的作用。探索像 ChatGPT 之類的人工智能工具如何簡化這項重要任務，幫助您撰寫出精緻、專業的求職信，吸引期刊編輯的注意。我們的全面指南揭示了逐步優化您的投稿包並最大化出版成功率的策略。重點必要的研究準備：彙整所有稿件細節和期刊規格。AI 輔助撰稿：使用 ChatGPT 生成初始求職信模板。個人客製化：完善 AI

美國將因社交媒體法規制裁外國官員美國站出來反對全球數位內容法規美國國務院本周針對歐洲的數位治理政策發出尖銳的外交譴責，顯示在網路平台控制權上的緊張關係正不斷升級。國務卿 Marco Rubio 公布了一項新的簽證限制政策，針對參與美國認為影響美國數位空間的過度審查的外國官員。新簽證限制說明根據週三公佈的政策，美國將拒絕被判定為正在執行影響美國受保護言論的海外內容規定的外國公民入境。Rubio 強調兩項主要的違法行為：

評論 (5)

0/200

提交

BillyWilson

2025-09-30 16:30:37

Meta AI 코딩 테스트 결과는 참 실망스럽네요 😅 다른 경쟁사들보다 확실히 뒤처지는 모습인데... 그래도 아직 초기 단계니까 차차 나아지지 않을까요? 물론 빠르게 따라잡아야 하지만 말이죠!

ChristopherTaylor

2025-08-12 23:00:59

¡Qué decepción con Meta AI! No me esperaba que fallara tan estrepitosamente en las pruebas de programación. Si no puede con lo básico, ¿cómo va a competir con los grandes como Gemini o ChatGPT? 🤔

PaulHarris

2025-08-01 21:47:34

Meta AI's coding skills are lagging behind? Ouch, that’s a rough one! 😅 Llama and Gemini are eating its lunch. Maybe it’s time for Meta to rethink their AI game plan.

MarkGonzalez

2025-07-28 09:20:02

Meta AI's coding skills seem underwhelming compared to Llama and others. 😕 I was hoping for a stronger contender in the AI coding space, but it looks like they’ve got some catching up to do. Anyone else tried using it for coding yet?

TerryRoberts

2025-07-22 09:25:03

This article's take on Meta AI flopping in coding tests is wild! 😅 I mean, with all the hype around AI, you'd think they'd at least nail the basics. Makes me wonder if we're overhyping these models or if Meta's just lagging behind. Anyone else skeptical about AI coding tools now?

頭號新聞

2025頂級AI影片生成器：Pika Labs與其他對比 Gemini 2.5 Pro現在比Claude，GPT-4O更便宜，更便宜 AI配音：真實聲音創作終極指南 Cambium的AI將垃圾木頭變成木材 AI Builder和Power Automate革新文件摘要 Openai增強了AI語音助手以進行更好的聊天如何確保您的數據值得信賴AI集成 NotebookLM在全球範圍內擴展，添加幻燈片並增強了事實檢查對美國數據中心的調整可以解鎖76 GW的新電源容量 Google利用AI暫停了超過3900萬的廣告帳戶，以涉嫌欺詐

精選